SMART — ішкі HDD күйін бағалау технологиясы

22 мая, 2023 Автор: korjeek

Дереккөз: http://www.3dnews.ru/storage/smart/

Кіріспе

Бүгін мен қатты дискіні таңдау критерийлері туралы алдыңғы мақалада айтылған SMART технологиясы туралы аздап сөйлескім келеді, сондай-ақ арнайы бағдарламалармен бетті тексеру және сарқылу кезінде нашар секторлардың пайда болуы туралы мәселені білгім келеді. оларды қайта тағайындау үшін резервтік бет — соңғы мақаладан форумда көтерілген мәселе.

Бастау үшін, әдеттегідей, қысқаша тарихи шегініс. Қатты дискінің (және жалпы алғанда кез келген сақтау құрылғысының) сенімділігі әрқашан ең маңызды болып табылады. Мәселе оның құны емес, өмірдің өзін қалдырып, оны басқа әлемге апаратын ақпараттың құндылығы және қатты дискілер істен шыққан кезде тоқтап қалумен байланысты пайданың жоғалуы, егер бизнес пайдаланушылар туралы айтатын болсақ, ақпарат қалса да. Және мұндай жағымсыз сәттер туралы алдын ала білгіңіз келетіні табиғи нәрсе. Тіпті тұрмыстық деңгейдегі қарапайым пайымдаулар жұмыс істеп тұрған құрылғының күйін бақылау мұндай сәттерді ұсына алады деп болжайды. Бұл бақылауды қатты дискіде қандай да бір жолмен жүзеге асыру ғана қалады.

Бұл тапсырманы алғаш рет көк алпауыттың (IBM, яғни) инженерлері ойластырды. Ал 1995 жылы олар дискінің бірнеше маңызды параметрлерін бақылайтын және жиналған деректер негізінде оның істен шығуын болжауға тырысатын технологияны ұсынды — Болжалды сәтсіздіктерді талдау (PFA). Бұл идеяны кейінірек IntelliSafe технологиясын жасаған Compaq алды. Compaq әзірлеуге Seagate, Quantum және Conner да қатысты. Олар жасаған технология сонымен қатар дискінің бірқатар өнімділік сипаттамаларын бақылап, оларды қолайлы мәнмен салыстырды және қауіп төнген жағдайда хост жүйесіне хабарлайды. Бұл қатты дискілердің сенімділігін арттыруда болмаса, кем дегенде оларды пайдалану кезінде ақпараттың жоғалу қаупін азайтуда алға жасалған үлкен қадам болды. Алғашқы әрекеттер сәтті болды және технологияны одан әрі дамыту қажеттілігін көрсетті. IntelliSafe және PFA технологияларына негізделген S.M.A.R.T (Өзін-өзі бақылауды талдау және есеп беру технологиясы) технологиясы барлық негізгі қатты диск өндірушілердің қауымдастығында пайда болды (айтпақшы, PFA әлі де әртүрлі ішкі жүйелерді бақылау және талдау үшін технологиялар жиынтығы ретінде бар. IBM серверлерінің, соның ішінде дискінің ішкі жүйесін қоса алғанда, және соңғысының мониторингі дәл SMART технологиясына негізделген).

Сонымен, SMART — бұл дискінің күйін ішкі бағалау технологиясы және қатты дискінің ықтимал ақаулығын болжау механизмі. Айта кету керек, технология, негізінен, пайда болатын мәселелерді шешпейді (негізгілері төмендегі суретте көрсетілген), ол тек бұрыннан пайда болған немесе жақын арада күтілетін мәселе туралы ескертеді.

Сонымен қатар, айта кету керек, технология барлық ықтимал проблемаларды болжау мүмкін емес және бұл қисынды: электр қуатының жоғарылауы нәтижесінде электрониканың шығуы, бастар мен беттердің зақымдалуы нәтижесінде әсер және т.б. ешбір технология болжай алмайды. Кез келген сипаттамалардың бірте-бірте нашарлауымен, кез келген құрамдас бөліктердің біркелкі деградациясымен байланысты проблемаларды ғана болжауға болады.

Технологияның даму кезеңдері

SMART технологиясы өзінің дамуында үш кезеңнен өтті. Бірінші ұрпақта аздаған параметрлерді бақылау жүзеге асырылды. Драйвердің тәуелсіз әрекеттері қамтамасыз етілмеді. Іске қосу интерфейстегі командалар арқылы ғана жүзеге асырылды. Стандартты толығымен сипаттайтын спецификация жоқ, сондықтан қандай параметрлерді басқару керек екендігі туралы нақты тағдыр болған жоқ және жоқ. Сонымен қатар, оларды анықтау және олардың төмендеуінің рұқсат етілген деңгейін анықтау толығымен қатты дискілерді өндірушілерге қалдырылды (бұл табиғи, себебі өндіруші өзінің берілген қатты дискімен нені басқару керектігін жақсы біледі, өйткені барлық қатты дискілер дискілер тым әртүрлі). Осы себепті, әдетте, үшінші тарап компаниялары жазған бағдарламалық жасақтама әмбебап болмады және алдағы сәтсіздік туралы қате хабарлауы мүмкін (әртүрлі өндірушілер әртүрлі параметрлердің мәндерін сақтауына байланысты шатасушылық пайда болды. бірдей идентификатор астында). Алдын ала бұзылу жағдайын анықтау жағдайларының саны өте аз екендігіне шағымдар көп болды (адам табиғатының ерекшеліктері: сіз бәрін бірден алғыңыз келеді, әйтеуір бір уақытта дискінің кенеттен істен шығуына шағымдану бұрын-соңды болмаған. SAMRT енгізу). Жағдай көп жағдайда SMART жұмыс істеуі үшін ең төменгі қажетті талаптардың орындалмауымен қиындады (бұл туралы кейінірек айтатын боламыз). Статистика болжамды сәтсіздіктердің саны 20%-дан аз болғанын көрсетеді. Бұл кезеңдегі технология кемелден алыс болды, бірақ бұл алға қарай революциялық қадам болды.

SMART дамуының екінші кезеңі – SMART II туралы көп мәлімет жоқ. Негізінде, біріншідегідей проблемалар байқалды. Инновациялар жұмыс істемеу уақытында және қателерді тіркеу кезінде дискі арқылы автоматты түрде орындалатын бетті фондық тексеру мүмкіндігі болды, бақыланатын параметрлер тізімі кеңейтілді (модель мен өндірушіге байланысты қайтадан). Статистика болжамды сәтсіздіктердің саны 50% жеткенін көрсетеді.

Қазіргі кезең SMART III технологиясымен ұсынылған. Біз оған толығырақ тоқталамыз, оның қалай жұмыс істейтінін, не үшін және не үшін қажет екенін жалпы түрде түсінуге тырысамыз.

Біз SMART дискінің негізгі сипаттамаларын бақылайтынын білеміз. Бұл параметрлер атрибуттар деп аталады. Бақылау үшін қажетті параметрлерді өндіруші анықтайды. Әрбір атрибуттың қандай да бір мәні бар — Мән. Ол әдетте 0-ден 100-ге дейін болады (бірақ ол 200 немесе 255-ке дейін болуы мүмкін), оның мәні белгілі бір атрибуттың оның кейбір анықтамалық мәндеріне қатысты сенімділігі болып табылады (өндіруші анықтайды). Жоғары мән бұл параметрдің өзгермегенін немесе мәнге байланысты оның баяу нашарлауын көрсетеді. Төмен мән жылдам нашарлауды немесе жақын арада мүмкін болатын сәтсіздікті көрсетеді, яғни Value атрибутының мәні неғұрлым жоғары болса, соғұрлым жақсы. Кейбір бақылау бағдарламалары Raw немесе Raw Value мәнін көрсетеді — бұл ішкі пішімдегі атрибуттың мәні (ол әртүрлі модельдер мен әртүрлі өндірушілердің дискілері үшін де әртүрлі), ол дискіде сақталады. Қарапайым пайдаланушы үшін бұл өте ақпаратты емес, одан есептелген Мән мәні үлкен қызығушылық тудырады. Әрбір атрибут үшін өндіруші дискінің ақаусыз жұмысына кепілдік беретін ең төменгі мүмкін мәнді анықтайды — Шекті. Төлсипат мәні Шекті мәннен төмен болса, ақаулық немесе толық ақаулық болуы ықтимал. Тек атрибуттардың сыни және сыни емес екенін қосу ғана қалады. Егер маңызды параметр шекті мәннен асып кетсе, нақты мән сәтсіздікті білдіреді, егер маңызды емес параметр рұқсат етілген мәндерден асып кетсе, бұл ақаулықты көрсетеді, бірақ диск әлі де жұмыс істей алады (бірақ кейбір сипаттамаларда біршама нашарлау болуы мүмкін). : өнімділік, мысалы).

Ең жиі байқалатын сыни сипаттамалар: Raw Read Error Rate – дискіден деректерді оқу кезіндегі қателер жылдамдығы, оның шығу тегі дискінің аппараттық құралдарымен байланысты.

Айналдыру уақыты — дискілер бумасының тынығудан жұмыс жылдамдығына дейін айналу уақыты. Нормаланған мәнді (Мән) есептеу кезінде практикалық уақыт зауытта орнатылған кейбір анықтамалық мәнмен салыстырылады. Айналдыру қайталауды санау мәні = max (Шикі мән 0-ге тең) бар нашарламайтын ең үлкен мән жаман ештеңені білдірмейді. Анықтамадан уақыт айырмашылығы бірқатар себептерге байланысты болуы мүмкін, мысалы, қуат көзі бізді ренжітеді.

Айналдыру қайталау саны — егер бірінші әрекет сәтсіз болса, дискілерді жұмыс жылдамдығына дейін айналдыруға арналған қайталау әрекеттерінің саны. Нөлге тең емес Raw мәні (тиісінше, ең үлкен емес мән) жетектің механикалық бөлігіндегі ақауларды көрсетеді.

Seek Error Rate – бастар блогын орналастыру кезіндегі қате деңгейі. Жоғары Raw мәні ақаулардың болуын көрсетеді, олар зақымдалған серволар, дискілердің шамадан тыс термиялық кеңеюі, орналасу бөлігіндегі механикалық ақаулар, т.б. болуы мүмкін. Тұрақты жоғары мән бәрі жақсы екенін көрсетеді.

Қайта бөлінген сектор саны – секторды қайта құру операцияларының саны. Қазіргі заманғы SMART секторды тұрақтылық үшін жылдам талдауға қабілетті және егер ол сәтсіздік деп танылса, оны қайта тағайындай алады. Төменде біз бұл туралы толығырақ айтатын боламыз.

Критикалық емес, былайша айтқанда, ақпараттық атрибуттардың ішінде әдетте мыналар бақыланады:
Іске қосу/тоқтату саны – шпиндельді іске қосу/тоқтатулардың жалпы саны. Диск қозғалтқышы қосу/өшірудің белгілі бір санына ғана төзе алатынына кепілдік беріледі. Бұл мән Шекті ретінде таңдалады. Айналу жылдамдығы 7200 айн / мин болатын дискілердің алғашқы үлгілері сенімсіз қозғалтқышқа ие болды, олардың аз ғана санын тасымалдай алды және тез істен шықты.
Қуат қосулы сағаттар – қосулы күйде жұмсалған сағаттар саны. Ол үшін шекті мән ретінде сәтсіздіктер арасындағы төлқұжат уақыты (MBTF) таңдалады. Әдетте өте мүмкін емес MBTF мәндерін ескере отырып, параметрдің сыни шекке жетуі екіталай. Бірақ бұл жағдайда да дискінің істен шығуы толығымен міндетті емес.
Drive Power Cycle Count — толық дискіні қосу/өшіру циклдерінің саны. Осы және алдыңғы атрибутты, мысалы, диск сатып алудан бұрын қанша пайдаланылғанын бағалау үшін пайдалануға болады.
Температура — қарапайым және түсінікті. Мұнда кірістірілген температура сенсорының көрсеткіштері сақталады. Температура дискінің қызмет ету мерзіміне үлкен әсер етеді (тіпті ол рұқсат етілген шектерде болса да).
Ағымдағы күтудегі секторлар саны — ауыстыруға үміткер секторлар саны осында сақталады. Олар әлі нашар деп танылған жоқ, бірақ оларды оқу күдікті немесе тұрақсыз секторлар деп аталатын тұрақты секторды оқудан ерекшеленеді.
Түзетілмеген сектор саны – секторға кіру кезінде түзетілмеген қателер саны. Ықтимал себептер механикалық ақаулар немесе бетінің зақымдалуы болуы мүмкін.
UDMA CRC Error Rate – деректерді сыртқы интерфейс арқылы жіберу кезінде пайда болатын қателер саны. Төмен сапалы кабельдер, қалыпты емес жұмыс режимдері себеп болуы мүмкін.
Жазу қатесінің жылдамдығы — дискіге жазу кезінде пайда болатын қателердің жылдамдығын көрсетеді. Ол беттің сапасы мен жетектің механикасының көрсеткіші ретінде қызмет ете алады.

Барлық қателер мен орын алған параметр өзгерістері SMART журналдарында жазылады. Бұл мүмкіндік SMART II-де пайда болды. Журналдардың барлық параметрлері — тағайындалуы, өлшемі, олардың саны қатты дискінің өндірушісімен анықталады. Қазіргі уақытта бізді олардың бар-жоғы қызықтырады. Егжей-тегжейсіз. Журналдарда сақталған ақпарат күйді талдау және болжамдар жасау үшін пайдаланылады.

Егер сіз егжей-тегжейлі айтпасаңыз, SMART жұмысы қарапайым — дискінің жұмысы кезінде орын алған барлық қателер мен күдікті құбылыстар жай ғана бақыланады, олар сәйкес атрибуттарда көрсетіледі. Сонымен қатар, SMART II-ден бастап, көптеген дискілерде өзін-өзі диагностикалау функциялары бар. SMART сынақтарын екі режимде, офлайн режимінде іске қосуға болады — сынақ іс жүзінде фондық режимде орындалады, өйткені диск кез келген уақытта пәрменді қабылдауға және орындауға дайын және эксклюзивті, команда қабылданған кезде сынақ орындау аяқталады.

Өзін-өзі диагностикалау сынақтарының үш түрі құжатталған: фондық деректерді жинау (Off-line жинау), қысқартылған тест (Қысқа өзін-өзі тексеру), кеңейтілген тест (Extended Self-test). Соңғы екеуі фондық режимде де, эксклюзивті режимдерде де жұмыс істей алады. Оларға енгізілген сынақтар жиынтығы стандартталмаған.

Олардың орындалу ұзақтығы секундтардан минуттар мен сағаттарға дейін болуы мүмкін. Егер сіз кенеттен дискіге қол жеткізе алмасаңыз және бір уақытта ол жұмыс жүктемесі кезінде дыбыстар шығарса, ол жай ғана интроспекция жасап жатқан сияқты. Осындай сынақтардың нәтижесінде жиналған барлық деректер журналдар мен атрибуттарда сақталады.

О, бұл нашар секторлар …

Енді барлығын бастаған нашар секторлар мәселесіне қайта оралайық. SMART III пайдаланушы үшін BAD секторларын мөлдір қайта тағайындауға мүмкіндік беретін мүмкіндігі бар. Механизм өте қарапайым жұмыс істейді, секторды тұрақсыз оқу немесе оны оқудағы қате, SMART оны тұрақсыздардың тізіміне енгізеді және олардың есептегішін арттырады (ағымдағы күтудегі сектор саны). Егер сектор қайталанатын кіру кезінде қиындықсыз оқылса, ол осы тізімнен шығарылады. Егер жоқ болса, онда мүмкіндік берілгенде — дискіге қол жеткізу болмаған кезде, диск бетті, ең алдымен күдікті секторларды тәуелсіз тексеруді бастайды. Егер сектор нашар деп танылса, онда ол сақтық көшірме бетінен секторға қайта тағайындалады (тиісінше, RSC артады). Мұндай фондық қайта құру қазіргі заманғы қатты дискілерде қызмет бағдарламаларымен бетті тексеру кезінде нашар секторлар ешқашан көрінбейтініне әкеледі. Сонымен қатар нашар секторлардың көп санымен оларды қайта тағайындау шексіз жалғаса алмайды. Бірінші шектегіш анық — бұл резервтік беттің көлемі. Менің ойымда осы жағдай болды. Екіншісі соншалықты айқын емес — қазіргі заманғы қатты дискілерде екі ақаулық тізімі бар P-тізімі (Бастапқы, зауыттық) және G-тізімі (Өсу, тікелей жұмыс кезінде қалыптасады). Ал қайта тағайындаулардың көптігімен G-тізімде жаңа тағайындауды жазуға орын жоқ болып шығуы мүмкін. Бұл жағдайды SMART жүйесінде қайта салыстырылған секторлардың жоғары жылдамдығымен анықтауға болады. Бұл жағдайда бәрі жоғалған жоқ, бірақ бұл мақаланың ауқымынан тыс.

Сонымен, SMART деректерін пайдаланып, тіпті дискіні шеберханаға апармай-ақ, оған не болып жатқанын дәл айта аласыз. SMART үшін әртүрлі қосымша технологиялар бар, олар дискінің күйін одан да дәлірек және оның істен шығу себебін сенімді түрде анықтауға мүмкіндік береді. Біз бұл технологиялар туралы бөлек мақалада айтатын боламыз.

SMART көмегімен дискіні сатып алу дискімен туындаған барлық ақауларды білу үшін жеткіліксіз екенін білуіңіз керек. Диск, әрине, сыртқы көмексіз оның жағдайын бақылай алады, бірақ ол жақындап келе жатқан қауіп жағдайында өзін ескерте алмайды. Сізге SMART деректеріне негізделген ескерту беруге мүмкіндік беретін нәрсе қажет. (әдеттегі тізбек төмендегі суретте көрсетілген).
Сонымен қатар, сәйкес опция қосылған кезде жүктелген кезде SMART дискілерінің күйін тексеретін BIOS мүмкіндігі бар. Ал егер сіз дискінің күйін үнемі бақылап отырғыңыз келсе, қандай да бір бақылау бағдарламасын пайдалануыңыз керек. Содан кейін сіз ақпаратты егжей-тегжейлі және ыңғайлы түрде көре аласыз.

DOS жүйесінде жұмыс істейтін HDD жылдамдығынан SmartMonitor
Windows жүйесінен жұмыс істейтін SIGuiardian

Сондай-ақ бұл бағдарламалар туралы жеке мақалада айтатын боламыз. Қатты дискілерді SMART жүйесімен жұмыс істегенде бастапқыда қажетті талаптар орындалмайтынын айтқанымда осыны меңзедім.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Жобаңызды бүгіннен бастаңыз
Бізге Telegram арқылы хабарласыңыз. Сұрақ қойып, жылдам жауап алыңыз.
немесе
Telegramға
жазыңыз
Түймені басу арқылы сіз жеке деректерді өңдеуге келісесіз және құпиялылық саясатымен келісесіз.