一、SMART概述
硬盤的故障一般分為兩種:可預(yù)測(cè)的(predictable)和不可預(yù)測(cè)的(unpredictable)。后者偶而會(huì)發(fā)生,也沒(méi)有辦法去預(yù)防它,例如芯片突然失效,機(jī)械撞擊等。但像電機(jī)軸承磨損、盤片磁介質(zhì)性能下降等都屬于可預(yù)測(cè)的情況,可以在在幾天甚至幾星期前就發(fā)現(xiàn)這種不正常的現(xiàn)象。如果發(fā)生這種問(wèn)題,SMART功能會(huì)在開(kāi)機(jī)時(shí)響起警報(bào),至少讓使用者有足夠的時(shí)間把重要資料轉(zhuǎn)移到其它儲(chǔ)存設(shè)備上。
最早期的硬盤監(jiān)控技術(shù)起源于1992年,IBM在AS/400計(jì)算機(jī)的IBM 0662 SCSI 2代硬盤驅(qū)動(dòng)器中使用了后來(lái)被命名為Predictive Failure Analysis(故障預(yù)警分析技術(shù))的監(jiān)控技術(shù),它是通過(guò)在固件中測(cè)量幾個(gè)重要的硬盤安全參數(shù)和評(píng)估他們的情況,然后由監(jiān)控軟件得出兩種結(jié)果:“硬盤安全”或“不久后會(huì)發(fā)生故障”。
不久,當(dāng)時(shí)的微機(jī)制造商康柏和硬盤制造商希捷、昆騰以及康納共同提出了名為IntelliSafe的類似技術(shù)。通過(guò)該技術(shù),硬盤可以測(cè)量自身的的健康指標(biāo)并將參量值傳送給操作系統(tǒng)和用戶的監(jiān)控軟件中,每個(gè)硬盤生產(chǎn)商有權(quán)決定哪些指標(biāo)需要被監(jiān)控以及設(shè)定它們的安全閾值。
1995年,康柏公司將該技術(shù)方案提交到Small Form Factor(SFF)委員會(huì)進(jìn)行標(biāo)準(zhǔn)化,該方案得到IBM、希捷、昆騰、康納和西部數(shù)據(jù)的支持,1996年6月進(jìn)行了1.3版的修正,正式更名為S.M.A.R.T.(Self-Monitoring Analysis And Reporting Technology),全稱就是“自我檢測(cè)分析與報(bào)告技術(shù)”,成為一種自動(dòng)監(jiān)控硬盤驅(qū)動(dòng)器完好狀況和報(bào)告潛在問(wèn)題的技術(shù)標(biāo)準(zhǔn)。
作為行業(yè)規(guī)范,SMART規(guī)定了硬盤制造廠商應(yīng)遵循的標(biāo)準(zhǔn),滿足SMART標(biāo)準(zhǔn)的條件主要包括:
1)在設(shè)備制造期間完成SMART需要的各項(xiàng)參數(shù)、屬性的設(shè)定;
2)在特定系統(tǒng)平臺(tái)下,能夠正常使用SMART;通過(guò)BIOS檢測(cè),能夠識(shí)別設(shè)備是否支持SMART并可顯示相關(guān)信息,而且能辨別有效和失效的SMART信息;
3)允許用戶自由開(kāi)啟和關(guān)閉SMART功能;
4)在用戶使用過(guò)程中,能提供SMART的各項(xiàng)有效信息,確定設(shè)備的工作狀態(tài),并能發(fā)出相應(yīng)的修正指令或警告。在硬盤及操作系統(tǒng)都支持SMART技術(shù)并且開(kāi)啟的情況下,若硬盤狀態(tài)不良,SMART技術(shù)能夠在屏幕上顯示英文警告信息:“WARNING:IMMEDIATLY BACKUP YOUR DATA AND REPLACE YOUR HARD DISK DRIVE,A FAILURE MAY BE IMMINENT.”(警告:立刻備份你的數(shù)據(jù)并更換硬盤,硬盤可能失效。)
SMART功能不斷從硬盤上的各個(gè)傳感器收集信息,并把信息保存在硬盤的系統(tǒng)保留區(qū)(service area)內(nèi),這個(gè)區(qū)域一般位于硬盤0物理面的最前面幾十個(gè)物理磁道,由廠商寫入相關(guān)的內(nèi)部管理程序。這里除了SMART信息表外還包括低級(jí)格式化程序、加密解密程序、自監(jiān)控程序、自動(dòng)修復(fù)程序等。用戶使用的監(jiān)測(cè)軟件通過(guò)名為“SMART Return Status”的命令(命令代碼為:B0h)對(duì)SMART信息進(jìn)行讀取,且不允許最終用戶對(duì)信息進(jìn)行修改。
二、SMART的ID代碼
硬盤SMART檢測(cè)的ID代碼以兩位十六進(jìn)制數(shù)表示(括號(hào)里對(duì)應(yīng)的是十進(jìn)制數(shù))硬盤的各項(xiàng)檢測(cè)參數(shù)。目前,各硬盤制造商的絕大部分SMART ID代碼所代表的參數(shù)含義是一致的,但廠商也可以根據(jù)需要使用不同的ID代碼,或者根據(jù)檢測(cè)項(xiàng)目的多少增減ID代碼。一般來(lái)說(shuō),以下這些檢測(cè)項(xiàng)是必需的:
01(001) 底層數(shù)據(jù)讀取錯(cuò)誤率 Raw Read Error Rate
04(004) 啟動(dòng)/停止計(jì)數(shù) Start/Stop Count
05(005) 重映射扇區(qū)數(shù) Relocated Sector Count
09(009) 通電時(shí)間累計(jì) Power-On Time Count (POH)
0A(010) 主軸起旋重試次數(shù)(即硬盤主軸電機(jī)啟動(dòng)重試次數(shù)) Spin up Retry Count
0B(011) 磁盤校準(zhǔn)重試次數(shù) Calibration Retry Count
0C(012) 磁盤通電次數(shù) Power Cycle Count
C2(194) 溫度 Temperature
C7(199) ULTRA DMA奇偶校驗(yàn)錯(cuò)誤率 ULTRA ATA CRC Error Rate
C8(200) 寫錯(cuò)誤率 Write Error Rate
三、SMART的描述(Description)
描述,即某一檢測(cè)項(xiàng)目的名稱,是ID代碼的文字解釋。對(duì)用戶而言,不僅要了解描述的含義,重要的是要了解各參數(shù)的值如“臨界值”、“最差值”的定義,“當(dāng)前值”與“數(shù)據(jù)值”的區(qū)別等,才能對(duì)自己的硬盤狀態(tài)有一個(gè)基本了解。
四、SMART的值
1、臨界值(Threshold)
臨界值是硬盤廠商指定的表示某一項(xiàng)目可靠性的門限值,也稱閾值,它通過(guò)特定公式計(jì)算而得。如果某個(gè)參數(shù)的當(dāng)前值接近了臨界值,就意味著硬盤將變得不可靠,可能導(dǎo)致數(shù)據(jù)丟失或者硬盤故障。由于臨界值是硬盤廠商根據(jù)自己產(chǎn)品特性而確定的,因此用廠商提供的專用檢測(cè)軟件往往會(huì)跟Windows下檢測(cè)軟件的檢測(cè)結(jié)果有較大出入。
以參數(shù)Raw Read Error Rate(底層數(shù)據(jù)讀取錯(cuò)誤率)為例:某型硬盤對(duì)該參數(shù)的計(jì)算公式為“10×log10(主機(jī)和硬盤之間所傳輸數(shù)據(jù)的扇區(qū)數(shù))×512×8/重讀的扇區(qū)數(shù)”。其中“512×8”是把扇區(qū)數(shù)轉(zhuǎn)化為所傳輸?shù)臄?shù)據(jù)位(bits),這個(gè)值只在所傳輸?shù)臄?shù)據(jù)位處于1010~1012范圍時(shí)才作計(jì)算,而當(dāng)Windows系統(tǒng)啟動(dòng)后,主機(jī)和硬盤之間所傳輸?shù)臄?shù)據(jù)扇區(qū)大于或等于1012時(shí),此值將重新復(fù)位,所以有些值在不同的操作環(huán)境、不同檢測(cè)程序下時(shí)會(huì)有較大的波動(dòng)。
2、當(dāng)前值(Normalized value)
當(dāng)前值是各ID項(xiàng)在硬盤運(yùn)行時(shí)根據(jù)實(shí)測(cè)數(shù)據(jù)通過(guò)公式計(jì)算的結(jié)果,計(jì)算公式由硬盤廠家自定。
硬盤出廠時(shí)各ID項(xiàng)目都有一個(gè)預(yù)設(shè)的最大正常值,也即出廠值,這個(gè)預(yù)設(shè)的依據(jù)及計(jì)算方法為硬盤廠家保密,不同型號(hào)的硬盤都不同,最大正常值通常為100或200或253,新硬盤剛開(kāi)始使用時(shí)顯示的當(dāng)前值可以認(rèn)為是預(yù)設(shè)的最大正常值(有些ID項(xiàng)如溫度等除外)。隨著使用損耗或出現(xiàn)錯(cuò)誤,當(dāng)前值會(huì)根據(jù)實(shí)測(cè)數(shù)據(jù)而不斷刷新并逐漸減小。因此,當(dāng)前值接近臨界值就意味著硬盤壽命的減少,發(fā)生故障的可能性增大,所以當(dāng)前值也是判定硬盤健康狀態(tài)或推測(cè)壽命的依據(jù)之一。
3、最差值(Worst)
最差值是硬盤運(yùn)行時(shí)各ID項(xiàng)曾出現(xiàn)過(guò)的最大的非正常值。
最差值是對(duì)硬盤運(yùn)行中某項(xiàng)數(shù)據(jù)變劣的峰值統(tǒng)計(jì),該數(shù)值也會(huì)不斷刷新。通常,最差值與當(dāng)前值是相等的,如果最差值出現(xiàn)較大的波動(dòng)(小于當(dāng)前值),表明硬盤曾出現(xiàn)錯(cuò)誤或曾經(jīng)歷過(guò)惡劣的工作環(huán)境(如溫度)。
4、數(shù)據(jù)值(Data或Raw value)
數(shù)據(jù)值是硬盤運(yùn)行時(shí)各項(xiàng)參數(shù)的實(shí)測(cè)值,大部分SMART工具以十進(jìn)制顯示數(shù)據(jù)。
數(shù)據(jù)值代表的意義隨參數(shù)而定,大致可以分為三類:
1)數(shù)據(jù)值并不直接反映硬盤狀態(tài),必須經(jīng)過(guò)硬盤內(nèi)置的計(jì)算公式換算成當(dāng)前值才能得出結(jié)果;
2)數(shù)據(jù)值是直接累計(jì)的,如Start/Stop Count(啟動(dòng)/停止計(jì)數(shù))的數(shù)據(jù)是50,即表示該硬盤從出廠到現(xiàn)在累計(jì)啟停了50次;
3)有些參數(shù)的數(shù)據(jù)是即時(shí)數(shù),如Temperature(溫度)的數(shù)據(jù)值是44,表示硬盤的當(dāng)前溫度是44℃。
因此,有些參數(shù)直接查看數(shù)據(jù)也能大致了解硬盤目前的工作狀態(tài)。
五、狀態(tài)(Status)
硬盤的每項(xiàng)SMART信息中都有一個(gè)臨界值(閾值),不同硬盤的臨界值是不同的,SMART針對(duì)各項(xiàng)的當(dāng)前值、最差值和臨界值的比較結(jié)果以及數(shù)據(jù)值進(jìn)行分析后,提供硬盤當(dāng)前的評(píng)估狀態(tài),也是我們直觀判斷硬盤健康狀態(tài)的重要信息。根據(jù)SMART的規(guī)定,狀態(tài)一般有正常、警告、故障或錯(cuò)誤三種狀態(tài)。
SMART判定這三個(gè)狀態(tài)與SMART的 Pre-failure/advisory BIT(預(yù)測(cè)錯(cuò)誤/發(fā)現(xiàn)位)參數(shù)的賦值密切相關(guān),當(dāng)Pre-failure/advisory BIT=0,并且當(dāng)前值、最差值遠(yuǎn)大于臨界值的情況下,為正常標(biāo)志。當(dāng)Pre-failure/advisory BIT=0,并且當(dāng)前值、最差值大于但接近臨界值時(shí),為警告標(biāo)志;當(dāng)Pre-failure/advisory BIT=1,并且當(dāng)前值、最差值小于臨界值時(shí),為故障或錯(cuò)誤標(biāo)志。
六、SMART參數(shù)詳解
一般情況下,用戶只要觀察當(dāng)前值、最差值和臨界值的關(guān)系,并注意狀態(tài)提示信息即可大致了解硬盤的健康狀況。下面簡(jiǎn)單介紹各參數(shù)的含義,以紅色標(biāo)出的項(xiàng)目是壽命關(guān)鍵項(xiàng),藍(lán)色為固態(tài)硬盤(SSD)特有的項(xiàng)目。
在基于閃存的固態(tài)硬盤中,存儲(chǔ)單元分為兩類:SLC(Single Layer Cell,單層單元)和MLC(Multi-Level Cell,多層單元)。SLC成本高、容量小、但讀寫速度快,可靠性高,擦寫次數(shù)可高達(dá)100000次,比MLC高10倍。而MLC雖容量大、成本低,但其性能大幅落后于SLC。為了保證MLC的壽命,控制芯片還要有智能磨損平衡技術(shù)算法,使每個(gè)存儲(chǔ)單元的寫入次數(shù)可以平均分?jǐn),以達(dá)到100萬(wàn)小時(shí)的平均無(wú)故障時(shí)間。因此固態(tài)硬盤有許多SMART參數(shù)是機(jī)械硬盤所沒(méi)有的,如存儲(chǔ)單元的擦寫次數(shù)、備用塊統(tǒng)計(jì)等等,這些新增項(xiàng)大都由廠家自定義,有些尚無(wú)詳細(xì)的解釋,有些解釋也未必準(zhǔn)確,此處也只是僅供參考。下面凡未注明廠商的固態(tài)硬盤特有的項(xiàng)均為SandForce主控芯片特有的,其它廠商各自單獨(dú)注明。
01(001)底層數(shù)據(jù)讀取錯(cuò)誤率 Raw Read Error Rate
數(shù)據(jù)為0或任意值,當(dāng)前值應(yīng)遠(yuǎn)大于與臨界值。
底層數(shù)據(jù)讀取錯(cuò)誤率是磁頭從磁盤表面讀取數(shù)據(jù)時(shí)出現(xiàn)的錯(cuò)誤,對(duì)某些硬盤來(lái)說(shuō),大于0的數(shù)據(jù)表明磁盤表面或者讀寫磁頭發(fā)生問(wèn)題,如介質(zhì)損傷、磁頭污染、磁頭共振等等。不過(guò)對(duì)希捷硬盤來(lái)說(shuō),許多硬盤的這一項(xiàng)會(huì)有很大的數(shù)據(jù)量,這不代表有任何問(wèn)題,主要是看當(dāng)前值下降的程度。
在固態(tài)硬盤中,此項(xiàng)的數(shù)據(jù)值包含了可校正的錯(cuò)誤與不可校正的RAISE錯(cuò)誤(UECC+URAISE)。
注:RAISE(Redundant Array of Independent Silicon Elements)意為獨(dú)立硅元素冗余陣列,是固態(tài)硬盤特有的一種冗余恢復(fù)技術(shù),保證內(nèi)部有類似RAID陣列的數(shù)據(jù)安全性。
02(002)磁盤讀寫通量性能 Throughput Performance
此參數(shù)表示硬盤的讀寫通量性能,數(shù)據(jù)值越大越好。當(dāng)前值如果偏低或趨近臨界值,表示硬盤存在嚴(yán)重的問(wèn)題,但現(xiàn)在的硬盤通常顯示數(shù)據(jù)值為0或根本不顯示此項(xiàng),一般在進(jìn)行了人工脫機(jī)SMART測(cè)試后才會(huì)有數(shù)據(jù)量。
03(003)主軸起旋時(shí)間 Spin Up Time
主軸起旋時(shí)間就是主軸電機(jī)從啟動(dòng)至達(dá)到額定轉(zhuǎn)速所用的時(shí)間,數(shù)據(jù)值直接顯示時(shí)間,單位為毫秒或者秒,因此數(shù)據(jù)值越小越好。不過(guò)對(duì)于正常硬盤來(lái)說(shuō),這一項(xiàng)僅僅是一個(gè)參考值,硬盤每次的啟動(dòng)時(shí)間都不相同,某次啟動(dòng)的稍慢些也不表示就有問(wèn)題。
硬盤的主軸電機(jī)從啟動(dòng)至達(dá)到額定轉(zhuǎn)速大致需要4秒~15秒左右,過(guò)長(zhǎng)的啟動(dòng)時(shí)間說(shuō)明電機(jī)驅(qū)動(dòng)電路或者軸承機(jī)構(gòu)有問(wèn)題。旦這一參數(shù)的數(shù)據(jù)值在某些型號(hào)的硬盤上總是為0,這就要看當(dāng)前值和最差值來(lái)判斷了。
對(duì)于固態(tài)硬盤來(lái)說(shuō),所有的數(shù)據(jù)都是保存在半導(dǎo)體集成電路中,沒(méi)有主軸電機(jī),所以這項(xiàng)沒(méi)有意義,數(shù)據(jù)固定為0,當(dāng)前值固定為100。
04(004)啟停計(jì)數(shù) Start/Stop Count
這一參數(shù)的數(shù)據(jù)是累計(jì)值,表示硬盤主軸電機(jī)啟動(dòng)/停止的次數(shù),新硬盤通常只有幾次,以后會(huì)逐漸增加。系統(tǒng)的某些功能如空閑時(shí)關(guān)閉硬盤等會(huì)使硬盤啟動(dòng)/停止的次數(shù)大為增加,在排除定時(shí)功能的影響下,過(guò)高的啟動(dòng)/停止次數(shù)(遠(yuǎn)大于通電次數(shù)0C)暗示硬盤電機(jī)及其驅(qū)動(dòng)電路可能有問(wèn)題。
這個(gè)參數(shù)的當(dāng)前值是依據(jù)某種公式計(jì)算的結(jié)果,例如對(duì)希捷某硬盤來(lái)說(shuō)臨界值為20,當(dāng)前值是通過(guò)公式“100-(啟停計(jì)數(shù)/1024)”計(jì)算得出的。若新硬盤的啟停計(jì)數(shù)為0,當(dāng)前值為100-(0/1024)=100,隨著啟停次數(shù)的增加,該值不斷下降,當(dāng)啟停次數(shù)達(dá)到81920次時(shí),當(dāng)前值為100-(81920/1024)=20,已達(dá)到臨界值,表示從啟停次數(shù)來(lái)看,該硬盤已達(dá)設(shè)計(jì)壽命,當(dāng)然這只是個(gè)壽命參考值,并不具有確定的指標(biāo)性。
這一項(xiàng)對(duì)于固態(tài)硬盤同樣沒(méi)有意義,數(shù)據(jù)固定為0,當(dāng)前值固定為100。
05(005)重映射扇區(qū)計(jì)數(shù) Reallocated Sectors Count/ 退役塊計(jì)數(shù) Retired Block Count
數(shù)據(jù)應(yīng)為0,當(dāng)前值應(yīng)遠(yuǎn)大于臨界值。
當(dāng)硬盤的某扇區(qū)持續(xù)出現(xiàn)讀/寫/校驗(yàn)錯(cuò)誤時(shí),硬盤固件程序會(huì)將這個(gè)扇區(qū)的物理地址加入缺陷表(G-list),將該地址重新定向到預(yù)先保留的備用扇區(qū)并將其中的數(shù)據(jù)一并轉(zhuǎn)移,這就稱為重映射。執(zhí)行重映射操作后的硬盤在Windows常規(guī)檢測(cè)中是無(wú)法發(fā)現(xiàn)不良扇區(qū)的,因其地址已被指向備用扇區(qū),這等于屏蔽了不良扇區(qū)。
這項(xiàng)參數(shù)的數(shù)據(jù)值直接表示已經(jīng)被重映射扇區(qū)的數(shù)量,當(dāng)前值則隨著數(shù)據(jù)值的增加而持續(xù)下降。當(dāng)發(fā)現(xiàn)此項(xiàng)的數(shù)據(jù)值不為零時(shí),要密切注意其發(fā)展趨勢(shì),若能長(zhǎng)期保持穩(wěn)定,則硬盤還可以正常運(yùn)行;若數(shù)據(jù)值不斷上升,說(shuō)明不良扇區(qū)不斷增加,硬盤已處于不穩(wěn)定狀態(tài),應(yīng)當(dāng)考慮更換了。如果當(dāng)前值接近或已到達(dá)臨界值(此時(shí)的數(shù)據(jù)值并不一定很大,因?yàn)椴煌脖P保留的備用扇區(qū)數(shù)并不相同),表示缺陷表已滿或備用扇區(qū)已用盡,已經(jīng)失去了重映射功能,再出現(xiàn)不良扇區(qū)就會(huì)顯現(xiàn)出來(lái)并直接導(dǎo)致數(shù)據(jù)丟失。
這一項(xiàng)不僅是硬盤的壽命關(guān)鍵參數(shù),而且重映射扇區(qū)的數(shù)量也直接影響硬盤的性能,例如某些硬盤會(huì)出現(xiàn)數(shù)據(jù)量很大,但當(dāng)前值下降不明顯的情況,這種硬盤盡管還可正常運(yùn)行,但也不宜繼續(xù)使用。因?yàn)閭溆蒙葏^(qū)都是位于磁盤尾部(靠近盤片軸心處),大量的使用備用扇區(qū)會(huì)使尋道時(shí)間增加,硬盤性能明顯下降。
這個(gè)參數(shù)在機(jī)械硬盤上是非常敏感的,而對(duì)于固態(tài)硬盤來(lái)說(shuō)同樣具有重要意義。閃存的壽命是正態(tài)分布的,例如說(shuō)MLC能寫入一萬(wàn)次以上,實(shí)際上說(shuō)的是寫入一萬(wàn)次之前不會(huì)發(fā)生“批量損壞”,但某些單元可能寫入幾十次就損壞了。換言之,機(jī)械硬盤的盤片不會(huì)因讀寫而損壞,出現(xiàn)不良扇區(qū)大多與工藝質(zhì)量相關(guān),而閃存的讀寫次數(shù)則是有限的,因而損壞是正常的。所以固態(tài)硬盤在制造時(shí)也保留了一定的空間,當(dāng)某個(gè)存儲(chǔ)單元出現(xiàn)問(wèn)題后即把損壞的部分隔離,用好的部分來(lái)頂替。這一替換方法和機(jī)械硬盤的扇區(qū)重映射是一個(gè)道理,只不過(guò)機(jī)械硬盤正常時(shí)極少有重映射操作,而對(duì)于固態(tài)硬盤是經(jīng)常性的。
在固態(tài)硬盤中這一項(xiàng)的數(shù)據(jù)會(huì)隨著使用而不斷增長(zhǎng),只要增長(zhǎng)的速度保持穩(wěn)定就可以。通常情況下,數(shù)據(jù)值=100-(100×被替換塊/必需塊總數(shù)),因此也可以估算出硬盤的剩余壽命。
Intel固態(tài)硬盤型號(hào)的第十二個(gè)字母表示了兩種規(guī)格,該字母為1表示第一代的50納米技術(shù)的SSD,為2表示第二代的34納米技術(shù)的SSD,如SSDSA2M160G2GN就表示是34nm的SSD。所以參數(shù)的查看也有兩種情況:
50nm的SSD(一代)要看當(dāng)前值。這個(gè)值初始是100,當(dāng)出現(xiàn)替換塊的時(shí)候這個(gè)值并不會(huì)立即變化,一直到已替換四個(gè)塊時(shí)這個(gè)值變?yōu)?,之后每增加四個(gè)塊當(dāng)前值就+1。也就是100對(duì)應(yīng)0~3個(gè)塊,1對(duì)應(yīng)4~7個(gè)塊,2對(duì)應(yīng)8~11個(gè)塊……
34nm的SSD(二代)直接查看數(shù)據(jù)值,數(shù)據(jù)值直接表示有多少個(gè)被替換的塊。
06(006)讀取通道余量 Read Channel Margin
這一項(xiàng)功能不明,現(xiàn)在的硬盤也不顯示這一項(xiàng)。
07(007)尋道錯(cuò)誤率 Seek Error Rate
數(shù)據(jù)應(yīng)為0,當(dāng)前值應(yīng)遠(yuǎn)大于與臨界值。
這一項(xiàng)表示磁頭尋道時(shí)的錯(cuò)誤率,有眾多因素可導(dǎo)致尋道錯(cuò)誤率上升,如磁頭組件的機(jī)械系統(tǒng)、伺服電路有局部問(wèn)題,盤片表面介質(zhì)不良,硬盤溫度過(guò)高等等。
通常此項(xiàng)的數(shù)據(jù)應(yīng)為0,但對(duì)希捷硬盤來(lái)說(shuō),即使是新硬盤,這一項(xiàng)也可能有很大的數(shù)據(jù)量,這不代表有任何問(wèn)題,還是要看當(dāng)前值是否下降。
08(008)尋道性能 Seek Time Performance
此項(xiàng)表示硬盤尋道操作的平均性能(尋道速度),通常與前一項(xiàng)(尋道錯(cuò)誤率)相關(guān)聯(lián)。當(dāng)前值持續(xù)下降標(biāo)志著磁頭組件、尋道電機(jī)或伺服電路出現(xiàn)問(wèn)題,但現(xiàn)在許多硬盤并不顯示這一項(xiàng)。
09(009)通電時(shí)間累計(jì) Power-On Time Count (POH)
這個(gè)參數(shù)的含義一目了然,表示硬盤通電的時(shí)間,數(shù)據(jù)值直接累計(jì)了設(shè)備通電的時(shí)長(zhǎng),新硬盤當(dāng)然應(yīng)該接近0,但不同硬盤的計(jì)數(shù)單位有所不同,有以小時(shí)計(jì)數(shù)的,也有以分、秒甚至30秒為單位的,這由磁盤制造商來(lái)定義。
這一參數(shù)的臨界值通常為0,當(dāng)前值隨著硬盤通電時(shí)間增加會(huì)逐漸下降,接近臨界值表明硬盤已接近預(yù)計(jì)的設(shè)計(jì)壽命,當(dāng)然這并不表明硬盤將出現(xiàn)故障或立即報(bào)廢。參考磁盤制造商給出的該型號(hào)硬盤的MTBF(平均無(wú)故障時(shí)間)值,可以大致估計(jì)剩余壽命或故障概率。
對(duì)于固態(tài)硬盤,要注意“設(shè)備優(yōu)先電源管理功能(device initiated power management,DIPM)”會(huì)影響這個(gè)統(tǒng)計(jì):如果啟用了DIPM,持續(xù)通電計(jì)數(shù)里就不包括睡眠時(shí)間;如果關(guān)閉了DIPM功能,那么活動(dòng)、空閑和睡眠三種狀態(tài)的時(shí)間都會(huì)被統(tǒng)計(jì)在內(nèi)。
0A(010)主軸起旋重試次數(shù) Spin up Retry Count
數(shù)據(jù)應(yīng)為0,當(dāng)前值應(yīng)大于臨界值。
主軸起旋重試次數(shù)的數(shù)據(jù)值就是主軸電機(jī)嘗試重新啟動(dòng)的計(jì)數(shù),即主軸電機(jī)啟動(dòng)后在規(guī)定的時(shí)間里未能成功達(dá)到額定轉(zhuǎn)速而嘗試再次啟動(dòng)的次數(shù)。數(shù)據(jù)量的增加表示電機(jī)驅(qū)動(dòng)電路或是機(jī)械子系統(tǒng)出現(xiàn)問(wèn)題,整機(jī)供電不足也會(huì)導(dǎo)致這一問(wèn)題。
0B(011)磁頭校準(zhǔn)重試計(jì)數(shù) Calibration Retry Count
數(shù)據(jù)應(yīng)為0,當(dāng)前值應(yīng)遠(yuǎn)大于與臨界值。
硬盤在溫度發(fā)生變化時(shí),機(jī)械部件(特別是盤片)會(huì)因熱脹冷縮出現(xiàn)形變,因此需要執(zhí)行磁頭校準(zhǔn)操作消除誤差,有的硬盤還內(nèi)置了磁頭定時(shí)校準(zhǔn)功能。這一項(xiàng)記錄了需要再次校準(zhǔn)(通常因上次校準(zhǔn)失。┑拇螖(shù)。
這一項(xiàng)的數(shù)據(jù)量增加,表示電機(jī)驅(qū)動(dòng)電路或是機(jī)械子系統(tǒng)出現(xiàn)問(wèn)題,但有些型號(hào)的新硬盤也有一定的數(shù)據(jù)量,并不表示有問(wèn)題,還要看當(dāng)前值和最差值。
0C(012)通電周期計(jì)數(shù) Power Cycle Count
通電周期計(jì)數(shù)的數(shù)據(jù)值表示了硬盤通電/斷電的次數(shù),即電源開(kāi)關(guān)次數(shù)的累計(jì),新硬盤通常只有幾次。
這一項(xiàng)與啟停計(jì)數(shù)(04)是有區(qū)別的,一般來(lái)說(shuō),硬盤通電/斷電意味著計(jì)算機(jī)的開(kāi)機(jī)與關(guān)機(jī),所以經(jīng)歷一次開(kāi)關(guān)機(jī)數(shù)據(jù)才會(huì)加1;而啟停計(jì)數(shù)(04)表示硬盤主軸電機(jī)的啟動(dòng)/停止(硬盤在運(yùn)行時(shí)可能多次啟停,如系統(tǒng)進(jìn)入休眠或被設(shè)置為空閑多少時(shí)間而關(guān)閉)。所以大多情況下這個(gè)通電/斷電的次數(shù)會(huì)小于啟停計(jì)數(shù)(04)的次數(shù)。
通常,硬盤設(shè)計(jì)的通電次數(shù)都很高,如至少5000次,因此這一計(jì)數(shù)只是壽命參考值,本身不具指標(biāo)性。
0D(013)軟件讀取錯(cuò)誤率 Soft Read Error Rate
軟件讀取錯(cuò)誤率也稱為可校正的讀取誤碼率,就是報(bào)告給操作系統(tǒng)的未經(jīng)校正的讀取錯(cuò)誤。數(shù)據(jù)值越低越好,過(guò)高則可能暗示盤片磁介質(zhì)有問(wèn)題。
AA(170)壞塊增長(zhǎng)計(jì)數(shù) Grown Failing Block Count(Micron 鎂光)
讀寫失敗的塊增長(zhǎng)的總數(shù)。
AB(171)編程失敗塊計(jì)數(shù) Program Fail Block Count
Flash編程失敗塊的數(shù)量。
AC(172)擦寫失敗塊計(jì)數(shù) Erase Fail Block Count
擦寫失敗塊的數(shù)量。
AD(173)磨損平衡操作次數(shù)(平均擦寫次數(shù)) / Wear Leveling Count(Micron 鎂光)
所有好塊的平均擦寫次數(shù)。
Flash芯片有寫入次數(shù)限制,當(dāng)使用FAT文件系統(tǒng)時(shí),需要頻繁地更新文件分配表。如果閃存的某些區(qū)域讀寫過(guò)于頻繁,就會(huì)比其它區(qū)域磨損的更快,這將明顯縮短整個(gè)硬盤的壽命(即便其它區(qū)域的擦寫次數(shù)還遠(yuǎn)小于最大限制)。所以,如果讓整個(gè)區(qū)域具有均勻的寫入量,就可明顯延長(zhǎng)芯片壽命,這稱為磨損均衡措施。
AE(174)意外失電計(jì)數(shù) Unexpected Power Loss Count
硬盤自啟用后發(fā)生意外斷電事件的次數(shù)。
B1(177)磨損范圍對(duì)比值 Wear Range Delta
磨損最重的塊與磨損最輕的塊的磨損百分比之差。
B4(180)未用的備用塊計(jì)數(shù) Unused Reserved Block Count Total(惠普)
固態(tài)硬盤會(huì)保留一些容量來(lái)準(zhǔn)備替換損壞的存儲(chǔ)單元,所以可用的預(yù)留空間數(shù)非常重要。這個(gè)參數(shù)的當(dāng)前值表示的是尚未使用的預(yù)留的存儲(chǔ)單元數(shù)量。
B5(181)編程失敗計(jì)數(shù) Program Fail Count
用4個(gè)字節(jié)顯示已編程失敗的次數(shù),與(AB)參數(shù)相似。
B5(181)非4KB對(duì)齊訪問(wèn)數(shù) Non-4k Aligned Access(Micron 鎂光)
B6(182)擦寫失敗計(jì)數(shù) Erase Fail Count
用4個(gè)字節(jié)顯示硬盤自啟用后塊擦寫失敗的次數(shù),與(AC)參數(shù)相似。
B7(183)串口降速錯(cuò)誤計(jì)數(shù) SATA Downshift Error Count
這一項(xiàng)表示了SATA接口速率錯(cuò)誤下降的次數(shù)。通常硬盤與主板之間的兼容問(wèn)題會(huì)導(dǎo)致SATA傳輸級(jí)別降級(jí)運(yùn)行。
B8(184)I/O錯(cuò)誤檢測(cè)與校正 I/O Error Detection and Correction(IOEDC)
“I/O錯(cuò)誤檢測(cè)與校正”是惠普公司專有的SMART IV技術(shù)的一部分,與其他制造商的I/O錯(cuò)誤檢測(cè)和校正架構(gòu)一樣,它記錄了數(shù)據(jù)通過(guò)驅(qū)動(dòng)器內(nèi)部高速緩存RAM傳輸?shù)街鳈C(jī)時(shí)的奇偶校驗(yàn)錯(cuò)誤數(shù)量。
B8(184)點(diǎn)到點(diǎn)錯(cuò)誤檢測(cè)計(jì)數(shù) End to End Error Detection Count
Intel第二代的34nm固態(tài)硬盤有點(diǎn)到點(diǎn)錯(cuò)誤檢測(cè)計(jì)數(shù)這一項(xiàng)。固態(tài)硬盤里有一個(gè)LBA(logical block addressing,邏輯塊地址)記錄,這一項(xiàng)顯示了SSD內(nèi)部邏輯塊地址與真實(shí)物理地址間映射的出錯(cuò)次數(shù)。
B8(184)原始?jí)膲K數(shù) Init Bad Block Count(Indilinx芯片)
硬盤出廠時(shí)已有的壞塊數(shù)量。
B9(185)磁頭穩(wěn)定性 Head Stability(西部數(shù)據(jù))
意義不明。
BA(186)感應(yīng)運(yùn)算振動(dòng)檢測(cè) nduced Op-Vibration Detection(西部數(shù)據(jù))
意義不明。
BB(187)無(wú)法校正的錯(cuò)誤 Reported Uncorrectable Errors(希捷)
報(bào)告給操作系統(tǒng)的無(wú)法通過(guò)硬件ECC校正的錯(cuò)誤。如果數(shù)據(jù)值不為零,就應(yīng)該備份硬盤上的數(shù)據(jù)了。
報(bào)告給操作系統(tǒng)的在所有存取命令中出現(xiàn)的無(wú)法校正的RAISE(URAISE)錯(cuò)誤。
BC(188)命令超時(shí) Command Timeout
由于硬盤超時(shí)導(dǎo)致操作終止的次數(shù)。通常數(shù)據(jù)值應(yīng)為0,如果遠(yuǎn)大于零,最有可能出現(xiàn)的是電源供電問(wèn)題或者數(shù)據(jù)線氧化致使接觸不良,也可能是硬盤出現(xiàn)嚴(yán)重問(wèn)題。
BD(189)高飛寫入 High Fly Writes
磁頭飛行高度監(jiān)視裝置可以提高讀寫的可靠性,這一裝置時(shí)刻監(jiān)測(cè)磁頭的飛行高度是否在正常范圍來(lái)保證可靠的寫入數(shù)據(jù)。如果磁頭的飛行高度出現(xiàn)偏差,寫入操作就會(huì)停止,然后嘗試重新寫入或者換一個(gè)位置寫入。這種持續(xù)的監(jiān)測(cè)過(guò)程提高了寫入數(shù)據(jù)的可靠性,同時(shí)也降低了讀取錯(cuò)誤率。這一項(xiàng)的數(shù)據(jù)值就統(tǒng)計(jì)了寫入時(shí)磁頭飛行高度出現(xiàn)偏差的次數(shù)。
BD(189)出廠壞塊計(jì)數(shù) Factory Bad Block Count(Micron 鎂光芯片)
BE(190)氣流溫度 Airflow Temperature
這一項(xiàng)表示的是硬盤內(nèi)部盤片表面的氣流溫度。在希捷公司的某些硬盤中,當(dāng)前值=(100-當(dāng)前溫度),因此氣流溫度越高,當(dāng)前值就越低,最差值則是當(dāng)前值曾經(jīng)到達(dá)過(guò)的最低點(diǎn),臨界值由制造商定義的最高允許溫度來(lái)確定,而數(shù)據(jù)值不具實(shí)際意義。許多硬盤也沒(méi)有這一項(xiàng)參數(shù)。
BF(191)沖擊錯(cuò)誤率 G-sense error rate
這一項(xiàng)的數(shù)據(jù)值記錄了硬盤受到機(jī)械沖擊導(dǎo)致出錯(cuò)的頻度。
C0(192)斷電返回計(jì)數(shù) Power-Off Retract Count
當(dāng)計(jì)算機(jī)關(guān)機(jī)或意外斷電時(shí),硬盤的磁頭都要返回?繀^(qū),不能停留在盤片的數(shù)據(jù)區(qū)里。正常關(guān)機(jī)時(shí)電源會(huì)給硬盤一個(gè)通知,即Standby Immediate,就是說(shuō)主機(jī)要求將緩存數(shù)據(jù)寫入硬盤,然后就準(zhǔn)備關(guān)機(jī)斷電了(休眠、待機(jī)也是如此);意外斷電則表示硬盤在未收到關(guān)機(jī)通知時(shí)就失電,此時(shí)磁頭會(huì)自動(dòng)復(fù)位,迅速離開(kāi)盤片。
這個(gè)參數(shù)的數(shù)據(jù)值累計(jì)了磁頭返回的次數(shù)。但要注意這個(gè)參數(shù)對(duì)某些硬盤來(lái)說(shuō)僅記錄意外斷電時(shí)磁頭的返回動(dòng)作;而某些硬盤記錄了所有(包括休眠、待機(jī),但不包括關(guān)機(jī)時(shí))的磁頭返回動(dòng)作;還有些硬盤這一項(xiàng)沒(méi)有記錄。因此這一參數(shù)的數(shù)據(jù)值在某些硬盤上持續(xù)為0或稍大于0,但在另外的硬盤上則會(huì)大于通電周期計(jì)數(shù)(0C)或啟停計(jì)數(shù)(04)的數(shù)據(jù)。在一些新型節(jié)能硬盤中,這一參數(shù)的數(shù)據(jù)量還與硬盤的節(jié)能設(shè)計(jì)相關(guān),可能會(huì)遠(yuǎn)大于通電周期計(jì)數(shù)(0C)或啟停計(jì)數(shù)(04)的數(shù)據(jù),但又遠(yuǎn)小于磁頭加載/卸載計(jì)數(shù)(C1)的數(shù)據(jù)量。
對(duì)于固態(tài)硬盤來(lái)說(shuō),雖然沒(méi)有磁頭的加載/卸載操作,但這一項(xiàng)的數(shù)據(jù)量仍然代表了不安全關(guān)機(jī),即發(fā)生意外斷電的次數(shù)。
C1(193)磁頭加載/卸載計(jì)數(shù) Load/Unload Cycle Count
對(duì)于過(guò)去的硬盤來(lái)說(shuō),盤片停止旋轉(zhuǎn)時(shí)磁頭臂停靠于盤片中心軸處的停泊區(qū),磁頭與盤片接觸,只有當(dāng)盤片旋轉(zhuǎn)到一定轉(zhuǎn)速時(shí),磁頭才開(kāi)始漂浮于盤片之上并開(kāi)始向外側(cè)移動(dòng)至數(shù)據(jù)區(qū)。這使得磁頭在硬盤啟停時(shí)都與盤片發(fā)生摩擦,雖然盤片的停泊區(qū)不存儲(chǔ)數(shù)據(jù),但無(wú)疑啟停一個(gè)循環(huán),就使磁頭經(jīng)歷兩次磨損。所以對(duì)以前的硬盤來(lái)說(shuō),磁頭起降(加載/卸載)次數(shù)是一項(xiàng)重要的壽命關(guān)鍵參數(shù)。
而在現(xiàn)代硬盤中,平時(shí)磁頭臂是停靠于盤片之外的一個(gè)專門設(shè)計(jì)的?考苌,遠(yuǎn)離盤片。只有當(dāng)盤片旋轉(zhuǎn)達(dá)到額定轉(zhuǎn)速后,磁頭臂才開(kāi)始向內(nèi)(盤片軸心)轉(zhuǎn)動(dòng)使磁頭移至盤片區(qū)域(加載),磁頭臂向外轉(zhuǎn)動(dòng)返回至停靠架即卸載。這樣就徹底杜絕了硬盤啟停時(shí)磁頭與盤片接觸的現(xiàn)象,西部數(shù)據(jù)公司將其稱為“斜坡加載技術(shù)”。由于磁頭在加載/卸載過(guò)程中始終不與盤片接觸,不存在磁頭的磨損,使得這一參數(shù)的重要性已經(jīng)大大下降。
這個(gè)參數(shù)的數(shù)據(jù)值就是磁頭執(zhí)行加載/卸載操作的累計(jì)次數(shù)。從原理上講,這個(gè)加載/卸載次數(shù)應(yīng)當(dāng)與硬盤的啟停次數(shù)相當(dāng),但對(duì)于筆記本內(nèi)置硬盤以及臺(tái)式機(jī)新型節(jié)能硬盤來(lái)說(shuō),這一項(xiàng)的數(shù)據(jù)量會(huì)很大。這是因?yàn)榇蓬^臂組件設(shè)計(jì)有一個(gè)固定的返回力矩,保證在意外斷電時(shí)磁頭能靠彈簧力自動(dòng)離開(kāi)盤片半徑范圍,迅速返回?考。所以要讓硬盤運(yùn)行時(shí)磁頭保持在盤片的半徑之內(nèi),就要使磁頭臂驅(qū)動(dòng)電機(jī)(尋道電機(jī))持續(xù)通以電流。而讓磁頭臂在硬盤空閑幾分鐘后就立即執(zhí)行卸載動(dòng)作,返回到?考苌,既有利于節(jié)能,又降低了硬盤受外力沖擊導(dǎo)致磁頭與盤片接觸的概率。雖然再次加載會(huì)增加一點(diǎn)尋道時(shí)間,但畢竟弊大于利,所以在這類硬盤中磁頭的加載/卸載次數(shù)會(huì)遠(yuǎn)遠(yuǎn)大于通電周期計(jì)數(shù)(0C)或啟停計(jì)數(shù)(04)的數(shù)據(jù)量。不過(guò)這種加載/卸載方式已經(jīng)沒(méi)有了磁頭與盤片的接觸,所以設(shè)計(jì)值也已大大增加,通常筆記本內(nèi)置硬盤的磁頭加載/卸載額定值在30~60萬(wàn)次,而臺(tái)式機(jī)新型節(jié)能硬盤的磁頭加載/卸載設(shè)計(jì)值可達(dá)一百萬(wàn)次。
C2(194)溫度 Temperature
溫度的數(shù)據(jù)值直接表示了硬盤內(nèi)部的當(dāng)前溫度。硬盤運(yùn)行時(shí)最好不要超過(guò)45℃,溫度過(guò)高雖不會(huì)導(dǎo)致數(shù)據(jù)丟失,但引起的機(jī)械變形會(huì)導(dǎo)致尋道與讀寫錯(cuò)誤率上升,降低硬盤性能。硬盤的最高允許運(yùn)行溫度可查看硬盤廠商給出的數(shù)據(jù),一般不會(huì)超過(guò)60℃。
不同廠家對(duì)溫度參數(shù)的當(dāng)前值、最差值和臨界值有不同的表示方法:希捷公司某些硬盤的當(dāng)前值就是實(shí)際溫度(攝氏)值,最差值則是曾經(jīng)達(dá)到過(guò)的最高溫度,臨界值不具意義;而西部數(shù)據(jù)公司一些硬盤的最差值是溫度上升到某值后的時(shí)間函數(shù),每次升溫后的持續(xù)時(shí)間都將導(dǎo)致最差值逐漸下降,當(dāng)前值則與當(dāng)前溫度成反比,即當(dāng)前溫度越高,當(dāng)前值越低,隨實(shí)際溫度波動(dòng)。
C3(195)硬件ECC校正 Hardware ECC Recovered
ECC(Error Correcting Code)的意思是“錯(cuò)誤檢查和糾正”,這個(gè)技術(shù)能夠容許錯(cuò)誤,并可以將錯(cuò)誤更正,使讀寫操作得以持續(xù)進(jìn)行,不致因錯(cuò)誤而中斷。這一項(xiàng)的數(shù)據(jù)值記錄了磁頭在盤片上讀寫時(shí)通過(guò)ECC技術(shù)校正錯(cuò)誤的次數(shù),不過(guò)許多硬盤有其制造商特定的數(shù)據(jù)結(jié)構(gòu),因此數(shù)據(jù)量的大小并不能直接說(shuō)明問(wèn)題。
C3(195)實(shí)時(shí)無(wú)法校正錯(cuò)誤計(jì)數(shù) On the fly ECC Uncorrectable Error Count
這一參數(shù)記錄了無(wú)法校正(UECC)的錯(cuò)誤數(shù)量。
C3(195)編程錯(cuò)誤塊計(jì)數(shù) Program Failure block Count(Indilinx芯片)
C4(196)重映射事件計(jì)數(shù) Reallocetion Events Count
數(shù)據(jù)應(yīng)為0,當(dāng)前值應(yīng)遠(yuǎn)大于臨界值。
這個(gè)參數(shù)的數(shù)據(jù)值記錄了將重映射扇區(qū)的數(shù)據(jù)轉(zhuǎn)移到備用扇區(qū)的嘗試次數(shù),是重映射操作的累計(jì)值,成功的轉(zhuǎn)移和不成功的轉(zhuǎn)移都會(huì)被計(jì)數(shù)。因此這一參數(shù)與重映射扇區(qū)計(jì)數(shù)(05)相似,都是反映硬盤已經(jīng)存在不良扇區(qū)。
C4(196)擦除錯(cuò)誤塊計(jì)數(shù) Erase Failure block Count(Indilinx芯片)
在固態(tài)硬盤中,這一參數(shù)記錄了被重映射的塊編程失敗的數(shù)量。
C5(197)當(dāng)前待映射扇區(qū)計(jì)數(shù) Current Pending Sector Count
數(shù)據(jù)應(yīng)為0,當(dāng)前值應(yīng)遠(yuǎn)大于臨界值。
這個(gè)參數(shù)的數(shù)據(jù)表示了“不穩(wěn)定的”扇區(qū)數(shù),即等待被映射的扇區(qū)(也稱“被掛起的扇區(qū)”)數(shù)量。如果不穩(wěn)定的扇區(qū)隨后被讀寫成功,該扇區(qū)就不再列入等待范圍,數(shù)據(jù)值就會(huì)下降。
僅僅讀取時(shí)出錯(cuò)的扇區(qū)并不會(huì)導(dǎo)致重映射,只是被列入“等待”,也許以后讀取就沒(méi)有問(wèn)題,所以只有在寫入失敗時(shí)才會(huì)發(fā)生重映射。下次對(duì)該扇區(qū)寫入時(shí)如果繼續(xù)出錯(cuò),就會(huì)產(chǎn)生一次重映射操作,此時(shí)重映射扇區(qū)計(jì)數(shù)(05)與重映射事件計(jì)數(shù)(C4)的數(shù)據(jù)值增加,此參數(shù)的數(shù)據(jù)值下降。
C5(197)讀取錯(cuò)誤塊計(jì)數(shù)(不可修復(fù)錯(cuò)誤)Read Failure block Count(Indilinx芯片)
C6(198)脫機(jī)無(wú)法校正的扇區(qū)計(jì)數(shù) Offline Uncorrectable Sector Count
數(shù)據(jù)應(yīng)為0,當(dāng)前值應(yīng)遠(yuǎn)大于臨界值。
這個(gè)參數(shù)的數(shù)據(jù)累計(jì)了讀寫扇區(qū)時(shí)發(fā)生的無(wú)法校正的錯(cuò)誤總數(shù)。數(shù)據(jù)值上升表明盤片表面介質(zhì)或機(jī)械子系統(tǒng)出現(xiàn)問(wèn)題,有些扇區(qū)肯定已經(jīng)不能讀取,如果有文件正在使用這些扇區(qū),操作系統(tǒng)會(huì)返回讀盤錯(cuò)誤的信息。下一次寫操作時(shí)會(huì)對(duì)該扇區(qū)執(zhí)行重映射。
C6(198)總讀取頁(yè)數(shù) Total Count of Read Sectors(Indilinx芯片)
C7(199)Ultra ATA訪問(wèn)校驗(yàn)錯(cuò)誤率 Ultra ATA CRC Error Rate
這個(gè)參數(shù)的數(shù)據(jù)值累計(jì)了通過(guò)接口循環(huán)冗余校驗(yàn)(Interface Cyclic Redundancy Check,ICRC)發(fā)現(xiàn)的數(shù)據(jù)線傳輸錯(cuò)誤的次數(shù)。如果數(shù)據(jù)值不為0且持續(xù)增長(zhǎng),表示硬盤控制器→數(shù)據(jù)線→硬盤接口出現(xiàn)錯(cuò)誤,劣質(zhì)的數(shù)據(jù)線、接口接觸不良都可能導(dǎo)致此現(xiàn)象。由于這一項(xiàng)的數(shù)據(jù)值不會(huì)復(fù)零,所以某些新硬盤也會(huì)出現(xiàn)一定的數(shù)據(jù)量,只要更換數(shù)據(jù)線后數(shù)據(jù)值不再繼續(xù)增長(zhǎng),即表示問(wèn)題已得到解決。
C7(199)總寫入頁(yè)數(shù) Total Count of Write Sectors(Indilinx芯片)
C8(200)寫入錯(cuò)誤率 Write Error Rate / 多區(qū)域錯(cuò)誤率 Multi-Zone Error Rate(西部數(shù)據(jù))
數(shù)據(jù)應(yīng)為0,當(dāng)前值應(yīng)遠(yuǎn)大于臨界值。
這個(gè)參數(shù)的數(shù)據(jù)累計(jì)了向扇區(qū)寫入數(shù)據(jù)時(shí)出現(xiàn)錯(cuò)誤的總數(shù)。有的新硬盤也會(huì)有一定的數(shù)據(jù)量,若數(shù)據(jù)值持續(xù)快速升高(當(dāng)前值偏低),表示盤片、磁頭組件可能有問(wèn)題。
C8(200)總讀取指令數(shù) Total Count of Read Command(Indilinx芯片)
C9(201)脫道錯(cuò)誤率 Off Track Error Rate / 邏輯讀取錯(cuò)誤率 Soft Read Error Rate
數(shù)據(jù)值累積了讀取時(shí)脫軌的錯(cuò)誤數(shù)量,如果數(shù)據(jù)值不為0,最好備份硬盤上的資料。
C9(201)TA Counter Detected(意義不明)
C9(201)寫入指令總數(shù) Total Count of Write Command(Indilinx芯片)
CA(202)數(shù)據(jù)地址標(biāo)記錯(cuò)誤 Data Address Mark errors
此項(xiàng)的數(shù)據(jù)值越低越好(或者由制造商定義)。
CA(202)TA Counter Increased(意義不明)
CA(202)剩余壽命 Percentage Of The Rated Lifetime Used(Micron 鎂光芯片)
當(dāng)前值從100開(kāi)始下降至0,表示所有塊的擦寫余量統(tǒng)計(jì)。計(jì)算方法是以MLC擦寫次數(shù)除以50,SLC擦寫次數(shù)除以1000,結(jié)果取整數(shù),將其與100的差值作為當(dāng)前值(MLC預(yù)計(jì)擦寫次數(shù)為5000,SLC預(yù)計(jì)擦寫次數(shù)為100000)。
CA(202)閃存總錯(cuò)誤bit數(shù) Total Count of error bits from flash(Indilinx芯片)
CB(203)軟件ECC錯(cuò)誤數(shù) Run Out Cancel
錯(cuò)誤檢查和糾正(ECC)出錯(cuò)的頻度。
CB(203)校正bit錯(cuò)誤的總讀取頁(yè)數(shù) Total Count of Read Sectors with correct bits error(Indilinx芯片)
CC(204)軟件ECC校正 Soft ECC Correction
通過(guò)軟件ECC糾正錯(cuò)誤的計(jì)數(shù)。
CC(204)壞塊滿標(biāo)志 Bad Block Full Flag(Indilinx芯片)
CD(205)熱騷動(dòng)錯(cuò)誤率 Thermal Asperity Rate (TAR)
由超溫導(dǎo)致的錯(cuò)誤。數(shù)據(jù)值應(yīng)為0。
CD(205)最大可編程/擦除次數(shù) Max P/E Count(Indilinx芯片)
CE(206)磁頭飛行高度 Flying Height
磁頭距離盤片表面的垂直距離。高度過(guò)低則增加了磁頭與盤片接觸導(dǎo)致?lián)p壞的可能性;高度偏高則增大了讀寫錯(cuò)誤率。不過(guò)準(zhǔn)確地說(shuō),硬盤中并沒(méi)有任何裝置可以直接測(cè)出磁頭的飛行高度,制造商也只是根據(jù)磁頭讀取的信號(hào)強(qiáng)度來(lái)推算磁頭飛行高度。
CE(206)底層數(shù)據(jù)寫入出錯(cuò)率 Write Error Rate
CE(206)最小擦寫次數(shù) Erase Count Min(Indilinx芯片)
CF(207)主軸過(guò)電流 Spin High Current
數(shù)據(jù)值記錄了主軸電機(jī)運(yùn)行時(shí)出現(xiàn)浪涌電流的次數(shù),數(shù)據(jù)量的增加意味著軸承或電機(jī)可能有問(wèn)題。
CF(207)最大擦寫次數(shù) Erase Count Max(Indilinx芯片)
D0(208)主軸電機(jī)重啟次數(shù) Spin Buzz
數(shù)據(jù)值記錄了主軸電機(jī)反復(fù)嘗試啟動(dòng)的次數(shù),這通常是由于電源供電不足引起的。
D0(208)平均擦寫次數(shù)Erase Count Average(Indilinx芯片)
D1(209)脫機(jī)尋道性能 Offline Seek Performance
這一項(xiàng)表示驅(qū)動(dòng)器在脫機(jī)狀態(tài)下的尋道性能,通常用于工廠內(nèi)部測(cè)試。
D1(209)剩余壽命百分比 Remaining Life %(Indilinx芯片)
D2(210)斜坡加載值 Ramp Load Value
這一項(xiàng)僅見(jiàn)于幾年前邁拓制造的部分硬盤。通常數(shù)據(jù)值為0,意義不明。
D2(210)壞塊管理錯(cuò)誤日志 BBM Error Log(Indilinx芯片)
D3(211)寫入時(shí)振動(dòng) Vibration During Write
寫入數(shù)據(jù)時(shí)受到受到外部振動(dòng)的記錄。
D3(211)SATA主機(jī)接口CRC寫入錯(cuò)誤計(jì)數(shù) SATA Error Count CRC (Write)(Indilinx芯片)
D4(212)寫入時(shí)沖擊 Shock During Write
寫入數(shù)據(jù)時(shí)受到受到外部機(jī)械沖擊的記錄。
D4(212)SATA主機(jī)接口讀取錯(cuò)誤計(jì)數(shù) SATA Error Count Count CRC (Read)(Indilinx芯片)
DC(220)盤片偏移量 Disk Shift
硬盤中的盤片相對(duì)主軸的偏移量(通常是受外力沖擊或溫度變化所致),單位未知,數(shù)據(jù)值越小越好。
DD(221)沖擊錯(cuò)誤率 G-sense error rate
與(BF)相同,數(shù)據(jù)值記錄了硬盤受到外部機(jī)械沖擊或振動(dòng)導(dǎo)致出錯(cuò)的頻度。
DE(222)磁頭尋道時(shí)間累計(jì) Loaded Hours
磁頭臂組件運(yùn)行的小時(shí)數(shù),即尋道電機(jī)運(yùn)行時(shí)間累計(jì)。
DF(223)磁頭加載/卸載重試計(jì)數(shù) Load/Unload Retry Count
這一項(xiàng)與(C1)項(xiàng)類似,數(shù)據(jù)值累積了磁頭嘗試重新加載/卸載的次數(shù)。
E0(224)磁頭阻力 Load Friction
磁頭工作時(shí)受到的機(jī)械部件的阻力。
E1(225)主機(jī)寫入數(shù)據(jù)量 Host Writes
由于閃存的擦寫次數(shù)是有限的,所以這項(xiàng)是固態(tài)硬盤特有的統(tǒng)計(jì)。Intel的SSD是每當(dāng)向硬盤寫入了65536個(gè)扇區(qū),這一項(xiàng)的數(shù)據(jù)就+1。如果用HDTune等軟件查看SMART時(shí)可以自己計(jì)算,Intel SSD Toolbox已經(jīng)為你算好了,直接就顯示了曾向SSD中寫入過(guò)的數(shù)據(jù)量。
E2(226)磁頭加載時(shí)間累計(jì) Load 'In'-time
磁頭組件運(yùn)行時(shí)間的累積數(shù),即磁頭臂不在?繀^(qū)的時(shí)間,與(DE)項(xiàng)相似。
E3(227)扭矩放大計(jì)數(shù) Torque Amplification Count
主軸電機(jī)試圖提高扭矩來(lái)補(bǔ)償盤片轉(zhuǎn)速變化的次數(shù)。當(dāng)主軸軸承存在問(wèn)題時(shí),主軸電機(jī)會(huì)嘗試增加驅(qū)動(dòng)力使盤片穩(wěn)定旋轉(zhuǎn)。這個(gè)參數(shù)的當(dāng)前值下降,說(shuō)明硬盤的機(jī)械子系統(tǒng)出現(xiàn)了嚴(yán)重的問(wèn)題。
E4(228)斷電返回計(jì)數(shù) Power-Off Retract Cycle
數(shù)據(jù)值累計(jì)了磁頭因設(shè)備意外斷電而自動(dòng)返回的次數(shù),與(C0)項(xiàng)相似。
E6(230)GMR磁頭振幅 GMR Head Amplitude
磁頭“抖動(dòng)”,即正向/反向往復(fù)運(yùn)動(dòng)的距離。
E7(231)溫度 Temperature
溫度的數(shù)據(jù)值直接表示了硬盤內(nèi)部的當(dāng)前溫度,與(C2)項(xiàng)相同。
E7(231)剩余壽命 SSD Life Left
剩余壽命是基于P/E周期與可用的備用塊作出的預(yù)測(cè)。新硬盤為100;10表示PE周期已到設(shè)計(jì)值,但尚有足夠的保留塊;0表示保留塊不足,硬盤將處于只讀方式以便備份數(shù)據(jù)。
E8(232)壽命余量 Endurance Remaining
壽命余量是指硬盤已擦寫次數(shù)與設(shè)計(jì)最大可擦寫次數(shù)的百分比,與(CA)項(xiàng)相似。
E8(232)預(yù)留空間剩余量 Available Reserved Space(Intel芯片)
對(duì)于Intel的SSD來(lái)說(shuō),前邊05項(xiàng)提到會(huì)保留一些容量來(lái)準(zhǔn)備替換損壞的存儲(chǔ)單元,所以可用的預(yù)留空間數(shù)非常重要。當(dāng)保留的空間用盡,再出現(xiàn)損壞的單元就將出現(xiàn)數(shù)據(jù)丟失,這個(gè)SSD的壽命就結(jié)束了。所以僅看05項(xiàng)意義并不大,這一項(xiàng)才最重要。這項(xiàng)參數(shù)可以看當(dāng)前值,新的SSD里所有的預(yù)留空間都在,所以是100。隨著預(yù)留空間的消耗,當(dāng)前值將不斷下降,減小到接近臨界值(一般是10)時(shí),就說(shuō)明只剩下10%的預(yù)留空間了,SSD的壽命將要結(jié)束。這個(gè)與(B4)項(xiàng)相似。
E9(233)通電時(shí)間累計(jì) Power-On Hours
對(duì)于普通硬盤來(lái)說(shuō),這一項(xiàng)與(09)相同。
E9(233)介質(zhì)磨耗指數(shù) Media Wareout Indicator(Intel芯片)
由于固態(tài)硬盤的擦寫次數(shù)是有限的,當(dāng)?shù)竭_(dá)一定次數(shù)的時(shí)候,就會(huì)出現(xiàn)大量的單元同時(shí)損壞,這時(shí)候預(yù)留空間也頂不住了,所以這項(xiàng)參數(shù)實(shí)際上表示的是硬盤設(shè)計(jì)壽命。Intel的SSD要看當(dāng)前值,隨著NAND的平均擦寫次數(shù)從0增長(zhǎng)到最大的設(shè)計(jì)值,這一參數(shù)的當(dāng)前值從開(kāi)始的100逐漸下降至1為止。這表示SSD的設(shè)計(jì)壽命已經(jīng)終結(jié)。當(dāng)然到達(dá)設(shè)計(jì)壽命也不一定意味著SSD就立即報(bào)廢,這與閃存芯片的品質(zhì)有著很大的關(guān)系。
注:Total Erase Count全擦寫計(jì)數(shù)是指固態(tài)硬盤中所有塊的擦寫次數(shù)的總和,不同規(guī)格的NAND芯片以及不同容量的SSD,其最大全擦寫次數(shù)均有所不同。
F0(240)磁頭飛行時(shí)間 Head Flying Hours / 傳輸錯(cuò)誤率 Transfer Error Rate(富士通)
磁頭位于工作位置的時(shí)間。
富士通硬盤表示在數(shù)據(jù)傳輸時(shí)連接被重置的次數(shù)。
F1(241)LBA寫入總數(shù) Total LBAs Written
LBA寫入數(shù)的累計(jì)。
F1(241)寫入剩余壽命 Lifetime Writes from Host
自硬盤啟用后主機(jī)向硬盤寫入的數(shù)據(jù)總量,以4個(gè)字節(jié)表示,每寫入64GB字節(jié)作為一個(gè)單位。
F2(242)LBA讀取總數(shù) Total LBAs Read
LBA讀取數(shù)的累計(jì)。某些SMART讀取工具會(huì)顯示負(fù)的數(shù)據(jù)值,是因?yàn)椴捎昧?8位LBA,而不是32位LBA。
F2(242)讀取剩余壽命 Lifetime Reads from Host
自硬盤啟用后主機(jī)從硬盤讀取的數(shù)據(jù)總量,以4個(gè)字節(jié)表示,每讀取64GB字節(jié)作為一個(gè)單位。
FA(250)讀取錯(cuò)誤重試率 Read Error Retry Rate
從磁盤上讀取時(shí)出錯(cuò)的次數(shù)。
FE(254)自由墜落保護(hù) Free Fall Protection
現(xiàn)在有些筆記本硬盤具有自由墜落保護(hù)功能,當(dāng)硬盤內(nèi)置的加速度探測(cè)裝置檢測(cè)到硬盤位移時(shí),會(huì)立即停止讀寫操作,將磁頭臂復(fù)位。這個(gè)措施防止了磁頭與盤片之間發(fā)生摩擦撞擊,提高了硬盤的抗震性能。這個(gè)參數(shù)的數(shù)據(jù)里記錄了這一保護(hù)裝置動(dòng)作的次數(shù)。
如圖,此SSD硬盤要掛了。
★ 友情鏈接 ★ 洋溪槎溪信息 洋溪槎溪交友中心 槎溪信息網(wǎng) 槎溪論壇 圖文軟件下載 網(wǎng)站收錄導(dǎo)航 網(wǎng)址信息查詢