監(jiān)督成本| eMMC NAND閃存技術(shù)和用例需求
ODI最近對(duì)較舊的Teslas Model S和Model X車輛提出的信息要求突顯了工作負(fù)載疏忽,其中基于NVIDIA Tegra 3處理器和集成8GB eMMC NAND閃存的主控制單元(MCU)遇到了問(wèn)題。當(dāng)引入新的固件更新為電動(dòng)汽車(EV)帶來(lái)附加功能時(shí),問(wèn)題變得更加復(fù)雜。這充當(dāng)進(jìn)一步激發(fā)NAND閃存磨損進(jìn)度的燃料。盡管在一開(kāi)始固件不是問(wèn)題,并且記錄的數(shù)據(jù)具有足夠的內(nèi)存來(lái)處理工作量,但每次固件升級(jí)都帶來(lái)了新功能,從而減少了每次更新的存儲(chǔ)空間。應(yīng)ODI的信息請(qǐng)求,特斯拉列出了2,399項(xiàng)投訴和現(xiàn)場(chǎng)報(bào)告,7,777項(xiàng)保修索賠以及4,746項(xiàng)與MCU替換方案有關(guān)的非保修索賠。倒車時(shí),故障的MCU導(dǎo)致后置攝像頭圖像顯示遺失。隨著NAND閃存全部耗盡,駕駛員不能再使用車輛的某些功能,例如HVAC(除霧),與ADAS相關(guān)可聽(tīng)得見(jiàn)的提示音,自動(dòng)駕駛儀和轉(zhuǎn)向信號(hào)燈,嚴(yán)格地來(lái)說(shuō)盡管車主仍然可以駕駛車輛,但不能再充電,使汽車無(wú)法運(yùn)行。
eMMC模塊因?yàn)槭且訬AND閃存技術(shù)為基礎(chǔ)而具有預(yù)定的使用壽命。它們具備有限的程序/擦除(P/E)周期,即使公司最初按照這些規(guī)范進(jìn)行設(shè)計(jì),他們也必須預(yù)見(jiàn)到同一系統(tǒng)隨著時(shí)間的推移必須應(yīng)對(duì)不斷增加的工作負(fù)載挑戰(zhàn)。最后,這問(wèn)題有三個(gè)方面。缺乏對(duì)NAND閃存技術(shù)的了解,以及對(duì)更加復(fù)雜和多面的用例了解,并且假設(shè)驅(qū)動(dòng)器的使用期限完全取決于NAND閃存技術(shù)–而不是正在使用的閃存控制器。
了解NAND閃存技術(shù)
根據(jù)特斯拉維修專家的說(shuō)法,由于eMMC中的NAND閃存單元結(jié)構(gòu),在較舊的Model S和X組件中發(fā)現(xiàn)的基于嵌入式NAND的eMMC磨損。在一定程度上是對(duì)的。不同類型的NAND閃存技術(shù)具有不同(但始終是有限的)的P/E周期數(shù)或他人所稱的“寫入周期”。
SLC NAND閃存技術(shù)大約10萬(wàn)次P/E周期
MLC NAND閃存技術(shù)大約10 000-3500 P/E周期
TLC NAND閃存技術(shù)大約3000個(gè)P/E周期
QLC NAND閃存技術(shù)大約1000-100次P/E周期
這意味著一旦這些周期用完,驅(qū)動(dòng)器將再也無(wú)法可靠地存儲(chǔ)數(shù)據(jù)。根據(jù)特斯拉的報(bào)告,Hynix單元“針對(duì)eMMC中每個(gè)NAND閃存塊,額定3,000個(gè)編程/擦除周期”。
要了解NAND閃存單元為何總是具備有限的P/E周期,必須了解其基礎(chǔ)技術(shù)。NAND閃存是一種非易失性存儲(chǔ)器(NVM)技術(shù),它通過(guò)電荷陷阱技術(shù)或浮柵MOSFET
晶體管將數(shù)據(jù)存儲(chǔ)在制成的存儲(chǔ)單元陣列中。通過(guò)在晶體管的控制柵極上施加高電壓,同時(shí)將源極和漏極接地,溝道中的電子可以獲得足夠的能量來(lái)克服氧化物勢(shì)壘,并從溝道移入浮柵。在浮柵中捕獲電子的過(guò)程是閃存設(shè)備的編程(或“寫入”)操作,該操作對(duì)應(yīng)于邏輯位0。相反,擦除操作從浮柵中提取電子,從而切換存儲(chǔ)在其中的數(shù)據(jù)NAND閃存單元磨損,因?yàn)榫幊毯筒脸芷谧罱K會(huì)損壞浮柵和基板之間的隔離層。這減少了數(shù)據(jù)保留,并可能導(dǎo)致數(shù)據(jù)丟失或意外編程的單元。
了解用例的工作負(fù)載
特斯拉電動(dòng)汽車對(duì)于任何存儲(chǔ)應(yīng)用都是一個(gè)充滿挑戰(zhàn)的環(huán)境,這不僅是因?yàn)槠囐|(zhì)量對(duì)溫度和功能安全性的要求,而且因?yàn)槊枯v汽車的使用方式都不同。在這種情況下,eMMC模塊會(huì)受到每日行駛時(shí)間,每日充電時(shí)間,每日音樂(lè)流式傳輸時(shí)間以及一系列其他因素的影響。此外,極其重要的功能和特性取決于MCU能夠可靠地執(zhí)行其工作。這個(gè)生態(tài)系統(tǒng)中的eMMC具有非常獨(dú)特的工業(yè)級(jí)工作負(fù)載,只有使用符合工業(yè)標(biāo)準(zhǔn)設(shè)計(jì)的高質(zhì)量閃存控制器才能適當(dāng)取得。
特斯拉認(rèn)為“以每塊0.7的額定每日P/E周期使用率計(jì)算,在設(shè)備中每塊平均獲得3,000個(gè)P/E周期需要11到12年的時(shí)間,以每塊 1.5的每日P/E周期使用速率的第95個(gè)百分位,在設(shè)備中平均累積3,000個(gè)P/E周期需要5到6年時(shí)間。”歸根結(jié)底,復(fù)合固件更新的苛刻性質(zhì)使這些驅(qū)動(dòng)器比預(yù)期還早崩潰。這就引出了一個(gè)問(wèn)題,為什么這些MCU這么早崩潰?
了解NAND閃存控制器的作用
閃存控制器在高端存儲(chǔ)系統(tǒng)中的作用常被忽略。在NAND閃存經(jīng)常引起關(guān)注的地方,許多人忽視了評(píng)估控制器在管理其應(yīng)用程序方面的真實(shí)能力,而所選閃存則預(yù)定義了P/E周期。盡管閃存技術(shù)在定義驅(qū)動(dòng)器的使用壽命方面起著重要作用,但所選的控制器應(yīng)掩蓋閃存的所有固有缺陷,從而延長(zhǎng)其使用壽命,確保不會(huì)出現(xiàn)任何故障設(shè)備或數(shù)據(jù)損壞。
例如,閃存控制器可以針對(duì)任何特定的存儲(chǔ)設(shè)備執(zhí)行最佳類型的糾錯(cuò)編碼(ECC),完全取決于所選NAND閃存的特性以及控制器中可用的處理性能。在不同類型的NAND閃存中,不同類型的錯(cuò)誤也更為常見(jiàn),例如多層單元(MLC)中更容易出現(xiàn)讀取干擾錯(cuò)誤,而其他控制器功能(如損耗均衡)和垃圾回收的時(shí)間也會(huì)受到NAND閃存中過(guò)度配置的影響。因此,控制器需要仔細(xì)匹配NAND閃存的特性,如果忽略這一點(diǎn),驅(qū)動(dòng)器在預(yù)測(cè)的時(shí)間之前提早崩潰也就不足為奇了。這是一項(xiàng)昂貴的疏忽,選擇正確的閃存控制器是設(shè)計(jì)高效可靠的存儲(chǔ)系統(tǒng)(如eMMC模塊)必不可少的一個(gè)部分。
歸根結(jié)底,在工業(yè)中–故障系統(tǒng)和數(shù)據(jù)損壞不像在其他市場(chǎng)中那樣被接受,因?yàn)槠谕麎勖凸收铣杀靖鼮榧鼻?。像eMMC模塊這樣的存儲(chǔ)系統(tǒng)需要針對(duì)其獨(dú)特的工作負(fù)載進(jìn)行設(shè)計(jì),并進(jìn)行適當(dāng)?shù)墓芾?,以避免在其特定領(lǐng)域發(fā)生故障。最后,閃存控制器在掩飾所選NAND閃存技術(shù)的缺陷方面起著非常重要的作用,應(yīng)被視為核心組件,而不僅僅是NAND閃存的支援。