قابلیت اطمینان حافظه فلش: مورد انتظار و غیرمنتظره. بخش 2. کنفرانس چهاردهم انجمن USENIX. فن آوری های ذخیره سازی فایل

قابلیت اطمینان حافظه فلش: مورد انتظار و غیرمنتظره. بخش 1. کنفرانس چهاردهم انجمن USENIX. فن آوری های ذخیره سازی فایل

4.2.2. RBER و سن دیسک (به استثنای چرخه های PE).

شکل 1 همبستگی قابل توجهی را بین RBER و سن نشان می دهد که تعداد ماه هایی است که دیسک در این زمینه بوده است. با این حال، این ممکن است یک همبستگی جعلی باشد زیرا به احتمال زیاد درایوهای قدیمی تر PE بیشتری دارند و بنابراین RBER با چرخه های PE همبستگی بیشتری دارد.

برای از بین بردن تأثیر سن بر فرسودگی ناشی از چرخه های پلی اتیلن، ما تمام ماه های سرویس را در ظروف با استفاده از دهک های توزیع چرخه پلی اتیلن به عنوان برش بین ظروف گروه بندی کردیم، به عنوان مثال، ظرف اول شامل تمام ماه های عمر دیسک تا دهک اول توزیع چرخه PE، و غیره بیشتر. ما تأیید کردیم که در داخل هر ظرف، همبستگی بین چرخه‌های PE و RBER بسیار کوچک است (زیرا هر ظرف فقط محدوده کوچکی از چرخه‌های PE را پوشش می‌دهد)، و سپس ضریب همبستگی بین RBER و سن دیسک را به‌طور جداگانه برای هر ظرف محاسبه کردیم.

ما این تجزیه و تحلیل را به طور جداگانه برای هر مدل انجام دادیم زیرا هر گونه همبستگی مشاهده شده به دلیل تفاوت بین مدل‌های جوان‌تر و قدیمی‌تر نیست، بلکه صرفاً به دلیل سن درایوهای همان مدل است. ما مشاهده کردیم که حتی پس از محدود کردن تأثیر چرخه های پلی اتیلن به روشی که در بالا توضیح داده شد، برای همه مدل های درایو هنوز همبستگی معنی داری بین تعداد ماه هایی که یک درایو در میدان بوده و RBER آن وجود دارد (ضرایب همبستگی از 0,2 تا 0,4 متغیر است. ).

قابلیت اطمینان حافظه فلش: مورد انتظار و غیرمنتظره. بخش 2. کنفرانس چهاردهم انجمن USENIX. فن آوری های ذخیره سازی فایل
برنج. 3. رابطه بین RBER و تعداد چرخه های PE برای دیسک های جدید و قدیمی نشان می دهد که سن دیسک بدون توجه به چرخه های PE ناشی از سایش بر مقدار RBER تأثیر می گذارد.

همچنین با تقسیم روزهای استفاده از درایو در سن "جوان" تا 1 سال و روزهای استفاده از درایو بالای 4 سال، اثر سن درایو را به صورت گرافیکی تجسم کردیم و سپس RBER هر یک را رسم کردیم. گروه در برابر تعداد چرخه های PE. شکل 3 این نتایج را برای مدل درایو MLC-D نشان می دهد. ما شاهد تفاوت قابل توجهی در مقادیر RBER بین گروه های دیسک های قدیمی و جدید در تمام چرخه های PE هستیم.

از این، نتیجه می‌گیریم که سن، که با روزهای استفاده از دیسک در میدان اندازه‌گیری می‌شود، بدون توجه به سایش سلول حافظه به دلیل قرار گرفتن در معرض چرخه‌های PE، تأثیر قابل‌توجهی بر RBER دارد. این بدان معنی است که عوامل دیگری مانند پیری سیلیکون نقش زیادی در سایش فیزیکی دیسک دارند.

4.2.3. RBER و حجم کار.

تصور می شود که خطاهای بیت توسط یکی از چهار مکانیسم ایجاد می شود:

  1. خطاهای ذخیره سازی خطاهای نگهداری، زمانی که یک سلول حافظه در طول زمان داده ها را از دست می دهد
    خطاهای اختلال خواندن، که در آن عملیات خواندن به محتویات سلول مجاور آسیب می رساند.
  2. نوشتن خطاهای اختلال، که در آن عملیات خواندن به محتویات یک سلول مجاور آسیب می رساند.
  3. خطاهای پاک کردن ناقص، زمانی که عملیات پاک کردن محتویات سلول را به طور کامل حذف نمی کند.

خطاهای سه نوع آخر (اختلال خواندن، اختلال نوشتن، پاک کردن ناقص) با حجم کار مرتبط هستند، بنابراین درک همبستگی بین RBER و حجم کار به ما کمک می کند تا شیوع مکانیسم های مختلف خطا را درک کنیم. در یک مطالعه اخیر، "مطالعه ای در مقیاس بزرگ در مورد خرابی های فلش مموری در این زمینه" (MEZA, J., WU, Q., KUMAR, S., MUTLU, O. "یک مطالعه در مقیاس بزرگ در مورد خرابی های حافظه فلش در در مجموعه مقالات کنفرانس بین‌المللی ACM SIGMETRICS 2015 در مورد اندازه‌گیری و مدل‌سازی سیستم‌های کامپیوتری، نیویورک، 2015، SIGMETRICS '15، ACM، صفحات 177-190) به این نتیجه رسید که خطاهای ذخیره‌سازی در این زمینه غالب است، در حالی که خطاهای خواندن کاملا جزئی هستند

شکل 1 رابطه معنی داری بین مقدار RBER در یک ماه معین از عمر دیسک و تعداد خواندن، نوشتن و پاک کردن در همان ماه برای برخی مدل ها نشان می دهد (به عنوان مثال، ضریب همبستگی برای MLC - B بالاتر از 0,2 است. مدل و بالاتر از 0,6 برای SLC-B). با این حال، ممکن است این یک همبستگی کاذب باشد، زیرا حجم کار ماهانه ممکن است با تعداد کل چرخه های PE مرتبط باشد.

ما از همان روش توصیف شده در بخش 4.2.2 برای جداسازی اثرات بار کاری از اثرات چرخه های پلی اتیلن با جداسازی ماه ها کارکرد درایو بر اساس چرخه های پلی اتیلن قبلی، و سپس تعیین ضرایب همبستگی به طور جداگانه برای هر ظرف استفاده کردیم.

ما دیدیم که همبستگی بین تعداد خواندن در یک ماه معین از عمر دیسک و مقدار RBER در آن ماه برای مدل‌های MLC-B و SLC-B، حتی زمانی که چرخه‌های PE را محدود می‌کنند، ادامه داشت. ما همچنین یک تجزیه و تحلیل مشابه را تکرار کردیم که در آن تأثیر خواندن بر تعداد نوشته‌ها و پاک کردن‌های همزمان را حذف کردیم و به این نتیجه رسیدیم که همبستگی بین RBER و تعداد خوانده‌ها برای مدل SLC-B صادق است.

شکل 1 همبستگی بین RBER و عملیات نوشتن و پاک کردن را نشان می دهد، بنابراین ما همان تحلیل را برای عملیات خواندن، نوشتن و پاک کردن تکرار کردیم. نتیجه می گیریم که با محدود کردن تأثیر چرخه های PE و خواندن، هیچ رابطه ای بین مقدار RBER و تعداد نوشتن و پاک کردن وجود ندارد.

بنابراین، مدل‌های دیسکی وجود دارد که خطاهای نقض خواندن تأثیر قابل‌توجهی بر RBER دارند. از سوی دیگر، هیچ مدرکی مبنی بر اینکه RBER تحت تأثیر خطاهای نقض نوشتن و خطاهای پاک کردن ناقص قرار گرفته است وجود ندارد.

4.2.4 RBER و لیتوگرافی.

تفاوت در اندازه شی ممکن است تا حدی تفاوت در مقادیر RBER بین مدل‌های درایو با استفاده از فناوری مشابه، یعنی MLC یا SLC را توضیح دهد. (برای مروری بر لیتوگرافی مدل های مختلف موجود در این مطالعه به جدول 1 مراجعه کنید).

به عنوان مثال، 2 مدل SLC با لیتوگرافی 34 نانومتری (مدل‌های SLC-A و SLC-D) دارای RBER هستند که مرتبه‌ای بالاتر از 2 مدل با لیتوگرافی میکروالکترونیک 50 نانومتری (مدل‌های SLC-B و SLC-C) است. در مورد مدل‌های MLC، تنها مدل 43 نانومتری (MLC-B) دارای میانگین RBER است که 50 درصد بیشتر از 3 مدل دیگر با لیتوگرافی 50 نانومتری است. علاوه بر این، همانطور که در شکل 4 نشان داده شده است، با فرسودگی درایوها، این تفاوت در RBER 2 برابر افزایش می یابد. در نهایت، لیتوگرافی نازکتر ممکن است RBER بالاتر درایوهای eMLC را در مقایسه با درایوهای MLC توضیح دهد. به طور کلی، ما شواهد روشنی داریم که لیتوگرافی بر RBER تأثیر می گذارد.

4.2.5. وجود خطاهای دیگر

ما رابطه بین RBER و انواع دیگر خطاها، مانند خطاهای غیرقابل اصلاح، خطاهای مهلت زمانی و غیره را بررسی کردیم، به ویژه اینکه آیا مقدار RBER پس از یک ماه قرار گرفتن در معرض انواع دیگر خطاها بیشتر می‌شود یا خیر.

شکل 1 نشان می دهد که در حالی که RBER ماه قبل مقادیر RBER آینده را پیش بینی می کند (ضریب همبستگی بیشتر از 0,8)، هیچ ارتباط معنی داری بین خطاهای غیر قابل اصلاح و RBER (راست ترین گروه موارد در شکل 1) وجود ندارد. برای انواع دیگر خطاها، ضریب همبستگی حتی کمتر است (در شکل نشان داده نشده است). ما بیشتر رابطه بین RBER و خطاهای غیرقابل اصلاح را در بخش 5.2 این مقاله بررسی کردیم.

4.2.6. تاثیر عوامل دیگر.

ما شواهدی پیدا کردیم که نشان می‌دهد عواملی وجود دارند که تأثیر قابل‌توجهی بر RBER دارند که داده‌های ما نمی‌توانند آن‌ها را توضیح دهند. به طور خاص، ما متوجه شدیم که RBER برای یک مدل دیسک معین بسته به خوشه ای که دیسک در آن مستقر شده است متفاوت است. یک مثال خوب شکل 4 است که RBER را به عنوان تابعی از چرخه های PE برای درایوهای MLC-D در سه خوشه مختلف (خطوط چین) نشان می دهد و آن را با RBER برای این مدل نسبت به تعداد کل درایوها (خط جامد) مقایسه می کند. متوجه می‌شویم که این تفاوت‌ها حتی زمانی که تأثیر عواملی مانند سن دیسک یا تعداد دفعات خواندن را محدود می‌کنیم، باقی می‌مانند.

یکی از توضیح های ممکن برای این موضوع، تفاوت در نوع بار کاری در بین خوشه ها است، زیرا مشاهده می کنیم که خوشه هایی که بار کاری آنها بالاترین نسبت خواندن/نوشتن را دارند، بالاترین RBER را دارند.

قابلیت اطمینان حافظه فلش: مورد انتظار و غیرمنتظره. بخش 2. کنفرانس چهاردهم انجمن USENIX. فن آوری های ذخیره سازی فایل
برنج. 4 الف) ب). مقادیر RBER میانه به عنوان تابعی از چرخه های PE برای سه خوشه مختلف و وابستگی نسبت خواندن/نوشتن به تعداد چرخه های PE برای سه خوشه مختلف.

برای مثال، شکل 4(b) نسبت خواندن/نوشتن خوشه های مختلف را برای مدل درایو MLC-D نشان می دهد. با این حال، نسبت خواندن/نوشتن تفاوت‌های بین خوشه‌ها را برای همه مدل‌ها توضیح نمی‌دهد، بنابراین ممکن است عوامل دیگری مانند عوامل محیطی یا سایر پارامترهای بار کاری خارجی وجود داشته باشد که داده‌های ما در نظر گرفته نمی‌شوند.

4.3. RBER در طول تست دوام تسریع شده.

اکثر کارهای علمی و همچنین آزمایش‌هایی که هنگام خرید رسانه‌ها در مقیاس صنعتی انجام می‌شود، قابلیت اطمینان دستگاه‌ها را در این زمینه بر اساس نتایج آزمایش‌های دوام سریع پیش‌بینی می‌کنند. ما تصمیم گرفتیم بفهمیم که نتایج چنین آزمایشاتی چقدر با تجربه عملی در کارکرد رسانه های ذخیره سازی حالت جامد مطابقت دارد.
تجزیه و تحلیل نتایج آزمایش انجام شده با استفاده از روش عمومی آزمایش تسریع شده برای تجهیزات ارائه شده به مراکز داده Google نشان داد که مقادیر RBER فیلد به طور قابل توجهی بالاتر از پیش بینی شده است. به عنوان مثال، برای مدل eMLC-a، میانگین RBER برای دیسک‌های کارکرده در میدان (در پایان آزمایش تعداد چرخه‌های PE به 600 رسید) 1e-05 بود، در حالی که طبق نتایج آزمایش‌های تسریع‌شده اولیه، این RBER مقدار باید با بیش از 4000 چرخه PE مطابقت داشته باشد. این نشان می دهد که پیش بینی دقیق مقدار RBER در میدان بر اساس تخمین RBER به دست آمده از آزمایشات آزمایشگاهی بسیار دشوار است.

ما همچنین اشاره کردیم که بازتولید برخی از انواع خطاها در طول آزمایش سریع بسیار دشوار است. به عنوان مثال، در مورد مدل MLC-B، تقریبا 60٪ از درایوها در میدان خطاهای غیرقابل اصلاح را تجربه می کنند و تقریبا 80٪ از درایوها بلوک های بد را ایجاد می کنند. با این حال، در طول تست استقامت تسریع شده، هیچ یک از شش دستگاه هیچ خطای غیرقابل اصلاحی را تجربه نکردند تا زمانی که درایوها به بیش از سه برابر محدودیت چرخه PE رسیدند. برای مدل‌های eMLC، خطاهای غیرقابل اصلاح در بیش از 80 درصد درایوهای میدانی رخ می‌دهد، در حالی که در آزمایش‌های سریع، چنین خطاهایی پس از رسیدن به 15000 چرخه PE رخ می‌دهد.

ما همچنین به RBER گزارش شده در کار تحقیقاتی قبلی، که بر اساس آزمایشات در یک محیط کنترل شده بود، نگاه کردیم و به این نتیجه رسیدیم که دامنه مقادیر بسیار گسترده است. به عنوان مثال، L.M. Grupp و دیگران در کار 2009-2012 خود مقادیر RBER را برای درایوهایی که نزدیک به رسیدن به محدودیت های چرخه PE هستند گزارش می دهند. به عنوان مثال، برای دستگاه‌های SLC و MLC با اندازه‌های لیتوگرافی مشابه با اندازه‌های مورد استفاده در کار ما (25-50 نانومتر)، مقدار RBER از 1e-08 تا 1e-03 متغیر است، با اکثر مدل‌های درایو تست شده دارای مقدار RBER نزدیک به 1e- 06.

در مطالعه ما، سه مدل درایو که به محدودیت چرخه PE رسیدند دارای RBERهایی از 3e-08 تا 8e-08 بودند. حتی با در نظر گرفتن این که اعداد ما کران های پایین تر هستند و در بدترین حالت مطلق می توانند 16 برابر بزرگتر باشند، یا با در نظر گرفتن صدک 95 RBER، مقادیر ما هنوز به طور قابل توجهی پایین تر است.

به طور کلی، در حالی که مقادیر واقعی RBER میدانی بالاتر از مقادیر پیش‌بینی‌شده بر اساس آزمایش دوام تسریع‌شده است، همچنان از بیشتر RBER‌های RBER برای دستگاه‌های مشابه گزارش‌شده در سایر مقالات تحقیقاتی و محاسبه‌شده از آزمایش‌های آزمایشگاهی پایین‌تر است. این بدان معنی است که شما نباید به مقادیر RBER میدانی پیش بینی شده که از آزمایش دوام شتاب گرفته شده اند، تکیه کنید.

5. خطاهای غیر قابل اصلاح.

با توجه به وقوع گسترده خطاهای غیرقابل اصلاح (UEs)، که در بخش 3 این مقاله مورد بحث قرار گرفت، در این بخش ویژگی های آنها را با جزئیات بیشتری بررسی می کنیم. ما با بحث در مورد این که از کدام متریک برای اندازه‌گیری UE استفاده کنیم، چگونه با RBER ارتباط دارد و چگونه UE تحت تأثیر عوامل مختلف قرار می‌گیرد، شروع می‌کنیم.

5.1. چرا نسبت UBER منطقی نیست.

معیار استانداردی که خطاهای غیر قابل اصلاح را مشخص می کند، نرخ خطای بیت غیرقابل اصلاح UBER است، یعنی نسبت تعداد خطاهای بیت غیرقابل اصلاح به تعداد کل بیت های خوانده شده.

این متریک به طور ضمنی فرض می کند که تعداد خطاهای غیرقابل اصلاح به نحوی با تعداد بیت های خوانده شده مرتبط است و بنابراین باید با این عدد نرمال شود.

این فرض برای خطاهای قابل تصحیح معتبر است، جایی که تعداد خطاهای مشاهده شده در یک ماه مشخص با تعداد خوانده شده در همان دوره زمانی همبستگی بالایی دارد (ضریب همبستگی اسپیرمن بیشتر از 0.9). دلیل چنین همبستگی قوی این است که حتی یک بیت بد، تا زمانی که با استفاده از ECC قابل تصحیح باشد، به افزایش تعداد خطاها با هر عملیات خواندنی که توسط آن دسترسی پیدا می کند، ادامه می دهد، زیرا ارزیابی سلول حاوی بیت بد است. هنگامی که یک خطا شناسایی می شود بلافاصله اصلاح نمی شود (دیسک ها فقط به صورت دوره ای صفحات با بیت های آسیب دیده را بازنویسی می کنند).

همین فرض در مورد خطاهای غیرقابل اصلاح صدق نمی کند. یک خطای غیرقابل اصلاح مانع استفاده بیشتر از بلوک آسیب دیده می شود، بنابراین پس از شناسایی، چنین بلوکی بر تعداد خطاها در آینده تأثیر نخواهد گذاشت.

برای تأیید رسمی این فرض، ما از معیارهای مختلفی برای اندازه‌گیری رابطه بین تعداد خوانده‌ها در یک ماه معین از عمر دیسک و تعداد خطاهای غیرقابل اصلاح در یک بازه زمانی مشابه، از جمله ضرایب همبستگی مختلف (پیرسون، اسپیرمن، کندال) استفاده کردیم. و همچنین بازرسی بصری نمودارها . علاوه بر تعداد خطاهای غیرقابل اصلاح، به فراوانی خطاهای غیرقابل تصحیح (یعنی احتمال اینکه یک دیسک حداقل یک چنین حادثه ای در یک دوره زمانی معین داشته باشد) و رابطه آنها با عملیات خواندن را نیز بررسی کردیم.
ما هیچ مدرکی دال بر ارتباط بین تعداد خوانده‌ها و تعداد خطاهای غیرقابل اصلاح پیدا نکردیم. برای همه مدل‌های درایو، ضرایب همبستگی زیر 0.02 بود و نمودارها با افزایش تعداد خوانده‌ها هیچ افزایشی در UE نشان ندادند.

در بخش 5.4 این مقاله، بحث می کنیم که عملیات نوشتن و پاک کردن نیز هیچ ارتباطی با خطاهای غیرقابل اصلاح ندارند، بنابراین تعریف جایگزین UBER، که با عملیات نوشتن یا پاک کردن به جای عملیات خواندن عادی می شود، معنایی ندارد.

بنابراین نتیجه می‌گیریم که UBER معیار معنی‌داری نیست، به جز زمانی که در محیط‌های کنترل‌شده‌ای که تعداد خواندن‌ها توسط آزمایشگر تعیین می‌شود، آزمایش شود. اگر از UBER به عنوان معیار در طول آزمایش میدانی استفاده شود، به طور مصنوعی نرخ خطا را برای درایوهایی با تعداد خواندن بالا کاهش می‌دهد و به طور مصنوعی نرخ خطا را برای درایوهایی با تعداد خواندن پایین افزایش می‌دهد، زیرا خطاهای غیرقابل اصلاح بدون توجه به تعداد خوانده‌ها رخ می‌دهند.

5.2. خطاهای غیر قابل اصلاح و RBER.

ارتباط RBER با این واقعیت توضیح داده می شود که به عنوان معیاری برای تعیین قابلیت اطمینان کلی درایو به ویژه بر اساس احتمال خطاهای غیرقابل اصلاح عمل می کند. در کار خود، N. Mielke و همکاران در سال 2008 اولین کسانی بودند که تعریف نرخ خطای غیرقابل اصلاح مورد انتظار را به عنوان تابعی از RBER پیشنهاد کردند. از آن زمان، بسیاری از توسعه دهندگان سیستم از روش های مشابهی مانند برآورد میزان خطای غیرقابل اصلاح مورد انتظار به عنوان تابعی از نوع RBER و ECC استفاده کرده اند.

هدف این بخش این است که مشخص کند RBER چگونه خطاهای غیرقابل اصلاح را پیش بینی می کند. بیایید با شکل 5a شروع کنیم، که میانه RBER را برای تعدادی از مدل‌های درایو نسل اول در برابر درصد روزهای استفاده از آنها که خطاهای UE غیرقابل اصلاح را تجربه کرده‌اند، ترسیم می‌کند. لازم به ذکر است که برخی از 16 مدل نشان داده شده در نمودار به دلیل کمبود اطلاعات تحلیلی در جدول 1 موجود نمی باشد.

قابلیت اطمینان حافظه فلش: مورد انتظار و غیرمنتظره. بخش 2. کنفرانس چهاردهم انجمن USENIX. فن آوری های ذخیره سازی فایل
برنج. 5a. رابطه بین RBER میانه و خطاهای غیر قابل اصلاح برای مدل های مختلف درایو

قابلیت اطمینان حافظه فلش: مورد انتظار و غیرمنتظره. بخش 2. کنفرانس چهاردهم انجمن USENIX. فن آوری های ذخیره سازی فایل
برنج. 5b. رابطه بین RBER میانه و خطاهای غیر قابل اصلاح برای درایوهای مختلف یک مدل.

به یاد بیاورید که همه مدل های یک نسل از مکانیزم ECC یکسان استفاده می کنند، بنابراین تفاوت بین مدل ها مستقل از تفاوت های ECC است. ما هیچ ارتباطی بین حوادث RBER و UE مشاهده نکردیم. ما همان نمودار را برای صدک 95 RBER در مقابل احتمال UE ایجاد کردیم و دوباره هیچ همبستگی مشاهده نکردیم.

در مرحله بعد، ما تجزیه و تحلیل را در سطح دانه ای برای درایوهای جداگانه تکرار کردیم، به عنوان مثال، ما سعی کردیم درایوهایی را پیدا کنیم که مقدار RBER بالاتر با فرکانس UE بالاتر مطابقت دارد یا خیر. به عنوان مثال، شکل 5b میانه RBER را برای هر درایو مدل MLC-c در مقابل تعداد UE ها ترسیم می کند (نتایج مشابه نتایج به دست آمده برای RBER صدک 95). باز هم، ما هیچ ارتباطی بین RBER و UE مشاهده نکردیم.

در نهایت، ما یک تحلیل زمان‌بندی دقیق‌تر انجام دادیم تا بررسی کنیم که آیا ماه‌های عملیاتی درایوهای با RBER بالاتر با ماه‌هایی که در طی آن UE رخ داده‌اند، مطابقت دارد یا خیر. شکل 1 قبلاً نشان داده است که ضریب همبستگی بین خطاهای غیر قابل اصلاح و RBER بسیار پایین است. ما همچنین با روش‌های مختلف ترسیم احتمال UE به عنوان تابعی از RBER آزمایش کردیم و هیچ مدرکی دال بر همبستگی پیدا نکردیم.

بنابراین، نتیجه می گیریم که RBER یک معیار غیر قابل اعتماد برای پیش بینی UE است. این ممکن است به این معنی باشد که مکانیسم‌های خرابی که منجر به RBER می‌شوند با مکانیسم‌هایی که منجر به خطاهای غیرقابل اصلاح می‌شوند متفاوت است (به عنوان مثال، خطاهای موجود در سلول‌های جداگانه در مقابل مشکلات بزرگ‌تر که در کل دستگاه رخ می‌دهد).

5.3. خطاهای غیر قابل اصلاح و فرسودگی.

از آنجایی که فرسودگی یکی از مشکلات اصلی حافظه فلش است، شکل 6 احتمال روزانه خطاهای درایو غیرقابل اصلاح را به عنوان تابعی از چرخه های PE نشان می دهد.

قابلیت اطمینان حافظه فلش: مورد انتظار و غیرمنتظره. بخش 2. کنفرانس چهاردهم انجمن USENIX. فن آوری های ذخیره سازی فایل
شکل 6. احتمال روزانه وقوع خطاهای درایو غیرقابل اصلاح بسته به چرخه های PE.

ما توجه می کنیم که احتمال UE به طور مداوم با افزایش سن درایو افزایش می یابد. با این حال، مانند RBER، افزایش آهسته‌تر از حد معمول است: نمودارها نشان می‌دهند که UE‌ها به‌جای نمایی با چرخه‌های PE به صورت خطی رشد می‌کنند.

دو نتیجه ای که برای RBER انجام دادیم در مورد UE ها نیز صدق می کند: اول اینکه، پس از رسیدن به محدودیت چرخه PE هیچ افزایش واضحی در پتانسیل خطا وجود ندارد، مانند شکل 6 برای مدل MLC-D که محدودیت چرخه PE آن 3000 است. ، میزان خطا در بین مدل های مختلف، حتی در یک کلاس متفاوت است. با این حال، این تفاوت ها به اندازه RBER نیست.

در نهایت، در حمایت از یافته‌های خود در بخش 5.2، متوجه شدیم که در یک کلاس مدل واحد (MLC در مقابل SLC)، مدل‌هایی با کمترین مقادیر RBER برای تعداد معینی از چرخه‌های PE، لزوماً مدل‌هایی نیستند که کمترین مقدار را دارند. احتمال وقوع UE به عنوان مثال، بیش از 3000 چرخه PE، مدل های MLC-D مقادیر RBER 4 برابر کمتر از مدل های MLC-B داشتند، اما احتمال UE برای همان تعداد چرخه PE برای مدل های MLC-D کمی بیشتر از MLC-B بود. مدل ها.

قابلیت اطمینان حافظه فلش: مورد انتظار و غیرمنتظره. بخش 2. کنفرانس چهاردهم انجمن USENIX. فن آوری های ذخیره سازی فایل
شکل 7. احتمال ماهانه وقوع خطاهای درایو غیر قابل اصلاح به عنوان تابعی از وجود خطاهای قبلی در انواع مختلف.

5.4. خطاها و حجم کار غیر قابل اصلاح

به همان دلایلی که حجم کار می تواند بر RBER تأثیر بگذارد (به بخش 4.2.3 مراجعه کنید)، می توان انتظار داشت که بر UE نیز تأثیر بگذارد. به عنوان مثال، از آنجایی که مشاهده کردیم که خطاهای نقض خواندن بر RBER تأثیر می‌گذارند، عملیات خواندن نیز ممکن است احتمال خطاهای غیرقابل اصلاح را افزایش دهد.

ما یک مطالعه مفصل در مورد تأثیر حجم کار بر UE انجام دادیم. با این حال، همانطور که در بخش 5.1 ذکر شد، ما رابطه ای بین UE و تعداد خوانده ها پیدا نکردیم. ما همان تحلیل را برای عملیات نوشتن و پاک کردن تکرار کردیم و باز هم هیچ ارتباطی مشاهده نکردیم.
توجه داشته باشید که در نگاه اول، به نظر می رسد که این با مشاهدات قبلی ما که خطاهای غیرقابل اصلاح با چرخه های پلی اتیلن مرتبط هستند، تناقض دارد. بنابراین، می توان انتظار داشت که با تعداد عملیات نوشتن و پاک کردن همبستگی وجود داشته باشد.

با این حال، در تجزیه و تحلیل خود از تأثیر چرخه های پلی اتیلن، تعداد خطاهای غیر قابل اصلاح در یک ماه معین را با تعداد کل چرخه های پلی اتیلن که درایو در طول عمر خود تا به امروز تجربه کرده است، مقایسه کردیم تا اثر سایش را اندازه گیری کنیم. هنگام مطالعه تاثیر حجم کار، ماه‌های عملکرد درایو را بررسی کردیم که بیشترین تعداد عملیات خواندن/نوشتن/پاک کردن را در یک ماه خاص داشتند، که همچنین شانس بیشتری برای ایجاد خطاهای غیرقابل اصلاح داشت، یعنی ما در نظر نگرفتیم. تعداد کل عملیات خواندن/نوشتن/پاک کردن را حساب کنید.

در نتیجه به این نتیجه رسیدیم که خطاهای نقض خواندن، خطاهای نقض نوشتن و خطاهای پاک کردن ناقص عوامل اصلی ایجاد خطاهای غیرقابل اصلاح نیستند.

از اینکه با ما ماندید متشکرم آیا مقالات ما را دوست دارید؟ آیا می خواهید مطالب جالب تری ببینید؟ با ثبت سفارش یا معرفی به دوستان از ما حمایت کنید 30٪ تخفیف برای کاربران Habr در آنالوگ منحصر به فرد سرورهای سطح ورودی که توسط ما برای شما اختراع شده است: تمام حقیقت در مورد VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps از 20 دلار یا چگونه سرور را به اشتراک بگذاریم؟ (در دسترس با RAID1 و RAID10، حداکثر 24 هسته و حداکثر 40 گیگابایت DDR4).

Dell R730xd 2 برابر ارزان تر است؟ فقط اینجا 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV از 199 دلار در هلند! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - از 99 دلار! در مورد بخوانید نحوه ساخت شرکت زیرساخت کلاس با استفاده از سرورهای Dell R730xd E5-2650 v4 به ارزش 9000 یورو برای یک پنی؟

منبع: www.habr.com

اضافه کردن نظر