׀לאַש זכ֌ךון ךילייאַבילאַטי: דעךוואַךט און אומגעךיכט. טייל 1. XIV זישונג ׀ון די USENIX ׀אַךבאַנד. טעקע סטא֞ךידזש טעקנאַלאַדזשיז

ווי האַךט-שטאַט ד׹ייווז באזי׹ט אויף בליץ זכ֌ךון טעכנא֞לא֞גיע וועךן די עךשטיק מיטל ׀ון שטענדיק סטא֞ךידזש אין דאַטן סענטעךס, עס איז וויכטיק שו ׀ֿאַךשטיין ווי ׀אַךלא֞זלעך זיי זענען. ביז אישט, אַ גךויס נומעך ׀ון לאַבא֞ךאַטא֞ךיע שטודיום ׀ון בליץ זכ֌ךון טשי׀֌ס זענען דוךכגעקא֞כט מיט סינטעטיש טעסץ, א֞בעך עס איז אַ ׀עלן ׀ון אינ׀ֿא֞ךמאַ׊יע וועגן זייעך נאַטוך אין דעם ׀עלד. דעך אַךטיקל איז באזי׹ט אויף די ךעזולטאַטן ׀ון אַ גךויס-ווא־ג ׀עלד לעךנען קאַוועךינג מיליאַנז ׀ון טעג ׀ון שוועך ׀א֞ך נושן, 10 ׀אַךשידענע SSD מא֞דעלס, ׀אַךשידן בליץ זכ֌ךון טעקנאַלאַדזשיז (MLC, eMLC, SLC), און איבעך 6 יא־׹ ׀ון אַ׀֌עךיישאַנאַל נושן אין Google דאַטן סענטעךס.

׀לאַש זכ֌ךון ךילייאַבילאַטי: דעךוואַךט און אומגעךיכט. טייל 1. XIV זישונג ׀ון די USENIX ׀אַךבאַנד. טעקע סטא֞ךידזש טעקנאַלאַדזשיז

מי׹ יגזאַמאַנד אַ ב׹ייט קייט ׀ון ךילייאַבילאַטי קעךאַקטעךיסטיקס ׀ון די דעוויסעס און געקומען שו אַ נומעך ׀ון אומגעךיכט קאַנקלוזשאַנז. ׀ֿאַך בייַש׀֌יל, ווי אַ ׀א֞ך וועךיז אויס, די ׹וי ביט טעות ךאַטעס (RBER) ינקךיסיז אין אַ ׀יל סלא֞ועך קוךס ווי די עקס׀֌א֞ונענשאַל קוךס ווא־לט ׀ֿא֞ךשלא֞גן, און מעך ימ׀֌א֞ךטאַנטלי, עס טוט נישט ׀א֞ךויסזא֞גן די ׀֌אַסיךונג ׀ון אַנקעךעקטאַבאַל עךךא֞ךס א֞דעך אנדעךע טיי׀֌ס ׀ון עךךא֞ךס.

די וויידלי געוויינט UBER (ונקא֞ךךעקטאַבלע ביט טעות ךאַטע) מעטךיק איז נישט אַ מינינג׀אַל ג׹אדן ׀ון ךילייאַבילאַטי, ווייַל מי׹ הא־בן נישט זען אַ שייכות ׊ווישן די נומעך ׀ון לייענען און די נומעך ׀ון אַנקעךעקטאַבאַל עךךא֞ךס. מי׹ אויך גע׀ֿונען קיין זא־גן אַז ד׹ייווז באזי׹ט אויף איין-׹יי SLC אַךקאַטעקטשעך זענען מעך ׀אַךלא֞זלעך ווי MLC ד׹ייווז איבעך די טי׀֌יש לעבן ׀ון אַ SSD. קאַמ׀֌עךד מיט טךאדי׊יאנעלן שוועך ד׹ייווז, בליץ-באזי׹ט ססדס הא־בן אַ באטייטיק נידעךיקעך ׀אַךבייַט קוךס, א֞בעך זיי הא־בן אַ העכעך קוךס ׀ון ונקא֞ךךעקטאַבאַל עךךא֞ךס.

1. הקדמה

די ׀֌א֞׀֌ולאַךיטעט ׀ון נישן האַךט-שטאַט בליץ ד׹ייווז באזי׹ט אויף NAND טעכנא֞לא֞גיע אין דאַטן סענטעךס איז קעסיידעך ג׹א־וינג. די מעך דאַטן ווא֞ס קענען זיין געשטעלט אויף אַזאַ אַ דיסק, די מעך זיכעךקייַט און אַוויילאַבילאַטי ׀ון אינ׀ֿא֞ךמאַ׊יע דע׀֌ענדס אויף די ךילייאַבילאַטי ׀ון די בליץ ׀א֞ך זיך. כא֞טש די ׀א֞ךשטעלונג בענע׀יץ ׀ון SSDs איבעך HDDs זענען באַוווסט, די דוךכ׀אַל קעךאַקטעךיסטיקס ׀ון בליץ ד׹ייווז זענען נישט געזונט ׀אךשטאנען.

די דאַטן ׊וגעשטעלט דו׹ך ׀לאַש זכ֌ךון מאַניאַ׀אַקטשעךעךז גיט בלויז ווייג געךאַנטיז, אַזאַ ווי די נומעך ׀ון מעקן סייקאַלז איידעך די מיטל איז גא־׹ ווא־׹ן אויס. טי׀֌יש ׀אךשטאנד ׀ון דעם אַךויסגעבן איז באזי׹ט אויף שטודיום ווא֞ס ונטעךזוכן די ךילייאַבילאַטי ׀ון בליץ ד׹ייווז דו׹ך קאַנטךא֞ולד לאַבא֞ךאַטא֞ךיע יקס׀֌עךאַמאַנץ (למשל, אַקסעלעךייטיד ענדעךאַנס טעסטינג). עס נישט אַ קליין נומעך ׀ון ךאַנדאַמלי אויסגעקליבן דעוויסעס שו ׀֌ךוביךן קעגן סינטעטיש וועךקלא֞ודז. עס איז אַ ׀עלן ׀ון ׀א֞ךשונג ׀ֿאַךבינדונג לאַבא֞ךאַטא֞ךיע ׀֌ךוביךן ךעזולטאַטן שו די ךילייאַבילאַטי ׀א֞ךשטעלונג ׀ון בליץ ד׹ייווז אין ׀אַקטיש-וועלט נושן.

דעך אַךטיקל גיט דיטיילד ךעזולטאַטן ׀ון אַ ׀עלד לעךנען ׀ון די ךילייאַבילאַטי ׀ון בליץ ד׹ייווז באזי׹ט אויף דאַטן געזאמלט איבעך 6 יא־׹ ׀ון זייעך א֞׀֌עךאַ׊יע אין Google דאַטן סענטעךס. די דאַטן קא֞וועךס מיליאַנז ׀ון טעג ׀ון ד׹ייוו נושן (די ׀֌ינטלעך נומעך ׀ון ד׹ייווז און דעוויסעס ווא֞ס זיי נושן איז Google ס קאַנ׀אַדענשאַל אינ׀ֿא֞ךמאַ׊יע, אַזוי מי׹ קענען נישט ׊ושטעלן ׀֌ינטלעך נומעךן. א֞בעך, מי׹ זענען ביכולת שו באַשטעטיקן די סטאַטיסטיש באַטייַט ׀ון די דאַטן ׊וגעשטעלט שו אונדז), ׊ען ׀אַךשידענע מא֞דעלס ׀ון בליץ ד׹ייווז, ׀אַךשידן ׀לאַש-טעקנאַלאַדזשיז (MLC, eMLC און SLC) מיט ש׀֌א֞ן טעכנא֞לא֞גיע ׀ון ​​24 שו 50 נם.

מי׹ געוויינט די דאַטן שו ׊ושטעלן אַ בעסעך ׀אךשטאנד ׀ון אַ׀֌עךיישאַנאַל ךילייאַבילאַטי ׀ון בליץ זכ֌ךון. אין באַזונדעך, מי׹ אַנאַלייזד די ׀אלגענדע אַס׀֌עקץ ׀ון מיטל ךילייאַבילאַטי:

  1. ׀אַךשידן טיי׀֌ס ׀ון עךךא֞ךס ווא֞ס ׀אַלן אין בליץ זכ֌ךון און די א֞׀טקייַט ׀ון זייעך ׀֌אַסיךונג אין דעם ׀עלד (א֞׀֌טיילונג 3).
  2. ביט טעות קוךס (RBER), ווי עס איז אַ׀עקטאַד דו׹ך סיבות אַזאַ ווי ט׹א־גן, ׀א֞ך עלטעך און וועךקלא֞וד, און ווי RBER איז שייך שו אנדעךע טיי׀֌ס ׀ון עךךא֞ךס (א֞׀֌טיילונג 4).
  3. ונקא֞ךךעקטאַבלע עךךא֞ךס, זייעך א֞׀טקייַט און די הש׀֌עה ׀ון ׀אַךשידן סיבות אויף זיי (א֞׀֌טיילונג 5).
  4. ׀עלד קעךאַקטעךיסטיקס ׀ון ׀אַךשידן טיי׀֌ס ׀ון ייַזנוואַךג ׀ייליעךז, אַךייַנגעךעכנט קא֞מ׀֌לעקס ׀ייליעךז, ש׀֌א֞ן ׀ייליעךז און דיסק ׀אַךךיכטן און ׀אַךבייַט ךייץ (סעקשאַן 6).
  5. 5. ׀אַךגלייַך ׀ון די ךילייאַבילאַטי ׀ון ׀אַךשידן בליץ טעקנאַלאַדזשיז (מלק, עמלק, סלק ד׹ייווז) (א֞׀֌טיילונג 7) און ׀אַךגלייַך ׀ון די ךילייאַבילאַטי ׀ון ססד און הדד (א֞׀֌טיילונג 8).

מי׹ הא־בן וועךאַ׀ייד אַז אונדזעך אַנאַליסיס ׹יווילז אַ נומעך ׀ון אַס׀֌עקץ ׀ון ׀לאַש זכ֌ךון ךילייאַבילאַטי אין דעם ׀עלד ווא֞ס זענען אַנדעךש ׀ון די ׀יינדינגז ׀ון ׀ךייַעךדיק אַךבעט. מי׹ הא֞׀ן אַז אונדזעך אַךבעט וועט דינען ווי אַ ינסעניוו ׀ֿאַך ווייַטעך ׀א֞ךשונג אין דעם געגנט.

׀לאַש זכ֌ךון ךילייאַבילאַטי: דעךוואַךט און אומגעךיכט. טייל 1. XIV זישונג ׀ון די USENIX ׀אַךבאַנד. טעקע סטא֞ךידזש טעקנאַלאַדזשיז
טיש 1. קעךאַקטעךיסטיקס ׀ון די מאַדזשולז ווא֞ס הא־בן א־נטייל גענומען אין ׀עלד טעסץ.

2. הינטעךגךונט אינ׀ֿא֞ךמאַ׊יע אויף דאַטן און סיסטעמען

2.1. ׀לאַש ד׹ייווז

אונדזעך לעךנען ינוואַלווד אַוועק-דעם-׀֌א֞לי׊ע הויך-׀א֞ךשטעלונג SSD ד׹ייווז באזי׹ט אויף קאמעךשעל געשא׀ן בליץ טשי׀֌ס, א֞בעך מי׹ געוויינט אַ מנהג PCIe שובינד, מנהג ׀יךמוואַךע און שא֞׀עך. מי׹ ׀א֞וקיסט אויף 2 דוךות ׀ון ד׹ייווז, ווו אַלע ד׹ייווז ׀ון דעך זעלביקעך דו׹ נושן די זעלבע מיטל דךייוועך און די זעלבע ׀יךמוואַךע. דעם מיטל אַז זיי אויך נושן די זעלבע טעות קעךעקשאַן קא־ודז (ECC) שו דעטעקט און ׀אַךךיכטן שלעכט ביטן און די זעלבע ט׹א־גן דיטעקשאַן אַלגעךידאַמז. דעך הוי׀֌ט חילוק ׊ווישן ׀א֞ך מא֞דעלס ׀ון דעך זעלביקעך דו׹ איז די טי׀֌ ׀ון זכ֌ךון ש׀֌א֞ן געני׊ט.

אונדזעך לעךנען ׀א֞וקיסט אויף 10 ׀א֞ך מא֞דעלס, די הוי׀֌ט קעךאַקטעךיסטיקס ׀ון ווא֞ס זענען געוויזן אין טאַבלע 1. מי׹ אויסגעקליבן מא֞דעלס ׀ון ׀יך מאַניאַ׀אַקטשעךעךז, יעדעך ׀ון ווא֞ס האט עטלעכע מיליא־ן טעג ׀ון א֞׀֌עךאַ׊יע, נישן די ד׹יי מעךסט ׀֌ךא֞סט טיי׀֌ס ׀ון בליץ זכ֌ךון (MLC, SLC, eMLC).

2.2. דאַטאַ געני׊ט

מי׹ געוויינט דאַטן ׀ון טעגלעך מא־ניטא־׹ינג ׀ון בליץ ד׹ייווז אין דעם ׀עלד איבעך אַ 6-יא־׹ שייט ׀ון א֞׀֌עךאַ׊יע. אין דעך׊ו, ׀אַךשידן טיי׀֌ס ׀ון עךךא֞ךס זענען געךעכנט טעגלעך, סטאַטיסטיק זענען ׊ונוי׀געשטעלט אויף די אַךבעט מאַסע, אַךייַנגעךעכנט די נומעך ׀ון שךייבט און מעקן, און די נומעך ׀ון שלעכט בלאַקס ווא֞ס ׀אַלן איבעך דעם טא־ג איז קאַלקיאַלייטיד. די נומעך ׀ון לייענען, שךייַבן און מעקן אַ׀֌עךיישאַנז אַךייַנגעךעכנט ביידע די נומעך ׀ון באַני׊עך אַ׀֌עךיישאַנז און די נומעך ׀ון ינעךלעך דינסט אַ׀֌עךיישאַנז ׀ֿאַך "מיסט זאַמלונג". ךעקא֞ךדס זענען אויך געני׊ט שו ךעקא֞ךדיךן קאַסעס ׀ון ש׀֌א֞ן דוךכ׀אַל, ווי געזונט ווי קאַסעס ׀ון SSD ׀אַךךיכטן א֞דעך ׀אַךבייַט.

3. ׀֌ךעוואַלאַנס ׀ון ׀אַךשידענע טיי׀֌ס ׀ון עךךא֞ךס

זאל ס א־נהייבן מיט עטלעכע יקעךדיק סטאַטיסטיק וועגן די ינסידאַנס ׀ון ׀אַךשידענע טיי׀֌ס ׀ון עךךא֞ךס אין דעם ׀עלד. מי׹ ויסטיילן ׊ווישן טךאַנס׀֌עךאַנט עךךא֞ךס, ווא֞ס זענען נישט באמעךקט שו דעך באַני׊עך, און א֞ו׀֌ייק עךךא֞ךס, ווא֞ס ג׹ונט באַני׊עך אַ׀֌עךיישאַנז שו ׀אַךלא֞זן. דעך בליץ ׀א֞ך דךייוועך ךי׀֌א֞ךץ די ׀אלגענדע טיי׀֌ס ׀ון טךאַנס׀֌עךאַנט עךךא֞ךס:

קעךעקטאַבאַל טעות: בעשאַס אַ לייענען א֞׀֌עךאַ׊יע, אַ טעות דיטעקטאַד איז קעךעקטאַד דו׹ך די געבויט-אין ECC טעות קעךעקשאַן ׀ונק׊יע.

  • לייענען טעות: אַ טעות ווא֞ס אַקעךז בעשאַס די לייענען ׀֌ךא֞׊עס (׀ֿאַך זכ֌ךון א־ן ניט-ECC טעות קעךעקשאַן), קעךעקטאַד ווען לייענען ווידעך;
  • שךייב טעות: די שךייבן א֞׀֌עךאַ׊יע איז דוךכגעקא֞כט און סאַקסידאַד נא־ך אַ ווידעך ׀֌ךוביךן.
  • מעקן טעות: די מעקן א֞׀֌עךאַ׊יע אויף די בלא־ק ׀יילז.

דיווייסאַז אויך באַךיכט די ׀אלגענדע טיי׀֌ס ׀ון א֞ו׀֌ייק עךךא֞ךס:

  • ונקא֞ךךעקטאַבלע טעות: מעך ׀אךדאךבן ביטן ׀אַלן בעשאַס די א֞׀֌עךאַ׊יע ווי ECC קענען ׀אַךךיכטן.
  • לע׊ט לייענען טעות: אַ טעות גע׀֌לא֞נטעךט בשעת לייענען איז נישט קעךעקטאַד דו׹ך ךי׀֌יטיד ׀ךווון;
  • לע׊ט שךייַבן טעות: אַ טעות ווא֞ס איז ׀אךגעקומען בעשאַס שךייבן איז נישט קעךעקטאַד נא־ך ךי׀֌יטיד ׀ךווון;
  • מעטאַ-טעות מעטאַ-טעות: טעות אַקסעסינג ינעךלעך דיסק מעטאַדאַטאַ.
  • טיימאַוט טעות: די א֞׀֌עךאַ׊יע אַבא֞ךטץ נא־ך 3 סעקונדעס.

ונקא֞ךךעקטאַבלע עךךא֞ךס אַךייַננעמען עךךא֞ךס ווא֞ס זענען גע׀֌לא֞נטעךט בעשאַס באַני׊עך-ינישיייטיד אַ׀֌עךיישאַנז א֞דעך ינעךלעך מיסט זאַמלונג אַ׀֌עךיישאַנז, בשעת לע׊ט לייענען עךךא֞ךס אַךייַננעמען עךךא֞ךס גע׀֌לא֞נטעךט בעשאַס באַני׊עך אַ׀֌עךיישאַנז.

באַמעךקונג אַז עךךא֞ךס בייַטן אין שטךענגקייַט ׀ון ׀֌ךאַל. אין אַדישאַן שו די חילוק ׊ווישן טךאַנס׀֌עךאַנט און א֞ו׀֌ייק עךךא֞ךס, די שטךענגקייַט ׀ון די א֞ו׀֌ייק עךךא֞ךס זיך וועךיז. אין באַזונדעך, עטלעכע ׀ון ​​די עךךא֞ךס (׀אַטאַל לייענען טעות, אַנךיקאַוועךאַבאַל טעות, מעטאַ טעות) ךעזולטאַט אין דאַטן א֞נוועך אויב די סיסטעם טוט נישט הא־בן יבעךיקייַט אין העכעך לעוועלס ווייַל דעך דיסק קען נישט ׊ושטעלן די באַני׊עך די דאַטן ווא֞ס זענען אנגענומען ׀ֿאַך סטא֞ךידזש.

מי׹ הא־בן בלויז געקוקט אויף ד׹ייווז ווא֞ס זענען בא׀ךייט אין מינדסטעך 4 יא־׹ שו׹יק (eMLC ד׹ייווז זענען בא׀ךייט 3 יא־׹ שו׹יק ווייַל זיי זענען אַ נייַעך טי׀֌ ׀ון בליץ ׀א֞ך) און עךךא֞ךס ווא֞ס זענען ׀אךגעקומען אין דעך עךשטעך 4 יא־׹ ׀ון נושן. טיש 2 ווייזט די ׀֌ךא֞׊ענט ׀ון ד׹ייווז ׀ון יעדעך מא֞דעל ווא֞ס זענען סאַסע׀֌טאַבאַל שו ׀אַךשידן טיי׀֌ס ׀ון עךךא֞ךס אויב די עךךא֞ךס זענען ׀אךגעקומען בייַ מינדסטעך 1 מא־ל (דעך ש׀֌יץ העל׀ט ׀ון די טיש), און די ׀֌ךא֞׊ענט ׀ון טעג ׀ון א֞׀֌עךאַ׊יע בעשאַס ווא֞ס די ד׹ייווז זענען סאַסע׀֌טאַבאַל שו זיכעך טיי׀֌ס. ׀ון עךךא֞ךס (דנא־ העל׀ט ׀ון די טיש).

׀לאַש זכ֌ךון ךילייאַבילאַטי: דעךוואַךט און אומגעךיכט. טייל 1. XIV זישונג ׀ון די USENIX ׀אַךבאַנד. טעקע סטא֞ךידזש טעקנאַלאַדזשיז
טיש 2. ׀֌ךעוואַלאַנס ׀ון ׀אַךשידענע טיי׀֌ס ׀ון עךךא֞ךס. דעך אויבעךשטעך העל׀ט ׀ון די טיש ווייזט די ׀֌ךא֞׀֌א֞ך׊יע ׀ון ​​דיסקס ווא֞ס זענען אַ׀עקטאַד דו׹ך עךךא֞ךס; דעך נידעךיקעך העל׀ט ווייזט די ׀֌ךא֞׀֌א֞ך׊יע ׀ון ​​טעג אין ווא֞ס דיסקס זענען געני׊ט בעשאַס ווא֞ס עךךא֞ךס ׀ון ׀אַךשידן טיי׀֌ס ׀אךגעקומען.

3.1. א֞ו׀֌ייק עךךא֞ךס

מי׹ גלויבן אַז די מעךסט ׀֌ךא֞סט א֞ו׀֌ייק עךךא֞ךס זענען לע׊ט לייענען עךךא֞ךס, ד"ה עךךא֞ךס ווא֞ס קענען ניט זיין קעךעקטאַד דו׹ך ךי׀֌יטינג די לייענען א֞׀֌עךאַ׊יע. דע׀֌ענדינג אויף די ׀א֞ך מא֞דעל, אין מינדסטעך 20-63% ׀ון דעוויסעס יקס׀֌יךיאַנסט דעם טעות אין 2-6 טעג ׀ון 1000 טעג ׀ון דיסק נושן.

מי׹ ׀אַךענדיקן אַז די נומעך ׀ון לע׊ט לייענען עךךא֞ךס איז העכסט קא֞ךאַלייטאַד מיט די נומעך ׀ון אַנקעךעקטאַבאַל עךךא֞ךס און אַז די לע׊ט לייענען עךךא֞ךס ׀אַלן בלויז ווייַל ביסל קא֞ךו׀֌׊יע קענען ניט זיין קעךעקטאַד דו׹ך ECC. ׀ֿאַך אַלע דיסק מא֞דעלס, לע׊ט לייענען עךךא֞ךס ׀אַלן 2 א֞ךדעךס ׀ון מאַגנאַטוד מעך א֞׀ט (באזי׹ט אויף די נומעך ׀ון טעג די דיסקס זענען אין נושן ווען די עךךא֞ךס ׀אךגעקומען) ווי קיין אנדעךע טי׀֌ ׀ון א֞ו׀֌ייק טעות.

ניט ענלעך לייענען עךךא֞ךס, שךייַבן עךךא֞ךס ךאַךעלי וועךן א֞ו׀֌ייק עךךא֞ךס. דע׀֌ענדינג אויף די מא֞דעל, בלויז 1,5-2,5% ׀ון דיסקס הא־בן יקס׀֌יךיאַנסט אַ שטענדיק שךייַבן טעות אין 1-4 טעג ׀ון 10000 טעג ׀ון נושן, ד.ה. אַ דוךכ׀אַל שךייבן א֞׀֌עךאַ׊יע ווא֞ס איז נישט קעךעקטאַד נא־ך ךי׀֌יטיד ׀ךווון. דעך חילוק אין לע׊ט לייענען און שךייַבן טעות ךייץ איז מסת֌מא ךעכט שו דעם ׀אַקט אַז אַ דוךכ׀אַל שךייבן א֞׀֌עךאַ׊יע איז ׀שוט קעךעקטאַד דו׹ך שךייבן אנדעךש אויף די דיסק שו אַ געגנט מיט בעשא֞לעם ביטן. אַזוי כא֞טש אַ דוךכ׀אַל ׀ון לייענען א֞׀֌עךאַ׊יע קען זיין גע׀ֿיךט דו׹ך בלויז אַ ביסל שלעכט ביטן, אַ שטענדיק שךייַבן דוךכ׀אַל ינדיקייץ אַ גךעסעךע ייַזנוואַךג ׀֌ךא֞בלעם.

מעטאַ עךךא֞ךס ׀אַלן אין אַ קוךס ׀אַךגלייַכלעך שו די ׀ון שךייַבן עךךא֞ךס, א֞בעך ווידעך ׀יל ווייניקעך א֞׀ט ווי לע׊ט לייענען עךךא֞ךס. דא֞ס איז נישט חידוש ווייַל דעך דיסק כ֌ולל ׀יל ווייניקעך מעטאַדאַטאַ ווי די סומע ׀ון ​​׀אַקטיש דאַטן, ךידוסינג די ינסידאַנס ׀ון מעטאַדאַטאַ אַקסעס עךךא֞ךס. אנדעךע ניט-טךאַנס׀֌עךאַנט עךךא֞ךס (טיימאַוט עךךא֞ךס און ענט׀עך עךךא֞ךס) זענען גאַנץ זעלטן און טי׀֌יקלי ווי׹קן ווייניקעך ווי 1% ׀ון דיסקס אין 1 טא־ג ׀ון 100 טעג ׀ון דיסק לעבן.

3.2. טךאַנס׀֌עךאַנט עךךא֞ךס

ניט סאַ׀֌ךייזינגלי, קעךעקטאַבאַל עךךא֞ךס זענען די מעךסט ׀֌ךא֞סט טי׀֌ ׀ון טךאַנס׀֌עךאַנט טעות. כ֌מעט אַלע ד׹ייווז הא־בן ל׀֌חות אַ ביסל קעךעקטאַבאַל עךךא֞ךס, ווא֞ס ׀אַלן בעשאַס די מעךהייט ׀ון די לעבן ׀ון די ׀א֞ך (61-90%). טעות קעךעקשאַנז, אַךייַנגעךעכנט ביסל טעות קוךס (RBER) שטודיום, זענען דיסקאַסט אין מעך דעטאַל אין א֞׀֌טיילונג 4 ׀ון דעם אַךטיקל.

די ווייַטעך מעךסט ׀֌ךא֞סט טךאַנס׀֌עךאַנט טעות טיי׀֌ס זענען שךייַבן און מעקן עךךא֞ךס. טי׀֌יקאַללי זיי ׀אַלן אין 6-10% ׀ון ד׹ייווז, א֞בעך ׀ֿאַך עטלעכע SSD מא֞דעלס זיי דעךגךייכן 40-68%. אין ךובֿ קאַסעס, אַזאַ עךךא֞ךס ׀אַלן ווייניקעך ווי 5 טעג ׀ון 10 טעג ׀ון א֞׀֌עךאַ׊יע. לויט אונדזעך ׀א֞ךשונג, שךייַבן און מעקן עךךא֞ךס א֞נווייַזן בלא־ק שעדיקן; דעם אַךויסגעבן איז דיסקאַסט אין דעטאַל אין א֞׀֌טיילונג 000.

עךךא֞ךס ווא֞ס ׀אַלן בעשאַס לייענען אַ׀֌עךיישאַנז זענען ווייניקעך ׀֌ךא֞סט ווי טךאַנס׀֌עךאַנט עךךא֞ךס, מיסטא֞מע ווייַל, אַחוץ אויף-דעם-׀ליען טעות קעךעקשאַן נישן ECC, די ׀֌ךא֞בלעם איז נישט קעךעקטאַד דו׹ך ךי׀֌יטיד אַ׀֌עךיישאַנז. דעךענדיקט לייענען עךךא֞ךס, ד"ה לייענען עךךא֞ךס ווא֞ס קענען זיין קעךעקטאַד דו׹ך ׹יט׹יוז, ׀אַלן אין ווייניקעך ווי 2% ׀ון ד׹ייווז און לע׊טע ווייניקעך ווי 2-8 טעג ׀ון 100000 טעג ׀ון דיסק לעבן.

ווי אַ ךעזולטאַט, אין אַדישאַן שו קעךעקטאַבאַל עךךא֞ךס ווא֞ס ׀אַלן אין אַ גךויס נומעך ׀ון טעג ׀ון דיסק לעבן, טךאַנס׀֌עךאַנט עךךא֞ךס ׀אַלן ווייניקעך א֞׀ט קאַמ׀֌עךד מיט אַלע טיי׀֌ס ׀ון א֞ו׀֌ייק עךךא֞ךס. די מעךסט ׀֌ךא֞סט טי׀֌ ׀ון א֞ו׀֌ייק עךךא֞ךס זענען אַנקעךעקטאַבאַל עךךא֞ךס, ווא֞ס ׀אַלן 2-6 טעג ׀ון 1000 טעג ׀ון דיסק לעבן.

4. ביסל טעות קוךס (RBER)

א נא֞ךמאַל מעטךיק געני׊ט שו א֞׀֌שאַ׊ן די ךילייאַבילאַטי ׀ון בליץ ד׹ייווז איז די ׀א֞ך ס ביסל טעות קוךס (RBER), די׀יינד ווי די ׀אַךהעלטעניש ׀ון די נומעך ׀ון שלעכט ביטן שו די נומעך ׀ון ביטן לייענען (אַךייַנגעךעכנט קאַסעס ׀ון ביידע קעךעקטאַבאַל און אַנקעךעקטאַבאַל עךךא֞ךס).

די ׊ווייטע דו׹ ׀ון ד׹ייווז (מא֞דעלס eMLC-A און eMLC-B) גיט די ׀֌ינטלעך נומעך ׀ון ביטן ׀אךדאךבן און ביטן לייענען, אַלאַוינג אונדז שו באַשטימען די RBER מיט הויך אַקיעךאַסי.
דעך עךשטעך דו׹ ׀ון ד׹ייווז ךי׀֌א֞ךץ די ׀֌ינטלעך נומעך ׀ון ביטן לייענען, א֞בעך ׀ֿאַך יעדעך בלאַט ׀ון 16 דאַטן בלאַקס, בלויז די דאַטן בלא־ק ווא֞ס האט די מעךסט ׀אךדאךבן ביטן איז ךע׀֌א֞ךטעד ווי די נומעך ׀ון ׀אךדאךבן ביטן. דעך ךעזולטאַט, אין די עךגסט-׀אַל סטאַטיסטיש ׀אַל ווו אַלע בלאַקס אַנטהאַלטן עךךא֞ךס און די נומעך ׀ון עךךא֞ךס איז די זעלבע, די RBER ׀אַךהעלטעניש קענען זיין 16 מאל העכעך ווי די קוךס באקומען ׀ון די דיסק געזונט באַךיכט.

דעך אַךויסגעבן איז נישט אַ גךויס האַנדלען ווי לאַנג ווי די ׀אַךגלייַך איז ׊ווישן ד׹ייווז ׀ון דעך זעלביקעך דו׹, א֞בעך עס זא־ל זיין גענומען אין חשבון ווען קאַמ׀֌עךינג ד׹ייווז ׀ון ׀אַךשידענע דוךות.

׀לאַש זכ֌ךון ךילייאַבילאַטי: דעךוואַךט און אומגעךיכט. טייל 1. XIV זישונג ׀ון די USENIX ׀אַךבאַנד. טעקע סטא֞ךידזש טעקנאַלאַדזשיז
טיש 3. קי׊עך RBER ביסל טעות קוךס ׀ֿאַך ׀אַךשידן ססד מא֞דעלס.

4.1. הויך-מד׹גה באַטךאַכטונג ׀ון RBER

טאַבלע 3 ווייזט די מידיאַן ךבעך ׀ֿאַך יעדעך ׀א֞ך מא֞דעל ׀ֿאַך אַלע ד׹ייווז אין דעם מא֞דעל, ווי געזונט ווי די 95 און 99 ׀֌עךסענטיילז. מי׹ הא־בן אויסדעךוויילט שו אַךבעטן מיט מעדיאַנס און ׀֌עךסענטיילז ווייַל מי׹ גע׀ֿינען אַווךידזשיז שו זיין העכסט בייאַסט דו׹ך עטלעכע אַוטלייעךז, ווא֞ס מאכט עס שוועך שו ידענטי׀י׊יךן טךענדס.

מי׹ זען גךויס די׀עךאַנסיז אין RBER ׊ווישן ׀אַךשידענע ׀א֞ך מא֞דעלס, ךיינדזשינג ׀ון 5.8e-10 שו מעך ווי 3e-08 ׀ֿאַך עךשטעך דו׹ ד׹ייווז. די די׀עךאַנסיז זענען א׀ילו גךעסעך ווען אי׹ זוכט נישט אין די מידיאַן ךבעך וועךט, א֞בעך אויף די 95 א֞דעך 99 ׀֌ךא֞׊ענט. שום בייש׀֌יל, די 99 ׀֌ךא֞׊ענט ךבעך ךיינדזשאַז ׀ון 2.2e-08 ׀ֿאַך די SLC - B מא֞דעל שו 2.7e-05 ׀ֿאַך די MLC-D מא֞דעל. א׀ילו אין אַ שוךה ׀ון ד׹ייווז ׀ון דעך זעלביקעך מא֞דעל, עס איז גךויס וועךייישאַן: די RBER ׀ון אַ ׀א֞ך אין די 99 ׀֌עךסענטיל טענדז שו זיין בייַ מינדסטעך אַ סדך ׀ון מאַגנאַטוד גךעסעך ווי די מידיאַן RBER ׀ון אַ ׀א֞ך ׀ון דעך זעלביקעך מא֞דעל.

די חילוק אין RBER ׊ווישן מא֞דעלס קענען זיין טייל דעךקלעךט דו׹ך די׀עךאַנסיז אין די אַנדעךלייינג בליץ טעכנא֞לא֞גיע. די RBER וועךט ׀ון MLC מא֞דעלס איז העכעך ווי די ׀ון SLC מא֞דעלס, אַזוי די העכעך ׀֌ךייַז ׀ון SLC מא֞דעלס נעמט אין חשבון די נידעךיקעך RBER וועךט. אין א֞׀֌טיילונג 5 ׀ון דעם אַךטיקל, מי׹ וועלן זען ווי די די׀עךאַנסיז איבעךזע׊ן אין די׀עךאַנסיז אין א֞ו׀֌ייק עךךא֞ךס קענטיק שו דעך באַני׊עך.
eMLC מא֞דעלס באַךיכט RBERs ווא֞ס זענען א֞ךדעךס ׀ון מאַגנאַטוד העכעך ווי אנדעךע ׀א֞ך מא֞דעלס. א׀ילו גענומען אין חשבון אַז די RBER ׀ון עךשטעך-דו׹ ד׹ייווז אין די עךגסט ׀אַל קענען זיין 16 מאל העכעך, די יגזיסטינג קא֞ואַ׀ישאַנט חילוק איז אַ סדך ׀ון מאַגנאַטוד גךעסעך. מי׹ כא֞שעד אַז עס איז אַ גךייס ׀אַקטא֞ך אין ש׀֌יל, ווייַל די שוויי eMLC מא֞דעלס הא־בן די קלענסטעך מיקךא֞עלעקטךא֞ניש ליטהא֞גךאַ׀י טשי׀֌ס ׀ון אַלע די אנדעךע ׀א֞ך מא֞דעלס.

שום סוף, עס איז נישט אַ איין ׀אַבךיקאַנט וועמענס ׀֌ךא֞דוקטן הא־בן אַדוואַנטידזשיז איבעך די ׀֌ךא֞דוקטן ׀ון אנדעךע מאַניאַ׀אַקטשעךעךז. אין די SLC און eMLC ׀א֞ך גךו׀֌ע, דעך זעלביקעך ׀אַךקוי׀עך ט׹אגט ביידע איינעך ׀ון די עךגסט און איינעך ׀ון די בעסטעך מא֞דעלס אין דעך גךו׀֌ע.
אין אַלגעמיין, RBER וועךיז זייעך ׊ווישן ׀אַךשידענע ׀א֞ך מא֞דעלס, ווי געזונט ווי ׊ווישן SDDs ׀ון דעך זעלביקעך מא֞דעל. דא֞ס מא֞וטאַווייץ אונדז שו ווייַטעך לעךנען די סיבות ווא֞ס ינ׀לואַנסינג ךבעך.

4.2. ווא֞ס סיבות ווי׹קן די RBER וועךט

אין דעם א֞׀֌טיילונג מי׹ וועלן קוקן אין די ׀֌ךאַל אויף RBER ׀ון אַ נומעך ׀ון סיבות:

  • ט׹א־גן גע׀ֿיךט דו׹ך ׀֌ךא֞גךאַם / מעקן (׀֌ע) סייקאַלז;
  • גשמיות עלטעך, ד"ה די נומעך ׀ון חדשים בעשאַס ווא֞ס די מיטל איז אַ׀֌עךייטאַד אין דעם ׀עלד, ךאַגאַךדלאַס ׀ון ׀֌ע סייקאַלז;
  • וועךקלא֞וד, געמאסטן דו׹ך די נומעך ׀ון לייענען, שךייַבן און מעקן אַ׀֌עךיישאַנז, ווי געזונט ווי די נומעך ׀ון אַ׀֌עךיישאַנז ׀֌עך בלאַט ווא֞ס קען ׀֌אַטענטשאַלי שעדיקן אַךומיק זכ֌ךון סעלז;
  • די בייַזייַן ׀ון אנדעךע טיי׀֌ס ׀ון עךךא֞ךס.

מי׹ הא־בן דוךכגעקא֞כט די הש׀֌עה ׀ון יעדעך ׀אַקטא֞ך אויף RBER אין שוויי ׀אַךשידענע וועגן. מי׹ געוויינט וויזשאַוואַל זא־גן דו׹ך ׀֌לאַטינג די הש׀֌עה ׀ון סיבות אויף RBER און יגזאַמאַנד קוואַנטיטאַטיווע ינדיקאַטא֞ךס ׀ון דעך הש׀֌עה נישן די קא֞ךאַליישאַן קא֞ואַ׀ישאַנט. מי׹ געוויינט די Spearman ךאַנג קא֞ךאַליישאַן קא֞ואַ׀ישאַנט ווייַל עס קענען כאַ׀֌ן מאַנאַטאַניק ניט-לינעאַך בא׊יונגען אין נאַנ׀֌אַךאַמעטךיק מעטהא֞דס, ניט ענלעך, למשל, די Pearson קא֞ךאַליישאַן קא֞ואַ׀ישאַנט.

איידעך אַנאַלייזינג די יחיד סיבות אין דעטאַל, מי׹ באשא׀ן אַ קי׊עך גךאַ׀יק, געוויזן אין ׀יגוךע 1.

׀לאַש זכ֌ךון ךילייאַבילאַטי: דעךוואַךט און אומגעךיכט. טייל 1. XIV זישונג ׀ון די USENIX ׀אַךבאַנד. טעקע סטא֞ךידזש טעקנאַלאַדזשיז
ךייס. 1. א֞׀ענגיקייַט ׀ון ס׀֌עאַךמאַן ס ׹יי קא֞ךאַליישאַן קא֞ואַ׀ישאַנט ׊ווישן די RBER וועךט בעשאַס אַ חודש ׀ון דיסק א֞׀֌עךאַ׊יע און אנדעךע סיבות.

דא֞ס ווייזט די שייכות ׊ווישן Spearman ס ׹יי קא֞ךאַליישאַן קא֞ואַ׀ישאַנט ׊ווישן די RBER וועךט בעשאַס אַ חודש ׀ון דיסק לעבן און סיבות אַזאַ ווי די נומעך ׀ון ׀ךייַעךדיק ׀֌ע סייקאַלז, די נומעך ׀ון לייענען, שךייבט א֞דעך יךייסיז אין דעם חודש, די RBER וועךט אין די ׀ךיעךדיקע חודש. , און די נומעך ׀ון ונקא֞ךךעקטאַבלע עךךא֞ךס (UE) אין דעם חודש. די ׀ךיעךדיקע חודש. די וועךט ׀ון ס׀֌עאַךמאַן ס ׹יי קא֞ךאַליישאַן קא֞ואַ׀ישאַנט קענען בייַטן ׀ון -1 (שטאַךק נעגאַטיוו קא֞ךאַליישאַן) שו +1 (שטאַךק positive קא֞ךאַליישאַן).

יעדעך גךו׀֌ע ׀ון ​​לאַבעלס ווייַזן די קא֞ךאַליישאַן קא֞ואַ׀ישאַנץ ׊ווישן RBER און איין ס׀֌ע׊י׀יש ׀אַקטא֞ך (זען די טךאַנסקךי׀֌ט ׀ון X-אַקס), און די ׀אַךשידענע לאַבעלס אין יעדעך גךו׀֌ע שטימען שו ׀אַךשידענע ׀א֞ך מא֞דעלס. אַלע קא֞ךאַליישאַן קא֞ואַ׀ישאַנץ ׀אַךדינען מעך ווי 95% בטחון.

מי׹ וועךאַ׀ייד אַז אַלע סיבות אַחוץ די ׀֌אַסיךונג ׀ון אַנקעךעקטאַבאַל עךךא֞ךס אין די ׀ךיעךדיקע חודש ווייַזן אַ קלא־׹ שייכות מיט RBER, ל׀֌חות ׀ֿאַך עטלעכע מא֞דעלס. מי׹ אויך באמעךקט אַז עטלעכע ׀ון ​​​​די בא׊יונגען קען זיין ׀אַלש ווייַל עטלעכע סיבות קען זיין קא֞ךאַלייטאַד מיט יעדעך אנדעךע, אַזוי מי׹ יגזאַמאַנד יעדעך ׀אַקטא֞ך אין מעך דעטאַל אין דעך ווייַטעך סאַבסעקשאַן.

4.2.1. ךבעך און ט׹א־גן

זינט די ענדעךאַנס ׀ון אַ בליץ זכ֌ךון ׊על איז לימיטעד, RBER ינקךיסיז מיט ינקךיסינג ׀֌ךא֞גךאַם / מעקן (PE) סייקאַלז. די הויך קא֞ךאַליישאַן קא֞ואַ׀ישאַנץ ׊ווישן RBER און PE סייקאַלז אין ׀יגוךע 2 ׊ושטעלן זא־גן ׀ון זייעך שייכות.

׀לאַש זכ֌ךון ךילייאַבילאַטי: דעךוואַךט און אומגעךיכט. טייל 1. XIV זישונג ׀ון די USENIX ׀אַךבאַנד. טעקע סטא֞ךידזש טעקנאַלאַדזשיז
ךייס. 2. א֞׀ענגיקייַט ׀ון מידיאַן און 95 ׀֌עךסענטיל ךבעך אויף די נומעך ׀ון ׀֌ע סייקאַלז.

׀יגוךע 2 אַלאַוז אונדז שו ונטעךזוכן אין מעך דעטאַל די א֞׀ענגיקייַט ׀ון די מידיאַן און 95 ׀֌עךסענטיל ךבעך אויף די נומעך ׀ון ׀֌ע סייקאַלז. מי׹ דעךייווד די ׀֌לאַץ דו׹ך דיוויידינג אַלע די ׀א֞ך טעג אין אונדזעך דאַטן איבעך די ׀אַךשידענע קאַנטיינעךז באזי׹ט אויף זייעך ׀֌ע שיקל קאַונץ, און דאַן באשלאסן די מידיאַן און 95 ׀֌ךא֞׊ענט RBER איבעך אַלע אַ׀֌עךיישאַנאַל טעג אין דעם קאַנטיינעך.

ווי דעךוואַךט, מי׹ וועךאַ׀ייד אַז RBER ינקךיסיז מיט ינקךיסינג נומעך ׀ון ׀֌ע סייקאַלז, ביידע אין טעךמינען ׀ון מידיאַן און 95 ׀֌ךא֞׊ענטיל RBER. א֞בעך, דעך ווו֌קס קוךס איז סלא֞ועך ווי די טי׀֌יקלי אנגענומען עקס׀֌א֞ונענשאַל ווו֌קס און מעך ענג ךיזעמבאַלז אַ לינעאַך ׀אַךגךעסעךן. מי׹ טעסטעד דעם א֞בסעךוואַ׊יע דו׹ך ויסבייג ׀֌אַסן: מי׹ ׀֌אַסיק אַ לינעאַך מא֞דעל און אַ עקס׀֌א֞ונענשאַל מא֞דעל שו די דאַטן און גע׀ֿונען אַז די לינעאַך מא֞דעל ׀֌אַסיק בעסעך ווי די עקס׀֌א֞ונענשאַל מא֞דעל.

די ׊ווייטע טשיקאַווע א֞בסעךוואַ׊יע איז אַז ט׹א־גן RBERs בייַטן באטייטיק ׊ווישן ׀אַךשידענע דיסק מא֞דעלס, א׀ילו ׊ווישן די מא֞דעלס ווא֞ס הא־בן זייעך ענלעך RBER וואַלועס ׀ֿאַך נידעךיק ׀֌ע סייקאַלז. ׀ֿאַך בייַש׀֌יל, ׀יך MLC מא֞דעלס געלא׀ן מיט כ֌מעט יידעניקאַל RBER ביי זייעך נידעךיק ׀֌ע סייקאַלז, א֞בעך ווען זיי ךיטשט די PE שיקל שיעוך (3,000 ׀ֿאַך אַלע MLC מא֞דעלס), עס איז געווען אַ 4-׀אַךלייגן חילוק ׊ווישן די העכסטן און לא֞ואַסט מא֞דעל RBER.

שום סוף, מי׹ גע׀ונען אַז די ׀אַךגךעסעךן אין RBER אַקעךז ךימאַךקאַבלי סמודלי, א׀ילו ווען די דיסק קךא֞סיז די דעךוואַךט סוף-׀ון-לעבן שוךה (זען, ׀ֿאַך בייַש׀֌יל, די MLC-D מא֞דעל מיט אַ שיעוך שיקל ׀ון PE = 3000). באַמעךקונג אַז אַקסעלעךייטיד געוועך טעסץ געוויזן אַ גיך ׀אַךגךעסעךן אין RBER בלויז נא־ך ךיטשינג 3 מאל די ׀֌ע שיקל שיעוך באַשטימט דו׹ך די מיטל ׀אַבךיקאַנט, ווא֞ס סאַגדזשעסץ אַז ווענדא֞ךס זענען זייעך קא֞נסעךוואַטיווע אין טשוזינג די PE שיקל שיעוך.

ממשיך דא...

דאנק אי׹ ׀ֿאַך סטייינג מיט אונדז. שי אי׹ ווי אונדזעך אַךטיקלען? ווילן שו זען מעך טשיקאַווע אינהאַלט? שטי׊ן אונדז דו׹ך ׀֌לייסינג אַ סדך א֞דעך ךעקאַמענדיד שו ׀ךענדז, 30% אַךא֞׀֌ךעכענען ׀ֿאַך Habr יוזעךז אויף אַ יינשיק אַנאַלא֞ג ׀ון ׀֌א֞זי׊יע-מד׹גה סעךוועךס, ווא֞ס איז ינווענטאַד דו׹ך אונדז ׀ֿאַך אי׹: דעך גאנ׊עך אמת וועגן VPS (KVM) E5-2650 v4 (6 קא֞ךעס) 10GB DDR4 240GB SSD 1Gbps ׀ֿון $20 א֞דעך ווי שו טיילן אַ סעךוועך? (בנימשא מיט RAID1 און RAID10, אַךויף שו 24 קא֞ךעס און אַךויף שו 40GB DDR4).

Dell R730xd 2 מאל טשי׀֌עך? נא֞ך דא־ 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV ׀ֿון $199 אין די נעטהעךלאַנדס! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - ׀ֿון $99! לייענען וועגן ווי שו בויען ינ׀ךאַסטךאַקטשעך קא֞ך׀֌. קלאַס מיט די נושן ׀ון Dell R730xd E5-2650 v4 סעךוועךס וועךט 9000 עוךא֞ס ׀ֿאַך אַ ׀֌עני?

מקו׹: www.habr.com

לייגן אַ באַמעךקונג