Độ tin cậy của bộ nhớ flash: được mong đợi và bất ngờ. Phần 2. Hội nghị lần thứ XIV của hiệp hội USENIX. Công nghệ lưu trữ tập tin

Độ tin cậy của bộ nhớ flash: được mong đợi và bất ngờ. Phần 1. Hội nghị lần thứ XIV của hiệp hội USENIX. Công nghệ lưu trữ tập tin

4.2.2. RBER và tuổi đĩa (không bao gồm chu kỳ PE).

Hình 1 cho thấy mối tương quan đáng kể giữa RBER và độ tuổi, tức là số tháng đĩa đã ở hiện trường. Tuy nhiên, đây có thể là một mối tương quan giả vì có khả năng các ổ đĩa cũ hơn có nhiều PE hơn và do đó RBER tương quan nhiều hơn với các chu kỳ PE.

Để loại bỏ ảnh hưởng của tuổi tác đối với tình trạng hao mòn do chu kỳ PE gây ra, chúng tôi đã nhóm tất cả các tháng sử dụng vào các vùng chứa bằng cách sử dụng thập phân vị của phân bổ chu kỳ PE làm ranh giới giữa các vùng chứa, ví dụ: vùng chứa đầu tiên chứa tất cả các tháng trong vòng đời của đĩa cho đến hết thập phân vị đầu tiên của phân bố chu kỳ PE, v.v. Chúng tôi đã xác minh rằng trong mỗi vùng chứa, mối tương quan giữa chu kỳ PE và RBER là khá nhỏ (vì mỗi vùng chứa chỉ bao gồm một phạm vi nhỏ các chu kỳ PE), sau đó tính hệ số tương quan giữa RBER và tuổi đĩa riêng cho từng vùng chứa.

Chúng tôi đã thực hiện phân tích này riêng biệt cho từng kiểu máy vì mọi mối tương quan quan sát được không phải do sự khác biệt giữa kiểu máy trẻ hơn và kiểu cũ hơn mà chỉ do tuổi của các ổ đĩa của cùng một kiểu máy. Chúng tôi quan sát thấy rằng ngay cả sau khi hạn chế tác động của chu trình PE theo cách được mô tả ở trên, đối với tất cả các kiểu ổ đĩa vẫn có mối tương quan đáng kể giữa số tháng ổ đĩa đã hoạt động tại hiện trường và RBER của nó (hệ số tương quan dao động từ 0,2 đến 0,4 ).

Độ tin cậy của bộ nhớ flash: được mong đợi và bất ngờ. Phần 2. Hội nghị lần thứ XIV của hiệp hội USENIX. Công nghệ lưu trữ tập tin
Cơm. 3. Mối quan hệ giữa RBER và số chu kỳ PE của đĩa mới và cũ cho thấy tuổi của đĩa ảnh hưởng đến giá trị RBER bất kể số chu kỳ PE do hao mòn gây ra.

Chúng tôi cũng hình dung bằng đồ họa tác động của tuổi thọ ổ đĩa bằng cách chia số ngày sử dụng ổ đĩa ở độ tuổi “trẻ” lên đến 1 tuổi và số ngày sử dụng ổ đĩa ở độ tuổi trên 4 tuổi, sau đó vẽ biểu đồ RBER của mỗi nhóm so với số chu kỳ PE. Hình 3 thể hiện những kết quả này cho mô hình ổ đĩa MLC-D. Chúng tôi nhận thấy sự khác biệt đáng chú ý về giá trị RBER giữa nhóm đĩa cũ và mới trong tất cả các chu kỳ PE.

Từ đó, chúng tôi kết luận rằng độ tuổi, được đo bằng số ngày sử dụng đĩa tại hiện trường, có tác động đáng kể đến RBER, không phụ thuộc vào sự hao mòn của tế bào bộ nhớ do tiếp xúc với chu kỳ PE. Điều này có nghĩa là các yếu tố khác, chẳng hạn như sự lão hóa của silicon, đóng một vai trò lớn trong sự hao mòn vật lý của đĩa.

4.2.3. RBER và khối lượng công việc.

Lỗi bit được cho là do một trong bốn cơ chế gây ra:

  1. lỗi lưu trữ Lỗi lưu trữ, khi một ô nhớ mất dữ liệu theo thời gian
    Lỗi đọc bị xáo trộn, trong đó thao tác đọc làm hỏng nội dung của ô liền kề;
  2. Lỗi ghi làm xáo trộn, trong đó thao tác đọc làm hỏng nội dung của ô liền kề;
  3. Lỗi xóa không đầy đủ, khi thao tác xóa không xóa hoàn toàn nội dung của ô.

Các lỗi thuộc ba loại cuối cùng (rối loạn đọc, nhiễu loạn ghi, xóa không hoàn toàn) có liên quan đến khối lượng công việc, vì vậy việc hiểu được mối tương quan giữa RBER và khối lượng công việc giúp chúng ta hiểu được mức độ phổ biến của các cơ chế lỗi khác nhau. Trong một nghiên cứu gần đây, "Một nghiên cứu quy mô lớn về lỗi bộ nhớ flash tại hiện trường" (MEZA, J., WU, Q., KUMAR, S., MUTLU, O. "Một nghiên cứu quy mô lớn về lỗi bộ nhớ flash trong hiện trường." Trong Kỷ yếu của Hội nghị quốc tế ACM SIGMETRICS 2015 về Đo lường và Mô hình hóa Hệ thống Máy tính, New York, 2015, SIGMETRICS '15, ACM, trang 177–190) đã kết luận rằng lỗi lưu trữ chiếm ưu thế tại hiện trường, trong khi lỗi Đọc là khá nhỏ.

Hình 1 cho thấy mối quan hệ đáng kể giữa giá trị RBER trong một tháng nhất định của vòng đời ổ đĩa và số lần đọc, ghi và xóa trong cùng tháng đối với một số kiểu máy (ví dụ: hệ số tương quan cao hơn 0,2 đối với MLC - B mô hình và cao hơn 0,6 đối với SLC-B). Tuy nhiên, có thể đây là mối tương quan giả vì khối lượng công việc hàng tháng có thể liên quan đến tổng số chu kỳ PE.

Chúng tôi đã sử dụng phương pháp tương tự được mô tả trong Phần 4.2.2 để tách biệt tác động của khối lượng công việc khỏi tác động của chu kỳ PE bằng cách tách biệt các tháng vận hành ổ đĩa dựa trên các chu kỳ PE trước đó, sau đó xác định hệ số tương quan riêng cho từng vùng chứa.

Chúng tôi thấy rằng mối tương quan giữa số lần đọc trong một tháng nhất định của vòng đời ổ đĩa và giá trị RBER trong tháng đó vẫn tồn tại đối với các mô hình MLC-B và SLC-B, ngay cả khi giới hạn chu kỳ PE. Chúng tôi cũng lặp lại một phân tích tương tự trong đó chúng tôi loại trừ ảnh hưởng của số lần đọc đối với số lần ghi và xóa đồng thời, đồng thời kết luận rằng mối tương quan giữa RBER và số lần đọc đúng với mô hình SLC-B.

Hình 1 cũng cho thấy mối tương quan giữa RBER với các thao tác ghi và xóa, vì vậy chúng tôi lặp lại phân tích tương tự cho các thao tác đọc, ghi và xóa. Chúng tôi kết luận rằng bằng cách hạn chế tác động của chu kỳ PE và số lần đọc, không có mối quan hệ nào giữa giá trị RBER và số lần ghi và xóa.

Vì vậy, có những mô hình đĩa mà lỗi vi phạm về đọc có tác động đáng kể đến RBER. Mặt khác, không có bằng chứng nào cho thấy RBER bị ảnh hưởng bởi lỗi vi phạm ghi và lỗi xóa không đầy đủ.

4.2.4 RBER và in thạch bản.

Sự khác biệt về kích thước đối tượng có thể giải thích phần nào sự khác biệt về giá trị RBER giữa các mẫu ổ đĩa sử dụng cùng một công nghệ, tức là MLC hoặc SLC. (Xem Bảng 1 để biết tổng quan về kỹ thuật in thạch bản của các mô hình khác nhau có trong nghiên cứu này).

Ví dụ: 2 mẫu SLC với kỹ thuật in thạch bản 34nm (mẫu SLC-A và SLC-D) có RBER cao hơn một bậc so với 2 mẫu có kỹ thuật in thạch bản vi điện tử 50nm (mẫu SLC-B và SLC-C). Trong trường hợp của các mẫu MLC, chỉ có mẫu 43nm (MLC-B) có RBER trung bình cao hơn 50% so với 3 mẫu còn lại có công nghệ in thạch bản 50nm. Hơn nữa, sự khác biệt về RBER này tăng theo hệ số 4 khi các ổ đĩa bị hao mòn, như trong Hình 2. Cuối cùng, kỹ thuật in thạch bản mỏng hơn có thể giải thích RBER của ổ eMLC cao hơn so với ổ MLC. Nhìn chung, chúng tôi có bằng chứng rõ ràng rằng kỹ thuật in thạch bản ảnh hưởng đến RBER.

4.2.5. Sự hiện diện của các lỗi khác.

Chúng tôi đã điều tra mối quan hệ giữa RBER và các loại lỗi khác, chẳng hạn như lỗi không thể sửa được, lỗi hết thời gian chờ, v.v., đặc biệt là liệu giá trị RBER có cao hơn sau một tháng tiếp xúc với các loại lỗi khác hay không.

Hình 1 cho thấy mặc dù RBER của tháng trước mang tính dự đoán về các giá trị RBER trong tương lai (hệ số tương quan lớn hơn 0,8), nhưng không có mối tương quan đáng kể nào giữa các lỗi không thể sửa được và RBER (nhóm mục ngoài cùng bên phải trong Hình 1). Đối với các loại lỗi khác, hệ số tương quan thậm chí còn thấp hơn (không thể hiện trên hình). Chúng tôi đã khám phá thêm mối quan hệ giữa RBER và các lỗi không thể sửa được trong Phần 5.2 của bài viết này.

4.2.6. Ảnh hưởng của các yếu tố khác.

Chúng tôi đã tìm thấy bằng chứng cho thấy có những yếu tố có tác động đáng kể đến RBER mà dữ liệu của chúng tôi không thể giải thích được. Đặc biệt, chúng tôi nhận thấy rằng RBER cho một mẫu đĩa nhất định sẽ khác nhau tùy thuộc vào cụm mà đĩa được triển khai. Một ví dụ điển hình là Hình 4, hiển thị RBER là hàm của chu trình PE cho các ổ đĩa MLC-D trong ba cụm khác nhau (đường nét đứt) và so sánh nó với RBER cho mô hình này so với tổng số ổ đĩa (đường liền nét). Chúng tôi thấy rằng những khác biệt này vẫn tồn tại ngay cả khi chúng tôi hạn chế ảnh hưởng của các yếu tố như tuổi ổ đĩa hoặc số lần đọc.

Một lời giải thích khả dĩ cho điều này là sự khác biệt về loại khối lượng công việc giữa các cụm, vì chúng tôi quan sát thấy rằng các cụm có khối lượng công việc có tỷ lệ đọc/ghi cao nhất sẽ có RBER cao nhất.

Độ tin cậy của bộ nhớ flash: được mong đợi và bất ngờ. Phần 2. Hội nghị lần thứ XIV của hiệp hội USENIX. Công nghệ lưu trữ tập tin
Cơm. 4a), b). Giá trị RBER trung bình là hàm của chu kỳ PE cho ba cụm khác nhau và sự phụ thuộc của tỷ lệ đọc/ghi vào số chu kỳ PE cho ba cụm khác nhau.

Ví dụ: Hình 4(b) hiển thị tỷ lệ đọc/ghi của các cụm khác nhau cho mẫu ổ đĩa MLC-D. Tuy nhiên, tỷ lệ đọc/ghi không giải thích được sự khác biệt giữa các cụm trong tất cả các mô hình, do đó có thể có các yếu tố khác mà dữ liệu của chúng tôi không tính đến, chẳng hạn như yếu tố môi trường hoặc các tham số khối lượng công việc bên ngoài khác.

4.3. RBER trong quá trình thử nghiệm độ bền tăng tốc.

Hầu hết các công trình khoa học cũng như các thử nghiệm được thực hiện khi mua phương tiện ở quy mô công nghiệp đều dự đoán độ tin cậy của các thiết bị tại hiện trường dựa trên kết quả thử nghiệm độ bền cấp tốc. Chúng tôi quyết định tìm hiểu xem kết quả của những thử nghiệm như vậy có phù hợp với trải nghiệm thực tế khi vận hành phương tiện lưu trữ thể rắn hay không.
Phân tích kết quả thử nghiệm được thực hiện bằng phương pháp thử nghiệm tăng tốc chung dành cho thiết bị cung cấp cho trung tâm dữ liệu của Google cho thấy giá trị RBER tại hiện trường cao hơn đáng kể so với dự đoán. Ví dụ: đối với mô hình eMLC-a, RBER trung bình cho các đĩa hoạt động tại hiện trường (khi kết thúc thử nghiệm số chu kỳ PE đạt 600) là 1e-05, trong khi theo kết quả thử nghiệm tăng tốc sơ bộ, RBER này giá trị phải tương ứng với hơn 4000 chu kỳ PE. Điều này cho thấy rất khó để dự đoán chính xác giá trị RBER tại hiện trường dựa trên ước tính RBER thu được từ các thử nghiệm trong phòng thí nghiệm.

Chúng tôi cũng lưu ý rằng một số loại lỗi khá khó tái tạo trong quá trình thử nghiệm tăng tốc. Ví dụ, trong trường hợp của mô hình MLC-B, gần 60% ổ đĩa tại hiện trường gặp lỗi không thể sửa được và gần 80% ổ đĩa phát triển các khối xấu. Tuy nhiên, trong quá trình kiểm tra độ bền tăng tốc, không thiết bị nào trong số sáu thiết bị gặp phải bất kỳ lỗi không thể khắc phục nào cho đến khi ổ đĩa đạt hơn ba lần giới hạn chu kỳ PE. Đối với các mô hình eMLC, các lỗi không thể sửa được đã xảy ra ở hơn 80% ổ đĩa tại hiện trường, trong khi trong quá trình thử nghiệm tăng tốc, các lỗi này xảy ra sau khi đạt 15000 chu kỳ PE.

Chúng tôi cũng đã xem xét RBER được báo cáo trong công trình nghiên cứu trước đây dựa trên các thử nghiệm trong môi trường được kiểm soát và kết luận rằng phạm vi giá trị là vô cùng rộng. Ví dụ, L.M. Grupp và những người khác trong báo cáo công việc năm 2009 -2012 của họ về giá trị RBER cho các ổ đĩa gần đạt đến giới hạn chu kỳ PE. Ví dụ: đối với các thiết bị SLC và MLC có kích thước in thạch bản tương tự như kích thước được sử dụng trong nghiên cứu của chúng tôi (25-50nm), giá trị RBER nằm trong khoảng từ 1e-08 đến 1e-03, với hầu hết các kiểu ổ đĩa được thử nghiệm đều có giá trị RBER gần 1e- 06.

Trong nghiên cứu của chúng tôi, ba mô hình truyền động đạt đến giới hạn chu kỳ PE có RBER nằm trong khoảng từ 3e-08 đến 8e-08. Ngay cả khi tính đến việc con số của chúng tôi là giới hạn thấp hơn và có thể lớn hơn 16 lần trong trường hợp xấu nhất hoặc tính đến phân vị thứ 95 của RBER, giá trị của chúng tôi vẫn thấp hơn đáng kể.

Nhìn chung, mặc dù giá trị RBER hiện trường cao hơn giá trị dự đoán dựa trên thử nghiệm độ bền tăng tốc, nhưng chúng vẫn thấp hơn hầu hết RBER dành cho các thiết bị tương tự được báo cáo trong các tài liệu nghiên cứu khác và được tính toán từ các thử nghiệm trong phòng thí nghiệm. Điều này có nghĩa là bạn không nên dựa vào các giá trị RBER trường dự đoán được lấy từ thử nghiệm độ bền tăng tốc.

5. Lỗi không thể sửa được.

Do sự xuất hiện rộng rãi của các lỗi không thể sửa được (UE), đã được thảo luận trong Phần 3 của bài viết này, trong phần này chúng ta khám phá các đặc điểm của chúng một cách chi tiết hơn. Chúng tôi bắt đầu bằng cách thảo luận về số liệu nào sẽ sử dụng để đo UE, số liệu đó liên quan như thế nào đến RBER và UE bị ảnh hưởng như thế nào bởi các yếu tố khác nhau.

5.1. Tại sao tỷ lệ UBER không có ý nghĩa

Số liệu tiêu chuẩn mô tả các lỗi không thể sửa được là tỷ lệ lỗi bit không thể sửa được của UBER, nghĩa là tỷ lệ giữa số lỗi bit không thể sửa được trên tổng số bit được đọc.

Số liệu này ngầm giả định rằng số lỗi không thể sửa được bằng cách nào đó gắn liền với số bit được đọc và do đó phải được chuẩn hóa theo số này.

Giả định này có giá trị đối với các lỗi có thể sửa được, trong đó số lỗi quan sát được trong một tháng nhất định được cho là có mối tương quan cao với số lần đọc trong cùng khoảng thời gian (hệ số tương quan Spearman lớn hơn 0.9). Lý do cho mối tương quan chặt chẽ như vậy là ngay cả một bit xấu, miễn là nó có thể sửa được bằng ECC, sẽ tiếp tục tăng số lỗi với mỗi thao tác đọc được nó truy cập, vì việc đánh giá ô chứa bit xấu là không được sửa ngay lập tức khi phát hiện ra lỗi (đĩa chỉ ghi lại định kỳ các trang có bit bị hỏng).

Giả định tương tự không áp dụng cho các lỗi không thể sửa được. Một lỗi không thể sửa được sẽ ngăn cản việc sử dụng tiếp khối bị hỏng, vì vậy một khi được phát hiện, khối đó sẽ không ảnh hưởng đến số lượng lỗi trong tương lai.

Để chính thức xác nhận giả định này, chúng tôi đã sử dụng nhiều số liệu khác nhau để đo lường mối quan hệ giữa số lần đọc trong một tháng nhất định của vòng đời ổ đĩa và số lỗi không thể sửa được trong cùng một khoảng thời gian, bao gồm các hệ số tương quan khác nhau (Pearson, Spearman, Kendall) , cũng như kiểm tra trực quan các đồ thị . Ngoài số lượng lỗi không thể sửa được, chúng tôi cũng xem xét tần suất của các sự cố lỗi không thể sửa được (tức là xác suất một đĩa sẽ gặp ít nhất một sự cố như vậy trong một khoảng thời gian nhất định) và mối quan hệ của chúng với các thao tác đọc.
Chúng tôi không tìm thấy bằng chứng nào về mối tương quan giữa số lần đọc và số lỗi không thể sửa được. Đối với tất cả các kiểu ổ đĩa, hệ số tương quan đều dưới 0.02 và biểu đồ không hiển thị bất kỳ sự gia tăng nào về UE khi số lần đọc tăng lên.

Trong Phần 5.4 của bài viết này, chúng tôi thảo luận rằng các thao tác ghi và xóa cũng không liên quan đến các lỗi không thể sửa được, do đó, định nghĩa thay thế về UBER, được chuẩn hóa bằng các thao tác ghi hoặc xóa thay vì các thao tác đọc, không có ý nghĩa gì.

Do đó, chúng tôi kết luận rằng UBER không phải là một thước đo có ý nghĩa, có lẽ ngoại trừ khi được thử nghiệm trong môi trường được kiểm soát nơi số lần đọc do người thử nghiệm đặt ra. Nếu UBER được sử dụng làm thước đo trong quá trình thử nghiệm tại hiện trường, nó sẽ hạ thấp tỷ lệ lỗi một cách giả tạo đối với các ổ đĩa có số lần đọc cao và tăng tỷ lệ lỗi một cách giả tạo đối với các ổ đĩa có số lần đọc thấp, vì các lỗi không thể sửa được sẽ xảy ra bất kể số lần đọc.

5.2. Lỗi không thể sửa được và RBER.

Sự liên quan của RBER được giải thích bởi thực tế là nó đóng vai trò như một thước đo xác định độ tin cậy tổng thể của ổ đĩa, đặc biệt, dựa trên khả năng xảy ra các lỗi không thể sửa được. Trong công trình của mình, N. Mielke và cộng sự vào năm 2008 là những người đầu tiên đề xuất xác định tỷ lệ lỗi không thể sửa chữa dự kiến ​​là một hàm của RBER. Kể từ đó, nhiều nhà phát triển hệ thống đã sử dụng các phương pháp tương tự, chẳng hạn như ước tính tỷ lệ lỗi không thể sửa được dự kiến ​​như một hàm của loại RBER và ECC.

Mục đích của phần này là mô tả mức độ RBER dự đoán các lỗi không thể sửa được. Hãy bắt đầu với Hình 5a, vẽ biểu đồ RBER trung bình cho một số mẫu ổ đĩa thế hệ đầu tiên theo tỷ lệ phần trăm số ngày sử dụng chúng gặp phải lỗi UE không thể sửa được. Cần lưu ý rằng một số trong số 16 mô hình hiển thị trong biểu đồ không được đưa vào Bảng 1 do thiếu thông tin phân tích.

Độ tin cậy của bộ nhớ flash: được mong đợi và bất ngờ. Phần 2. Hội nghị lần thứ XIV của hiệp hội USENIX. Công nghệ lưu trữ tập tin
Cơm. 5a. Mối quan hệ giữa RBER trung bình và các lỗi không thể sửa được đối với các kiểu ổ đĩa khác nhau.

Độ tin cậy của bộ nhớ flash: được mong đợi và bất ngờ. Phần 2. Hội nghị lần thứ XIV của hiệp hội USENIX. Công nghệ lưu trữ tập tin
Cơm. 5b. Mối quan hệ giữa RBER trung bình và các lỗi không thể sửa được đối với các ổ đĩa khác nhau của cùng một kiểu máy.

Hãy nhớ lại rằng tất cả các mẫu trong cùng một thế hệ đều sử dụng cùng cơ chế ECC, do đó sự khác biệt giữa các mẫu không phụ thuộc vào sự khác biệt về ECC. Chúng tôi không thấy mối tương quan giữa sự cố RBER và UE. Chúng tôi đã tạo biểu đồ tương tự cho xác suất RBER phân vị thứ 95 so với UE và một lần nữa không thấy mối tương quan nào.

Tiếp theo, chúng tôi lặp lại phân tích ở mức độ chi tiết của từng đĩa riêng lẻ, tức là chúng tôi cố gắng tìm hiểu xem liệu có những đĩa có giá trị RBER cao hơn tương ứng với tần số UE cao hơn hay không. Ví dụ: Hình 5b vẽ biểu đồ RBER trung bình cho mỗi ổ đĩa của mô hình MLC-c so với số lượng UE (kết quả tương tự với kết quả thu được cho RBER phân vị thứ 95). Một lần nữa, chúng tôi không thấy bất kỳ mối tương quan nào giữa RBER và UE.

Cuối cùng, chúng tôi đã thực hiện phân tích thời gian chính xác hơn để kiểm tra xem số tháng hoạt động của các ổ đĩa có RBER cao hơn có tương ứng với các tháng xảy ra UE hay không. Hình 1 đã chỉ ra rằng hệ số tương quan giữa các lỗi không thể sửa được và RBER là rất thấp. Chúng tôi cũng đã thử nghiệm các cách khác nhau để vẽ xác suất của UE như một hàm của RBER và không tìm thấy bằng chứng nào về mối tương quan.

Vì vậy, chúng tôi kết luận rằng RBER là thước đo không đáng tin cậy để dự đoán UE. Điều này có thể có nghĩa là các cơ chế lỗi dẫn đến RBER khác với các cơ chế dẫn đến lỗi không thể sửa được (ví dụ: lỗi chứa trong từng ô riêng lẻ so với các sự cố lớn hơn xảy ra với toàn bộ thiết bị).

5.3. Những lỗi không thể sửa chữa và hao mòn.

Vì hao mòn là một trong những vấn đề chính của bộ nhớ flash, Hình 6 cho thấy xác suất hàng ngày của các lỗi ổ đĩa không thể sửa được là một hàm số của chu kỳ PE.

Độ tin cậy của bộ nhớ flash: được mong đợi và bất ngờ. Phần 2. Hội nghị lần thứ XIV của hiệp hội USENIX. Công nghệ lưu trữ tập tin
Hình 6. Xác suất hàng ngày xảy ra lỗi truyền động không thể sửa được tùy thuộc vào chu kỳ PE.

Chúng tôi lưu ý rằng xác suất của UE tăng liên tục theo tuổi của ổ đĩa. Tuy nhiên, giống như RBER, mức tăng chậm hơn so với giả định thường thấy: các biểu đồ cho thấy UE tăng trưởng tuyến tính chứ không phải theo cấp số nhân theo chu kỳ PE.

Hai kết luận mà chúng tôi đưa ra cho RBER cũng áp dụng cho các UE: thứ nhất, không có sự gia tăng rõ ràng về khả năng xảy ra lỗi khi đạt đến giới hạn chu kỳ PE, chẳng hạn như trong Hình 6 cho mô hình MLC-D có giới hạn chu kỳ PE là 3000. Thứ hai, Thứ hai , tỷ lệ lỗi khác nhau giữa các mô hình khác nhau, thậm chí trong cùng một lớp. Tuy nhiên, những khác biệt này không lớn bằng RBER.

Cuối cùng, để hỗ trợ cho những phát hiện của chúng tôi trong Phần 5.2, chúng tôi nhận thấy rằng trong một lớp mô hình duy nhất (MLC so với SLC), các mô hình có giá trị RBER thấp nhất cho một số chu kỳ PE nhất định không nhất thiết là những mô hình có giá trị RBER thấp nhất. xác suất xuất hiện của UE. Ví dụ: hơn 3000 chu kỳ PE, mô hình MLC-D có giá trị RBER thấp hơn 4 lần so với mô hình MLC-B, nhưng xác suất UE cho cùng số chu kỳ PE đối với mô hình MLC-D cao hơn một chút so với MLC-B các mô hình.

Độ tin cậy của bộ nhớ flash: được mong đợi và bất ngờ. Phần 2. Hội nghị lần thứ XIV của hiệp hội USENIX. Công nghệ lưu trữ tập tin
Hình 7. Xác suất hàng tháng xảy ra các lỗi ổ đĩa không thể sửa được là hàm số của sự hiện diện của các loại lỗi khác nhau trước đó.

5.4. Lỗi và khối lượng công việc không thể sửa chữa.

Vì những lý do tương tự mà khối lượng công việc có thể ảnh hưởng đến RBER (xem Phần 4.2.3), nó có thể cũng ảnh hưởng đến UE. Ví dụ: vì chúng tôi quan sát thấy rằng các lỗi vi phạm về đọc ảnh hưởng đến RBER nên các thao tác đọc cũng có thể làm tăng khả năng xảy ra các lỗi không thể sửa được.

Chúng tôi đã tiến hành một nghiên cứu chi tiết về tác động của khối lượng công việc đối với UE. Tuy nhiên, như đã lưu ý trong Phần 5.1, chúng tôi không tìm thấy mối quan hệ giữa UE và số lần đọc. Chúng tôi lặp lại phân tích tương tự cho các thao tác ghi và xóa và một lần nữa không thấy có mối tương quan nào.
Lưu ý rằng thoạt nhìn, điều này có vẻ mâu thuẫn với quan sát trước đây của chúng tôi rằng các lỗi không thể sửa được có tương quan với chu kỳ PE. Vì vậy, người ta có thể mong đợi một mối tương quan với số lượng thao tác ghi và xóa.

Tuy nhiên, trong phân tích của chúng tôi về tác động của chu kỳ PE, chúng tôi đã so sánh số lỗi không thể sửa được trong một tháng nhất định với tổng số chu kỳ PE mà ổ đĩa đã trải qua trong suốt vòng đời của nó cho đến nay để đo lường tác động của sự hao mòn. Khi nghiên cứu tác động của khối lượng công việc, chúng tôi đã xem xét những tháng hoạt động của ổ đĩa có số lượng thao tác đọc/ghi/xóa cao nhất trong một tháng cụ thể, cũng có khả năng gây ra lỗi không thể sửa chữa cao hơn, tức là chúng tôi đã không tính đến tính tổng số thao tác đọc/ghi/xóa.

Do đó, chúng tôi đi đến kết luận rằng lỗi vi phạm đọc, lỗi vi phạm viết và lỗi xóa không đầy đủ không phải là những yếu tố chính dẫn đến việc phát triển các lỗi không thể sửa được.

Cảm ơn bạn đã ở với chúng tôi. Bạn có thích bài viết của chúng tôi? Bạn muốn xem nội dung thú vị hơn? Hỗ trợ chúng tôi bằng cách đặt hàng hoặc giới thiệu cho bạn bè, Giảm giá 30% cho người dùng Habr trên một máy chủ tương tự duy nhất của máy chủ cấp đầu vào do chúng tôi phát minh ra dành cho bạn: Toàn bộ sự thật về VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps từ 20$ hay cách share server? (có sẵn với RAID1 và RAID10, tối đa 24 lõi và tối đa 40GB DDR4).

Dell R730xd rẻ gấp 2 lần? Chỉ ở đây 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV từ $199 ở Hà Lan! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - từ $99! Đọc về Làm thế nào để xây dựng cơ sở hạ tầng corp. đẳng cấp với việc sử dụng máy chủ Dell R730xd E5-2650 v4 trị giá 9000 euro cho một xu?

Nguồn: www.habr.com

Thêm một lời nhận xét