ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳು: ಡೇಟಾವನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಮತ್ತು ಅಗ್ಗವಾಗಿ ಹೇಗೆ ಸಂಗ್ರಹಿಸುವುದು ಎಂಬುದರ ಕುರಿತು ಸರಳ ಪದಗಳಲ್ಲಿ

ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳು: ಡೇಟಾವನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಮತ್ತು ಅಗ್ಗವಾಗಿ ಹೇಗೆ ಸಂಗ್ರಹಿಸುವುದು ಎಂಬುದರ ಕುರಿತು ಸರಳ ಪದಗಳಲ್ಲಿ

ಪುನರುಜ್ಜೀವನವು ಈ ರೀತಿ ಕಾಣುತ್ತದೆ

ಡೇಟಾ ಸಂಗ್ರಹಣೆಯ ವಿಶ್ವಾಸಾರ್ಹತೆಯನ್ನು ಹೆಚ್ಚಿಸಲು ಕಂಪ್ಯೂಟರ್ ಸಿಸ್ಟಮ್‌ಗಳಲ್ಲಿ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳನ್ನು ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ. Yandex ನಲ್ಲಿ ಅವುಗಳನ್ನು ಅನೇಕ ಯೋಜನೆಗಳಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ನಮ್ಮ ಆಂತರಿಕ ವಸ್ತು ಸಂಗ್ರಹಣೆಯಲ್ಲಿ ಪುನರಾವರ್ತನೆಯ ಬದಲಿಗೆ ಪುನರಾವರ್ತನೆ ಕೋಡ್‌ಗಳನ್ನು ಬಳಸುವುದರಿಂದ ವಿಶ್ವಾಸಾರ್ಹತೆಯನ್ನು ತ್ಯಾಗ ಮಾಡದೆ ಲಕ್ಷಾಂತರ ಉಳಿತಾಯವಾಗುತ್ತದೆ. ಆದರೆ ಅವುಗಳ ವ್ಯಾಪಕ ಬಳಕೆಯ ಹೊರತಾಗಿಯೂ, ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ ಎಂಬುದರ ಸ್ಪಷ್ಟ ವಿವರಣೆಗಳು ಬಹಳ ಅಪರೂಪ. ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಬಯಸುವವರು ಸರಿಸುಮಾರು ಈ ಕೆಳಗಿನವುಗಳನ್ನು ಎದುರಿಸುತ್ತಾರೆ (ಇಂದ ವಿಕಿಪೀಡಿಯ):

ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳು: ಡೇಟಾವನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಮತ್ತು ಅಗ್ಗವಾಗಿ ಹೇಗೆ ಸಂಗ್ರಹಿಸುವುದು ಎಂಬುದರ ಕುರಿತು ಸರಳ ಪದಗಳಲ್ಲಿ

ನನ್ನ ಹೆಸರು ವಾಡಿಮ್, ಯಾಂಡೆಕ್ಸ್‌ನಲ್ಲಿ ನಾನು ಆಂತರಿಕ ವಸ್ತು ಸಂಗ್ರಹಣೆ MDS ಅನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುತ್ತಿದ್ದೇನೆ. ಈ ಲೇಖನದಲ್ಲಿ, ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳ (ರೀಡ್-ಸೊಲೊಮನ್ ಮತ್ತು ಎಲ್‌ಆರ್‌ಸಿ ಕೋಡ್‌ಗಳು) ಸೈದ್ಧಾಂತಿಕ ಅಡಿಪಾಯವನ್ನು ನಾನು ಸರಳ ಪದಗಳಲ್ಲಿ ವಿವರಿಸುತ್ತೇನೆ. ಸಂಕೀರ್ಣ ಗಣಿತ ಮತ್ತು ಅಪರೂಪದ ಪದಗಳಿಲ್ಲದೆ ಅದು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಎಂದು ನಾನು ನಿಮಗೆ ಹೇಳುತ್ತೇನೆ. ಕೊನೆಯಲ್ಲಿ ನಾನು ಯಾಂಡೆಕ್ಸ್‌ನಲ್ಲಿ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳನ್ನು ಬಳಸುವ ಉದಾಹರಣೆಗಳನ್ನು ನೀಡುತ್ತೇನೆ.

ನಾನು ಹಲವಾರು ಗಣಿತದ ವಿವರಗಳನ್ನು ವಿವರವಾಗಿ ಪರಿಗಣಿಸುವುದಿಲ್ಲ, ಆದರೆ ಆಳವಾಗಿ ಧುಮುಕಲು ಬಯಸುವವರಿಗೆ ನಾನು ಲಿಂಕ್‌ಗಳನ್ನು ಒದಗಿಸುತ್ತೇನೆ. ಕೆಲವು ಗಣಿತದ ವ್ಯಾಖ್ಯಾನಗಳು ಕಟ್ಟುನಿಟ್ಟಾಗಿರಬಾರದು ಎಂದು ನಾನು ಗಮನಿಸುತ್ತೇನೆ, ಏಕೆಂದರೆ ಲೇಖನವು ಗಣಿತಜ್ಞರಿಗೆ ಉದ್ದೇಶಿಸಿಲ್ಲ, ಆದರೆ ಸಮಸ್ಯೆಯ ಸಾರವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಬಯಸುವ ಎಂಜಿನಿಯರ್‌ಗಳಿಗೆ.

* ಇಂಗ್ಲಿಷ್ ಭಾಷೆಯ ಸಾಹಿತ್ಯದಲ್ಲಿ, ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಅಳಿಸುವ ಸಂಕೇತಗಳು ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ.

1. ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳ ಸಾರ

ಎಲ್ಲಾ ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳ ಸಾರವು ತುಂಬಾ ಸರಳವಾಗಿದೆ: ದೋಷಗಳು ಸಂಭವಿಸಿದಾಗ (ಡಿಸ್ಕ್ ವೈಫಲ್ಯಗಳು, ಡೇಟಾ ವರ್ಗಾವಣೆ ದೋಷಗಳು, ಇತ್ಯಾದಿ) ನಷ್ಟವಾಗದಂತೆ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಿ (ಅಥವಾ ರವಾನಿಸಿ).

ಹೆಚ್ಚಿನ* ರಿಡಂಡನ್ಸಿ ಕೋಡ್‌ಗಳಲ್ಲಿ, ಡೇಟಾವನ್ನು n ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳಾಗಿ ವಿಂಗಡಿಸಲಾಗಿದೆ, ಇದಕ್ಕಾಗಿ ರಿಡಂಡನ್ಸಿ ಕೋಡ್‌ಗಳ m ಬ್ಲಾಕ್‌ಗಳನ್ನು ಎಣಿಸಲಾಗುತ್ತದೆ, ಇದು ಒಟ್ಟು n + m ಬ್ಲಾಕ್‌ಗಳಿಗೆ ಕಾರಣವಾಗುತ್ತದೆ. ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳನ್ನು n ಬ್ಲಾಕ್‌ಗಳ ಡೇಟಾವನ್ನು ಮರುಪಡೆಯಲು n + m ಬ್ಲಾಕ್‌ಗಳ ಒಂದು ಭಾಗವನ್ನು ಮಾತ್ರ ಬಳಸಿಕೊಂಡು ರಚಿಸಲಾಗಿದೆ. ಮುಂದೆ, ನಾವು ಬ್ಲಾಕ್ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳನ್ನು ಮಾತ್ರ ಪರಿಗಣಿಸುತ್ತೇವೆ, ಅಂದರೆ ಡೇಟಾವನ್ನು ಬ್ಲಾಕ್‌ಗಳಾಗಿ ವಿಂಗಡಿಸಲಾಗಿದೆ.

ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳು: ಡೇಟಾವನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಮತ್ತು ಅಗ್ಗವಾಗಿ ಹೇಗೆ ಸಂಗ್ರಹಿಸುವುದು ಎಂಬುದರ ಕುರಿತು ಸರಳ ಪದಗಳಲ್ಲಿ

ಎಲ್ಲಾ n ಬ್ಲಾಕ್‌ಗಳ ಡೇಟಾವನ್ನು ಮರುಪಡೆಯಲು, ನೀವು ಕನಿಷ್ಟ n + m ಬ್ಲಾಕ್‌ಗಳನ್ನು ಹೊಂದಿರಬೇಕು, ಏಕೆಂದರೆ ನೀವು n-1 ಬ್ಲಾಕ್ ಅನ್ನು ಮಾತ್ರ ಹೊಂದುವ ಮೂಲಕ n ಬ್ಲಾಕ್‌ಗಳನ್ನು ಪಡೆಯಲು ಸಾಧ್ಯವಿಲ್ಲ (ಈ ಸಂದರ್ಭದಲ್ಲಿ, ನೀವು 1 ಬ್ಲಾಕ್ ಅನ್ನು "ತೆಳುವಾಗಿ" ತೆಗೆದುಕೊಳ್ಳಬೇಕಾಗುತ್ತದೆ ಗಾಳಿ"). ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಮರುಪಡೆಯಲು n + m ಬ್ಲಾಕ್‌ಗಳ n ಯಾದೃಚ್ಛಿಕ ಬ್ಲಾಕ್‌ಗಳು ಸಾಕಾಗುತ್ತದೆಯೇ? ಇದು ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳ ಪ್ರಕಾರವನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ, ಉದಾಹರಣೆಗೆ, ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳು ಅನಿಯಂತ್ರಿತ n ಬ್ಲಾಕ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಮರುಪಡೆಯಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ, ಆದರೆ LRC ಪುನರುಕ್ತಿ ಕೋಡ್‌ಗಳು ಯಾವಾಗಲೂ ಇರುವುದಿಲ್ಲ.

ಡೇಟಾ ಸಂಗ್ರಹಣೆ

ಡೇಟಾ ಶೇಖರಣಾ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ, ನಿಯಮದಂತೆ, ಪ್ರತಿಯೊಂದು ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳು ಮತ್ತು ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಪ್ರತ್ಯೇಕ ಡಿಸ್ಕ್‌ಗೆ ಬರೆಯಲಾಗುತ್ತದೆ. ನಂತರ, ಅನಿಯಂತ್ರಿತ ಡಿಸ್ಕ್ ವಿಫಲವಾದಲ್ಲಿ, ಮೂಲ ಡೇಟಾವನ್ನು ಇನ್ನೂ ಮರುಸ್ಥಾಪಿಸಬಹುದು ಮತ್ತು ಓದಬಹುದು. ಒಂದೇ ಸಮಯದಲ್ಲಿ ಹಲವಾರು ಡಿಸ್ಕ್ಗಳು ​​ವಿಫಲವಾದರೂ ಡೇಟಾವನ್ನು ಮರುಪಡೆಯಬಹುದು.

ಡೇಟಾ ವರ್ಗಾವಣೆ

ವಿಶ್ವಾಸಾರ್ಹವಲ್ಲದ ನೆಟ್‌ವರ್ಕ್ ಮೂಲಕ ಡೇಟಾವನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ರವಾನಿಸಲು ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳನ್ನು ಬಳಸಬಹುದು. ರವಾನೆಯಾದ ಡೇಟಾವನ್ನು ಬ್ಲಾಕ್ಗಳಾಗಿ ವಿಂಗಡಿಸಲಾಗಿದೆ ಮತ್ತು ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳನ್ನು ಅವುಗಳಿಗೆ ಲೆಕ್ಕಹಾಕಲಾಗುತ್ತದೆ. ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳು ಮತ್ತು ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳು ಎರಡೂ ನೆಟ್‌ವರ್ಕ್‌ನಲ್ಲಿ ರವಾನೆಯಾಗುತ್ತವೆ. ಅನಿಯಂತ್ರಿತ ಬ್ಲಾಕ್‌ಗಳಲ್ಲಿ (ನಿರ್ದಿಷ್ಟ ಸಂಖ್ಯೆಯ ಬ್ಲಾಕ್‌ಗಳವರೆಗೆ) ದೋಷಗಳು ಸಂಭವಿಸಿದರೆ, ದೋಷವಿಲ್ಲದೆ ನೆಟ್‌ವರ್ಕ್‌ನಲ್ಲಿ ಡೇಟಾವನ್ನು ಇನ್ನೂ ರವಾನಿಸಬಹುದು. ಉದಾಹರಣೆಗೆ, ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳನ್ನು ಆಪ್ಟಿಕಲ್ ಕಮ್ಯುನಿಕೇಷನ್ ಲೈನ್‌ಗಳ ಮೂಲಕ ಮತ್ತು ಉಪಗ್ರಹ ಸಂವಹನಗಳಲ್ಲಿ ಡೇಟಾವನ್ನು ರವಾನಿಸಲು ಬಳಸಲಾಗುತ್ತದೆ.

* ಈಥರ್ನೆಟ್ ನೆಟ್‌ವರ್ಕ್‌ಗಳಲ್ಲಿ ಡೇಟಾ ಪ್ರಸರಣಕ್ಕಾಗಿ ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲಾಗುವ ಹ್ಯಾಮಿಂಗ್ ಕೋಡ್‌ಗಳು ಮತ್ತು ಸಿಆರ್‌ಸಿ ಕೋಡ್‌ಗಳಂತಹ ಡೇಟಾವನ್ನು ಬ್ಲಾಕ್‌ಗಳಾಗಿ ವಿಂಗಡಿಸದಿರುವ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳು ಸಹ ಇವೆ. ಇವು ದೋಷ-ಸರಿಪಡಿಸುವ ಕೋಡಿಂಗ್‌ಗಾಗಿ ಕೋಡ್‌ಗಳಾಗಿವೆ, ಅವುಗಳನ್ನು ದೋಷಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ ಮತ್ತು ಅವುಗಳನ್ನು ಸರಿಪಡಿಸಲು ಅಲ್ಲ (ಹ್ಯಾಮಿಂಗ್ ಕೋಡ್ ದೋಷಗಳ ಭಾಗಶಃ ತಿದ್ದುಪಡಿಯನ್ನು ಸಹ ಅನುಮತಿಸುತ್ತದೆ).

2. ರೀಡ್-ಸೊಲೊಮನ್ ಸಂಕೇತಗಳು

ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳು ಹೆಚ್ಚು ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲಾಗುವ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ, ಇದನ್ನು 1960 ರ ದಶಕದಲ್ಲಿ ಕಂಡುಹಿಡಿಯಲಾಯಿತು ಮತ್ತು ಕಾಂಪ್ಯಾಕ್ಟ್ ಡಿಸ್ಕ್‌ಗಳ ಸಾಮೂಹಿಕ ಉತ್ಪಾದನೆಗೆ 1980 ರ ದಶಕದಲ್ಲಿ ಮೊದಲ ಬಾರಿಗೆ ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲಾಯಿತು.

ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಎರಡು ಪ್ರಮುಖ ಪ್ರಶ್ನೆಗಳಿವೆ: 1) ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಹೇಗೆ ರಚಿಸುವುದು; 2) ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಡೇಟಾವನ್ನು ಮರುಪಡೆಯುವುದು ಹೇಗೆ. ಅವುಗಳಿಗೆ ಉತ್ತರಗಳನ್ನು ಹುಡುಕೋಣ.
ಸರಳತೆಗಾಗಿ, ನಾವು ಮುಂದೆ n=6 ಮತ್ತು m=4 ಎಂದು ಭಾವಿಸುತ್ತೇವೆ. ಇತರ ಯೋಜನೆಗಳನ್ನು ಸಾದೃಶ್ಯದಿಂದ ಪರಿಗಣಿಸಲಾಗುತ್ತದೆ.

ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಹೇಗೆ ರಚಿಸುವುದು

ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳ ಪ್ರತಿಯೊಂದು ಬ್ಲಾಕ್ ಅನ್ನು ಇತರರಿಂದ ಸ್ವತಂತ್ರವಾಗಿ ಎಣಿಸಲಾಗುತ್ತದೆ. ಪ್ರತಿ ಬ್ಲಾಕ್ ಅನ್ನು ಎಣಿಸಲು ಎಲ್ಲಾ n ಡೇಟಾ ಬ್ಲಾಕ್ಗಳನ್ನು ಬಳಸಲಾಗುತ್ತದೆ. ಕೆಳಗಿನ ರೇಖಾಚಿತ್ರದಲ್ಲಿ, X1-X6 ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳು, P1-P4 ಪುನರಾವರ್ತನೆ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳಾಗಿವೆ.

ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳು: ಡೇಟಾವನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಮತ್ತು ಅಗ್ಗವಾಗಿ ಹೇಗೆ ಸಂಗ್ರಹಿಸುವುದು ಎಂಬುದರ ಕುರಿತು ಸರಳ ಪದಗಳಲ್ಲಿ

ಎಲ್ಲಾ ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳು ಒಂದೇ ಗಾತ್ರದಲ್ಲಿರಬೇಕು ಮತ್ತು ಜೋಡಣೆಗಾಗಿ ಶೂನ್ಯ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸಬಹುದು. ಪರಿಣಾಮವಾಗಿ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳು ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳ ಗಾತ್ರದಂತೆಯೇ ಇರುತ್ತದೆ. ಎಲ್ಲಾ ಡೇಟಾ ಬ್ಲಾಕ್ಗಳನ್ನು ಪದಗಳಾಗಿ ವಿಂಗಡಿಸಲಾಗಿದೆ (ಉದಾಹರಣೆಗೆ, 16 ಬಿಟ್ಗಳು). ನಾವು ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಕೆ ಪದಗಳಾಗಿ ವಿಭಜಿಸಿದ್ದೇವೆ ಎಂದು ಹೇಳೋಣ. ನಂತರ ಎಲ್ಲಾ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳನ್ನು ಸಹ k ಪದಗಳಾಗಿ ವಿಂಗಡಿಸಲಾಗುತ್ತದೆ.

ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳು: ಡೇಟಾವನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಮತ್ತು ಅಗ್ಗವಾಗಿ ಹೇಗೆ ಸಂಗ್ರಹಿಸುವುದು ಎಂಬುದರ ಕುರಿತು ಸರಳ ಪದಗಳಲ್ಲಿ

ಪ್ರತಿ ರಿಡಂಡೆನ್ಸಿ ಬ್ಲಾಕ್‌ನ i-th ಪದವನ್ನು ಎಣಿಸಲು, ಎಲ್ಲಾ ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳ i-th ಪದಗಳನ್ನು ಬಳಸಲಾಗುತ್ತದೆ. ಕೆಳಗಿನ ಸೂತ್ರದ ಪ್ರಕಾರ ಅವುಗಳನ್ನು ಲೆಕ್ಕಹಾಕಲಾಗುತ್ತದೆ:

ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳು: ಡೇಟಾವನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಮತ್ತು ಅಗ್ಗವಾಗಿ ಹೇಗೆ ಸಂಗ್ರಹಿಸುವುದು ಎಂಬುದರ ಕುರಿತು ಸರಳ ಪದಗಳಲ್ಲಿ

ಇಲ್ಲಿ ಮೌಲ್ಯಗಳು x ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳ ಪದಗಳು, p ಎಂಬುದು ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳ ಪದಗಳು, ಎಲ್ಲಾ ಆಲ್ಫಾ, ಬೀಟಾ, ಗಾಮಾ ಮತ್ತು ಡೆಲ್ಟಾಗಳು ವಿಶೇಷವಾಗಿ ಆಯ್ಕೆ ಮಾಡಲಾದ ಸಂಖ್ಯೆಗಳು ಎಲ್ಲಾ i ಗೆ ಒಂದೇ ಆಗಿರುತ್ತವೆ. ಈ ಎಲ್ಲಾ ಮೌಲ್ಯಗಳು ಸಾಮಾನ್ಯ ಸಂಖ್ಯೆಗಳಲ್ಲ, ಆದರೆ ಗಲೋಯಿಸ್ ಕ್ಷೇತ್ರದ ಅಂಶಗಳು ಎಂದು ಈಗಿನಿಂದಲೇ ಹೇಳಬೇಕು; ಕಾರ್ಯಾಚರಣೆಗಳು +, -, *, / ನಮಗೆಲ್ಲ ಪರಿಚಿತವಾಗಿರುವ ಕಾರ್ಯಾಚರಣೆಗಳಲ್ಲ, ಆದರೆ ಗಲೋಯಿಸ್ ಅಂಶಗಳ ಮೇಲೆ ಪರಿಚಯಿಸಲಾದ ವಿಶೇಷ ಕಾರ್ಯಾಚರಣೆಗಳು ಕ್ಷೇತ್ರ.

ಗಲೋಯಿಸ್ ಕ್ಷೇತ್ರಗಳು ಏಕೆ ಬೇಕು?

ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳು: ಡೇಟಾವನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಮತ್ತು ಅಗ್ಗವಾಗಿ ಹೇಗೆ ಸಂಗ್ರಹಿಸುವುದು ಎಂಬುದರ ಕುರಿತು ಸರಳ ಪದಗಳಲ್ಲಿ

ಎಲ್ಲವೂ ಸರಳವಾಗಿದೆ ಎಂದು ತೋರುತ್ತದೆ: ನಾವು ಡೇಟಾವನ್ನು ಬ್ಲಾಕ್‌ಗಳಾಗಿ, ಬ್ಲಾಕ್‌ಗಳನ್ನು ಪದಗಳಾಗಿ ವಿಂಗಡಿಸುತ್ತೇವೆ, ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳ ಪದಗಳನ್ನು ಬಳಸಿಕೊಂಡು ನಾವು ಪುನರುಕ್ತಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳ ಪದಗಳನ್ನು ಎಣಿಸುತ್ತೇವೆ - ನಾವು ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಪಡೆಯುತ್ತೇವೆ. ಸಾಮಾನ್ಯವಾಗಿ ಇದು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ, ಆದರೆ ದೆವ್ವವು ವಿವರಗಳಲ್ಲಿದೆ:

  1. ಮೇಲೆ ಹೇಳಿದಂತೆ, ಪದದ ಗಾತ್ರವನ್ನು ನಿಗದಿಪಡಿಸಲಾಗಿದೆ, ನಮ್ಮ ಉದಾಹರಣೆಯಲ್ಲಿ 16 ಬಿಟ್‌ಗಳು. ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳಿಗೆ ಮೇಲಿನ ಸೂತ್ರಗಳು ಸಾಮಾನ್ಯ ಪೂರ್ಣಾಂಕಗಳನ್ನು ಬಳಸುವಾಗ, p ಲೆಕ್ಕಾಚಾರದ ಫಲಿತಾಂಶವು ಮಾನ್ಯ ಗಾತ್ರದ ಪದವನ್ನು ಬಳಸಿಕೊಂಡು ಪ್ರತಿನಿಧಿಸುವುದಿಲ್ಲ.
  2. ಡೇಟಾವನ್ನು ಮರುಪಡೆಯುವಾಗ, ಮೇಲಿನ ಸೂತ್ರಗಳನ್ನು ಸಮೀಕರಣಗಳ ವ್ಯವಸ್ಥೆಯಾಗಿ ಪರಿಗಣಿಸಲಾಗುತ್ತದೆ, ಅದು ಡೇಟಾವನ್ನು ಮರುಪಡೆಯಲು ಪರಿಹರಿಸಬೇಕು. ಪರಿಹಾರ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ, ಪೂರ್ಣಾಂಕಗಳನ್ನು ಪರಸ್ಪರ ವಿಭಜಿಸುವುದು ಅಗತ್ಯವಾಗಬಹುದು, ಇದು ಕಂಪ್ಯೂಟರ್ ಮೆಮೊರಿಯಲ್ಲಿ ನಿಖರವಾಗಿ ಪ್ರತಿನಿಧಿಸಲಾಗದ ನೈಜ ಸಂಖ್ಯೆಯನ್ನು ಉಂಟುಮಾಡುತ್ತದೆ.

ಈ ಸಮಸ್ಯೆಗಳು ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳಿಗೆ ಪೂರ್ಣಾಂಕಗಳ ಬಳಕೆಯನ್ನು ತಡೆಯುತ್ತವೆ. ಸಮಸ್ಯೆಗೆ ಪರಿಹಾರವು ಮೂಲವಾಗಿದೆ, ಇದನ್ನು ಈ ಕೆಳಗಿನಂತೆ ವಿವರಿಸಬಹುದು: ಅಗತ್ಯವಿರುವ ಉದ್ದದ ಪದಗಳನ್ನು (ಉದಾಹರಣೆಗೆ, 16 ಬಿಟ್‌ಗಳು) ಬಳಸಿ ಪ್ರತಿನಿಧಿಸಬಹುದಾದ ವಿಶೇಷ ಸಂಖ್ಯೆಗಳೊಂದಿಗೆ ಬರೋಣ ಮತ್ತು ಎಲ್ಲಾ ಕಾರ್ಯಾಚರಣೆಗಳನ್ನು ನಿರ್ವಹಿಸುವ ಫಲಿತಾಂಶ (ಸೇರ್ಪಡೆ , ವ್ಯವಕಲನ, ಗುಣಾಕಾರ, ಭಾಗಾಕಾರ) ಅಗತ್ಯವಿರುವ ಉದ್ದದ ಪದಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಕಂಪ್ಯೂಟರ್ ಮೆಮೊರಿಯಲ್ಲಿ ಸಹ ಪ್ರಸ್ತುತಪಡಿಸಲಾಗುತ್ತದೆ.

ಅಂತಹ "ವಿಶೇಷ" ಸಂಖ್ಯೆಗಳನ್ನು ಗಣಿತಶಾಸ್ತ್ರದಿಂದ ದೀರ್ಘಕಾಲದವರೆಗೆ ಅಧ್ಯಯನ ಮಾಡಲಾಗಿದೆ; ಅವುಗಳನ್ನು ಕ್ಷೇತ್ರಗಳು ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಕ್ಷೇತ್ರವು ಸಂಕಲನ, ವ್ಯವಕಲನ, ಗುಣಾಕಾರ ಮತ್ತು ವಿಭಜನೆಯ ಕಾರ್ಯಾಚರಣೆಗಳನ್ನು ಹೊಂದಿರುವ ಅಂಶಗಳ ಗುಂಪಾಗಿದೆ.

ಗ್ಯಾಲೋಯಿಸ್* ಕ್ಷೇತ್ರಗಳು ಕ್ಷೇತ್ರದ ಯಾವುದೇ ಎರಡು ಅಂಶಗಳಿಗೆ ಪ್ರತಿ ಕಾರ್ಯಾಚರಣೆಯ (+, -, *, /) ವಿಶಿಷ್ಟ ಫಲಿತಾಂಶವನ್ನು ಹೊಂದಿರುವ ಕ್ಷೇತ್ರಗಳಾಗಿವೆ. ಗಲೋಯಿಸ್ ಕ್ಷೇತ್ರಗಳನ್ನು 2: 2, 4, 8, 16, ಇತ್ಯಾದಿಗಳ ಶಕ್ತಿಗಳಾದ ಸಂಖ್ಯೆಗಳಿಗೆ ನಿರ್ಮಿಸಬಹುದು (ವಾಸ್ತವವಾಗಿ ಯಾವುದೇ ಅವಿಭಾಜ್ಯ ಸಂಖ್ಯೆ p ಯ ಶಕ್ತಿಗಳು, ಆದರೆ ಪ್ರಾಯೋಗಿಕವಾಗಿ ನಾವು 2 ರ ಶಕ್ತಿಗಳಲ್ಲಿ ಮಾತ್ರ ಆಸಕ್ತಿ ಹೊಂದಿದ್ದೇವೆ). ಉದಾಹರಣೆಗೆ, 16-ಬಿಟ್ ಪದಗಳಿಗಾಗಿ, ಇದು 65 ಅಂಶಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ಕ್ಷೇತ್ರವಾಗಿದೆ, ಪ್ರತಿ ಜೋಡಿಗೆ ನೀವು ಯಾವುದೇ ಕಾರ್ಯಾಚರಣೆಯ ಫಲಿತಾಂಶವನ್ನು ಕಂಡುಹಿಡಿಯಬಹುದು (+, -, *, /). ಮೇಲಿನ ಸಮೀಕರಣಗಳಿಂದ x, p, ಆಲ್ಫಾ, ಬೀಟಾ, ಗಾಮಾ, ಡೆಲ್ಟಾದ ಮೌಲ್ಯಗಳನ್ನು ಲೆಕ್ಕಾಚಾರಗಳಿಗಾಗಿ ಗಲೋಯಿಸ್ ಕ್ಷೇತ್ರದ ಅಂಶಗಳಾಗಿ ಪರಿಗಣಿಸಲಾಗುತ್ತದೆ.

ಹೀಗಾಗಿ, ನಾವು ಸಮೀಕರಣಗಳ ವ್ಯವಸ್ಥೆಯನ್ನು ಹೊಂದಿದ್ದೇವೆ, ಅದರೊಂದಿಗೆ ನಾವು ಸೂಕ್ತವಾದ ಕಂಪ್ಯೂಟರ್ ಪ್ರೋಗ್ರಾಂ ಅನ್ನು ಬರೆಯುವ ಮೂಲಕ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ಗಳ ಬ್ಲಾಕ್ಗಳನ್ನು ರಚಿಸಬಹುದು. ಸಮೀಕರಣಗಳ ಅದೇ ವ್ಯವಸ್ಥೆಯನ್ನು ಬಳಸಿಕೊಂಡು, ನೀವು ಡೇಟಾ ಮರುಪಡೆಯುವಿಕೆ ಮಾಡಬಹುದು.

* ಇದು ಕಟ್ಟುನಿಟ್ಟಾದ ವ್ಯಾಖ್ಯಾನವಲ್ಲ, ಬದಲಿಗೆ ವಿವರಣೆಯಾಗಿದೆ.

ಡೇಟಾವನ್ನು ಮರುಪಡೆಯುವುದು ಹೇಗೆ

ಕೆಲವು n + m ಬ್ಲಾಕ್‌ಗಳು ಕಾಣೆಯಾದಾಗ ಮರುಸ್ಥಾಪನೆಯ ಅಗತ್ಯವಿದೆ. ಇವು ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳು ಮತ್ತು ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳಾಗಿರಬಹುದು. ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳು ಮತ್ತು/ಅಥವಾ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳ ಅನುಪಸ್ಥಿತಿಯು ಮೇಲಿನ ಸಮೀಕರಣಗಳಲ್ಲಿ ಅನುಗುಣವಾದ x ಮತ್ತು/ಅಥವಾ p ವೇರಿಯಬಲ್‌ಗಳು ತಿಳಿದಿಲ್ಲ ಎಂದು ಅರ್ಥ.

ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳ ಸಮೀಕರಣಗಳನ್ನು ಸಮೀಕರಣಗಳ ವ್ಯವಸ್ಥೆಯಾಗಿ ನೋಡಬಹುದು, ಇದರಲ್ಲಿ ಎಲ್ಲಾ ಆಲ್ಫಾ, ಬೀಟಾ, ಗಾಮಾ, ಡೆಲ್ಟಾ ಮೌಲ್ಯಗಳು ಸ್ಥಿರವಾಗಿರುತ್ತವೆ, ಲಭ್ಯವಿರುವ ಬ್ಲಾಕ್‌ಗಳಿಗೆ ಅನುಗುಣವಾದ ಎಲ್ಲಾ x ಮತ್ತು p ಗಳು ತಿಳಿದಿರುವ ಅಸ್ಥಿರಗಳು ಮತ್ತು ಉಳಿದ x ಮತ್ತು p ತಿಳಿದಿಲ್ಲ.

ಉದಾಹರಣೆಗೆ, ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳು 1, 2, 3 ಮತ್ತು ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್ 2 ಲಭ್ಯವಿಲ್ಲ, ನಂತರ i-th ಗುಂಪಿನ ಪದಗಳಿಗೆ ಈ ಕೆಳಗಿನ ಸಮೀಕರಣಗಳ ವ್ಯವಸ್ಥೆ ಇರುತ್ತದೆ (ಅಜ್ಞಾತವನ್ನು ಕೆಂಪು ಬಣ್ಣದಲ್ಲಿ ಗುರುತಿಸಲಾಗಿದೆ):

ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳು: ಡೇಟಾವನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಮತ್ತು ಅಗ್ಗವಾಗಿ ಹೇಗೆ ಸಂಗ್ರಹಿಸುವುದು ಎಂಬುದರ ಕುರಿತು ಸರಳ ಪದಗಳಲ್ಲಿ

ನಾವು 4 ಅಪರಿಚಿತರೊಂದಿಗೆ 4 ಸಮೀಕರಣಗಳ ವ್ಯವಸ್ಥೆಯನ್ನು ಹೊಂದಿದ್ದೇವೆ, ಅಂದರೆ ನಾವು ಅದನ್ನು ಪರಿಹರಿಸಬಹುದು ಮತ್ತು ಡೇಟಾವನ್ನು ಮರುಸ್ಥಾಪಿಸಬಹುದು!

ಈ ಸಮೀಕರಣಗಳ ವ್ಯವಸ್ಥೆಯಿಂದ ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳಿಗೆ (n ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳು, m ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳು) ಡೇಟಾ ಮರುಪಡೆಯುವಿಕೆ ಕುರಿತು ಹಲವಾರು ತೀರ್ಮಾನಗಳು ಅನುಸರಿಸುತ್ತವೆ:

  • ಯಾವುದೇ m ಬ್ಲಾಕ್‌ಗಳು ಅಥವಾ ಕಡಿಮೆಯಾದರೆ ಡೇಟಾವನ್ನು ಮರುಪಡೆಯಬಹುದು. m+1 ಅಥವಾ ಹೆಚ್ಚಿನ ಬ್ಲಾಕ್‌ಗಳು ಕಳೆದುಹೋದರೆ, ಡೇಟಾವನ್ನು ಮರುಸ್ಥಾಪಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ: m + 1 ಅಪರಿಚಿತರೊಂದಿಗೆ m ಸಮೀಕರಣಗಳ ವ್ಯವಸ್ಥೆಯನ್ನು ಪರಿಹರಿಸುವುದು ಅಸಾಧ್ಯ.
  • ಒಂದು ಡೇಟಾ ಬ್ಲಾಕ್ ಅನ್ನು ಸಹ ಮರುಪಡೆಯಲು, ನೀವು ಉಳಿದಿರುವ ಬ್ಲಾಕ್‌ಗಳಲ್ಲಿ ಯಾವುದೇ n ಅನ್ನು ಬಳಸಬೇಕಾಗುತ್ತದೆ ಮತ್ತು ನೀವು ಯಾವುದೇ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳನ್ನು ಬಳಸಬಹುದು.

ಬೇರೆ ಏನು ನೀವು ತಿಳಿಯಬೇಕು

ಮೇಲಿನ ವಿವರಣೆಯಲ್ಲಿ, ಪರಿಗಣಿಸಲು ಗಣಿತದ ಆಳವಾದ ಡೈವ್ ಅಗತ್ಯವಿರುವ ಹಲವಾರು ಪ್ರಮುಖ ಸಮಸ್ಯೆಗಳನ್ನು ನಾನು ತಪ್ಪಿಸುತ್ತೇನೆ. ನಿರ್ದಿಷ್ಟವಾಗಿ, ನಾನು ಈ ಕೆಳಗಿನವುಗಳ ಬಗ್ಗೆ ಏನನ್ನೂ ಹೇಳುವುದಿಲ್ಲ:

  • ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳ ಸಮೀಕರಣಗಳ ವ್ಯವಸ್ಥೆಯು ಯಾವುದೇ ಅಪರಿಚಿತರ ಸಂಯೋಜನೆಗೆ (ಅನನ್ಯ) ಪರಿಹಾರವನ್ನು ಹೊಂದಿರಬೇಕು (m ಅಜ್ಞಾತಗಳಿಗಿಂತ ಹೆಚ್ಚಿಲ್ಲ). ಈ ಅವಶ್ಯಕತೆಯ ಆಧಾರದ ಮೇಲೆ, ಆಲ್ಫಾ, ಬೀಟಾ, ಗಾಮಾ ಮತ್ತು ಡೆಲ್ಟಾದ ಮೌಲ್ಯಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲಾಗುತ್ತದೆ.
  • ಸಮೀಕರಣಗಳ ವ್ಯವಸ್ಥೆಯನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನಿರ್ಮಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ (ಯಾವ ಬ್ಲಾಕ್‌ಗಳು ಲಭ್ಯವಿಲ್ಲ ಎಂಬುದನ್ನು ಅವಲಂಬಿಸಿ) ಮತ್ತು ಪರಿಹರಿಸಬೇಕು.
  • ನಾವು ಗಲೋಯಿಸ್ ಕ್ಷೇತ್ರವನ್ನು ನಿರ್ಮಿಸಬೇಕಾಗಿದೆ: ನಿರ್ದಿಷ್ಟ ಪದದ ಗಾತ್ರಕ್ಕಾಗಿ, ಯಾವುದೇ ಎರಡು ಅಂಶಗಳಿಗೆ ಯಾವುದೇ ಕಾರ್ಯಾಚರಣೆಯ (+, -, *, /) ಫಲಿತಾಂಶವನ್ನು ಕಂಡುಹಿಡಿಯಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ.

ಲೇಖನದ ಕೊನೆಯಲ್ಲಿ ಈ ಪ್ರಮುಖ ವಿಷಯಗಳ ಬಗ್ಗೆ ಸಾಹಿತ್ಯದ ಉಲ್ಲೇಖಗಳಿವೆ.

n ಮತ್ತು m ನ ಆಯ್ಕೆ

ಆಚರಣೆಯಲ್ಲಿ n ಮತ್ತು m ಅನ್ನು ಹೇಗೆ ಆಯ್ಕೆ ಮಾಡುವುದು? ಪ್ರಾಯೋಗಿಕವಾಗಿ, ಡೇಟಾ ಸಂಗ್ರಹಣಾ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ, ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳನ್ನು ಜಾಗವನ್ನು ಉಳಿಸಲು ಬಳಸಲಾಗುತ್ತದೆ, ಆದ್ದರಿಂದ m ಅನ್ನು ಯಾವಾಗಲೂ n ಗಿಂತ ಕಡಿಮೆ ಆಯ್ಕೆ ಮಾಡಲಾಗುತ್ತದೆ. ಅವುಗಳ ನಿರ್ದಿಷ್ಟ ಮೌಲ್ಯಗಳು ಹಲವಾರು ಅಂಶಗಳನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ, ಅವುಗಳೆಂದರೆ:

  • ಡೇಟಾ ಸಂಗ್ರಹಣೆಯ ವಿಶ್ವಾಸಾರ್ಹತೆ. ದೊಡ್ಡ m, ಹೆಚ್ಚಿನ ಸಂಖ್ಯೆಯ ಡಿಸ್ಕ್ ವೈಫಲ್ಯಗಳು ಉಳಿದುಕೊಳ್ಳಬಹುದು, ಅಂದರೆ, ಹೆಚ್ಚಿನ ವಿಶ್ವಾಸಾರ್ಹತೆ.
  • ಅನಗತ್ಯ ಸಂಗ್ರಹಣೆ. m/n ಅನುಪಾತವು ಹೆಚ್ಚಾದಷ್ಟೂ ಶೇಖರಣಾ ಪುನರಾವರ್ತನೆಯು ಅಧಿಕವಾಗಿರುತ್ತದೆ ಮತ್ತು ಸಿಸ್ಟಮ್ ಹೆಚ್ಚು ದುಬಾರಿಯಾಗಿರುತ್ತದೆ.
  • ಪ್ರಕ್ರಿಯೆಯ ಸಮಯವನ್ನು ವಿನಂತಿಸಿ. n + m ಮೊತ್ತವು ದೊಡ್ಡದಾಗಿದೆ, ವಿನಂತಿಗಳಿಗೆ ಪ್ರತಿಕ್ರಿಯೆ ಸಮಯವು ದೀರ್ಘವಾಗಿರುತ್ತದೆ. ಓದುವ ಡೇಟಾವನ್ನು (ಮರುಪ್ರಾಪ್ತಿಯ ಸಮಯದಲ್ಲಿ) n ವಿವಿಧ ಡಿಸ್ಕ್‌ಗಳಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾದ n ಬ್ಲಾಕ್‌ಗಳನ್ನು ಓದುವ ಅಗತ್ಯವಿರುವುದರಿಂದ, ಓದುವ ಸಮಯವನ್ನು ನಿಧಾನವಾದ ಡಿಸ್ಕ್‌ನಿಂದ ನಿರ್ಧರಿಸಲಾಗುತ್ತದೆ.

ಹೆಚ್ಚುವರಿಯಾಗಿ, ಹಲವಾರು DC ಗಳಲ್ಲಿ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವುದು n ಮತ್ತು m ನ ಆಯ್ಕೆಯ ಮೇಲೆ ಹೆಚ್ಚುವರಿ ನಿರ್ಬಂಧಗಳನ್ನು ವಿಧಿಸುತ್ತದೆ: 1 DC ಅನ್ನು ಆಫ್ ಮಾಡಿದರೆ, ಡೇಟಾ ಇನ್ನೂ ಓದಲು ಲಭ್ಯವಿರಬೇಕು. ಉದಾಹರಣೆಗೆ, 3 DC ಗಳಲ್ಲಿ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವಾಗ, ಈ ಕೆಳಗಿನ ಷರತ್ತುಗಳನ್ನು ಪೂರೈಸಬೇಕು: m >= n/2, ಇಲ್ಲದಿದ್ದರೆ 1 DC ಅನ್ನು ಆಫ್ ಮಾಡಿದಾಗ ಓದಲು ಡೇಟಾ ಲಭ್ಯವಿಲ್ಲದ ಪರಿಸ್ಥಿತಿ ಇರಬಹುದು.

3. LRC - ಸ್ಥಳೀಯ ಪುನರ್ನಿರ್ಮಾಣ ಸಂಕೇತಗಳು

ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಡೇಟಾವನ್ನು ಮರುಪಡೆಯಲು, ನೀವು n ಅನಿಯಂತ್ರಿತ ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಬಳಸಬೇಕಾಗುತ್ತದೆ. ವಿತರಿಸಲಾದ ಡೇಟಾ ಶೇಖರಣಾ ವ್ಯವಸ್ಥೆಗಳಿಗೆ ಇದು ಬಹಳ ಗಮನಾರ್ಹವಾದ ಅನನುಕೂಲವಾಗಿದೆ, ಏಕೆಂದರೆ ಒಂದು ಮುರಿದ ಡಿಸ್ಕ್ನಲ್ಲಿ ಡೇಟಾವನ್ನು ಪುನಃಸ್ಥಾಪಿಸಲು, ನೀವು ಹೆಚ್ಚಿನ ಇತರರಿಂದ ಡೇಟಾವನ್ನು ಓದಬೇಕಾಗುತ್ತದೆ, ಡಿಸ್ಕ್ಗಳು ​​ಮತ್ತು ನೆಟ್ವರ್ಕ್ನಲ್ಲಿ ದೊಡ್ಡ ಹೆಚ್ಚುವರಿ ಲೋಡ್ ಅನ್ನು ರಚಿಸುತ್ತದೆ.

ಒಂದು ಡಿಸ್ಕ್‌ನ ವೈಫಲ್ಯ ಅಥವಾ ಓವರ್‌ಲೋಡ್‌ನಿಂದಾಗಿ ಡೇಟಾದ ಒಂದು ಬ್ಲಾಕ್ ಅನ್ನು ಪ್ರವೇಶಿಸಲಾಗದಿರುವುದು ಸಾಮಾನ್ಯ ದೋಷಗಳು. ಈ (ಅತ್ಯಂತ ಸಾಮಾನ್ಯ) ಪ್ರಕರಣದಲ್ಲಿ ಡೇಟಾ ಮರುಪಡೆಯುವಿಕೆಗಾಗಿ ಹೆಚ್ಚುವರಿ ಲೋಡ್ ಅನ್ನು ಹೇಗಾದರೂ ಕಡಿಮೆ ಮಾಡಲು ಸಾಧ್ಯವೇ? ನೀವು ಮಾಡಬಹುದು ಎಂದು ಅದು ತಿರುಗುತ್ತದೆ: ಈ ಉದ್ದೇಶಕ್ಕಾಗಿ ನಿರ್ದಿಷ್ಟವಾಗಿ LRC ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳಿವೆ.

LRC (ಸ್ಥಳೀಯ ಪುನರ್ನಿರ್ಮಾಣ ಕೋಡ್‌ಗಳು) ವಿಂಡೋಸ್ ಅಜುರೆ ಸ್ಟೋರೇಜ್‌ನಲ್ಲಿ ಬಳಸಲು ಮೈಕ್ರೋಸಾಫ್ಟ್ ಆವಿಷ್ಕರಿಸಿದ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳಾಗಿವೆ. LRC ಯ ಕಲ್ಪನೆಯು ಸಾಧ್ಯವಾದಷ್ಟು ಸರಳವಾಗಿದೆ: ಎಲ್ಲಾ ಡೇಟಾ ಬ್ಲಾಕ್ಗಳನ್ನು ಎರಡು (ಅಥವಾ ಹೆಚ್ಚಿನ) ಗುಂಪುಗಳಾಗಿ ವಿಂಗಡಿಸಿ ಮತ್ತು ಪ್ರತಿ ಗುಂಪಿಗೆ ಪ್ರತ್ಯೇಕವಾಗಿ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್ಗಳ ಭಾಗವನ್ನು ಓದಿ. ನಂತರ ಕೆಲವು ಪುನರುಕ್ತಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಎಲ್ಲಾ ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಬಳಸಿ ಎಣಿಸಲಾಗುತ್ತದೆ (ಎಲ್‌ಆರ್‌ಸಿಯಲ್ಲಿ ಅವುಗಳನ್ನು ಜಾಗತಿಕ ಪುನರಾವರ್ತನೆ ಕೋಡ್‌ಗಳು ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ), ಮತ್ತು ಕೆಲವು - ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳ ಎರಡು ಗುಂಪುಗಳಲ್ಲಿ ಒಂದನ್ನು ಬಳಸಿ (ಅವುಗಳನ್ನು ಸ್ಥಳೀಯ ರಿಡಂಡನ್ಸಿ ಕೋಡ್‌ಗಳು ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ).

LRC ಅನ್ನು ಮೂರು ಸಂಖ್ಯೆಗಳಿಂದ ಸೂಚಿಸಲಾಗುತ್ತದೆ: nrl, ಇಲ್ಲಿ n ಎಂಬುದು ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳ ಸಂಖ್ಯೆ, r ಎಂಬುದು ಜಾಗತಿಕ ಪುನರುಕ್ತಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳ ಸಂಖ್ಯೆ, l ಎಂಬುದು ಸ್ಥಳೀಯ ಪುನರುಕ್ತಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳ ಸಂಖ್ಯೆ. ಒಂದು ಡೇಟಾ ಬ್ಲಾಕ್ ಲಭ್ಯವಿಲ್ಲದಿದ್ದಾಗ ಡೇಟಾವನ್ನು ಓದಲು, ನೀವು n/l ಬ್ಲಾಕ್‌ಗಳನ್ನು ಮಾತ್ರ ಓದಬೇಕಾಗುತ್ತದೆ - ಇದು Reed-Solomon ಕೋಡ್‌ಗಳಿಗಿಂತ l ಪಟ್ಟು ಕಡಿಮೆಯಾಗಿದೆ.

ಉದಾಹರಣೆಗೆ, LRC 6-2-2 ಯೋಜನೆಯನ್ನು ಪರಿಗಣಿಸಿ. X1–X6 — 6 ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳು, P1, P2 — 2 ಜಾಗತಿಕ ರಿಡಂಡೆನ್ಸಿ ಬ್ಲಾಕ್‌ಗಳು, P3, P4 — 2 ಸ್ಥಳೀಯ ರಿಡಂಡೆನ್ಸಿ ಬ್ಲಾಕ್‌ಗಳು.

ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳು: ಡೇಟಾವನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಮತ್ತು ಅಗ್ಗವಾಗಿ ಹೇಗೆ ಸಂಗ್ರಹಿಸುವುದು ಎಂಬುದರ ಕುರಿತು ಸರಳ ಪದಗಳಲ್ಲಿ

ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳು P1, P2 ಅನ್ನು ಎಲ್ಲಾ ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಎಣಿಸಲಾಗುತ್ತದೆ. ಪುನರುಕ್ತಿ ಕೋಡ್ ಬ್ಲಾಕ್ P3 - ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳನ್ನು X1-X3 ಬಳಸಿ, ಪುನರುಕ್ತಿ ಕೋಡ್ ಬ್ಲಾಕ್ P4 - ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳನ್ನು X4-X6 ಬಳಸಿ.

ಉಳಿದವುಗಳನ್ನು LRC ಯಲ್ಲಿ ರೀಡ್-ಸೊಲೊಮನ್ ಸಂಕೇತಗಳೊಂದಿಗೆ ಸಾದೃಶ್ಯದ ಮೂಲಕ ಮಾಡಲಾಗುತ್ತದೆ. ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳ ಪದಗಳನ್ನು ಎಣಿಸುವ ಸಮೀಕರಣಗಳು ಹೀಗಿವೆ:

ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳು: ಡೇಟಾವನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಮತ್ತು ಅಗ್ಗವಾಗಿ ಹೇಗೆ ಸಂಗ್ರಹಿಸುವುದು ಎಂಬುದರ ಕುರಿತು ಸರಳ ಪದಗಳಲ್ಲಿ

ಆಲ್ಫಾ, ಬೀಟಾ, ಗಾಮಾ, ಡೆಲ್ಟಾ ಸಂಖ್ಯೆಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲು, ಡೇಟಾ ಚೇತರಿಕೆಯ ಸಾಧ್ಯತೆಯನ್ನು ಖಾತರಿಪಡಿಸಲು ಹಲವಾರು ಷರತ್ತುಗಳನ್ನು ಪೂರೈಸಬೇಕು (ಅಂದರೆ, ಸಮೀಕರಣ ವ್ಯವಸ್ಥೆಯನ್ನು ಪರಿಹರಿಸುವುದು). ನೀವು ಅವರ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ಓದಬಹುದು ಲೇಖನ.
ಪ್ರಾಯೋಗಿಕವಾಗಿ, XOR ಕಾರ್ಯಾಚರಣೆಯನ್ನು ಸ್ಥಳೀಯ ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳು P3, P4 ಅನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಲು ಬಳಸಲಾಗುತ್ತದೆ.

LRC ಗಾಗಿ ಸಮೀಕರಣಗಳ ವ್ಯವಸ್ಥೆಯಿಂದ ಹಲವಾರು ತೀರ್ಮಾನಗಳು ಅನುಸರಿಸುತ್ತವೆ:

  • ಯಾವುದೇ 1 ಡೇಟಾ ಬ್ಲಾಕ್ ಅನ್ನು ಮರುಪಡೆಯಲು, n/l ಬ್ಲಾಕ್‌ಗಳನ್ನು ಓದಲು ಸಾಕು (ನಮ್ಮ ಉದಾಹರಣೆಯಲ್ಲಿ n/2).
  • r + l ಬ್ಲಾಕ್‌ಗಳು ಲಭ್ಯವಿಲ್ಲದಿದ್ದರೆ ಮತ್ತು ಎಲ್ಲಾ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಒಂದು ಗುಂಪಿನಲ್ಲಿ ಸೇರಿಸಿದ್ದರೆ, ನಂತರ ಡೇಟಾವನ್ನು ಮರುಸ್ಥಾಪಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ. ಇದನ್ನು ಉದಾಹರಣೆಯೊಂದಿಗೆ ವಿವರಿಸುವುದು ಸುಲಭ. ಬ್ಲಾಕ್‌ಗಳು X1–X3 ಮತ್ತು P3 ಲಭ್ಯವಿಲ್ಲ: ಇವುಗಳು ಒಂದೇ ಗುಂಪಿನಿಂದ r + l ಬ್ಲಾಕ್‌ಗಳಾಗಿವೆ, ನಮ್ಮ ಸಂದರ್ಭದಲ್ಲಿ 4. ನಂತರ ನಾವು ಪರಿಹರಿಸಲಾಗದ 3 ಅಜ್ಞಾತಗಳೊಂದಿಗೆ 4 ಸಮೀಕರಣಗಳ ವ್ಯವಸ್ಥೆಯನ್ನು ಹೊಂದಿದ್ದೇವೆ.
  • r + l ಬ್ಲಾಕ್‌ಗಳ ಅಲಭ್ಯತೆಯ ಎಲ್ಲಾ ಇತರ ಸಂದರ್ಭಗಳಲ್ಲಿ (ಪ್ರತಿ ಗುಂಪಿನಿಂದ ಕನಿಷ್ಠ ಒಂದು ಬ್ಲಾಕ್ ಲಭ್ಯವಿದ್ದಾಗ), LRC ಯಲ್ಲಿನ ಡೇಟಾವನ್ನು ಮರುಸ್ಥಾಪಿಸಬಹುದು.

ಹೀಗಾಗಿ, ಒಂದೇ ದೋಷಗಳ ನಂತರ ಡೇಟಾವನ್ನು ಮರುಪಡೆಯುವಲ್ಲಿ LRC ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳನ್ನು ಮೀರಿಸುತ್ತದೆ. ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳಲ್ಲಿ, ಒಂದು ಬ್ಲಾಕ್ ಡೇಟಾವನ್ನು ಮರುಪಡೆಯಲು, ನೀವು n ಬ್ಲಾಕ್‌ಗಳನ್ನು ಬಳಸಬೇಕಾಗುತ್ತದೆ, ಮತ್ತು LRC ನಲ್ಲಿ, ಒಂದು ಬ್ಲಾಕ್ ಡೇಟಾವನ್ನು ಮರುಪಡೆಯಲು, n/l ಬ್ಲಾಕ್‌ಗಳನ್ನು ಬಳಸುವುದು ಸಾಕು (ನಮ್ಮ ಉದಾಹರಣೆಯಲ್ಲಿ n/2). ಮತ್ತೊಂದೆಡೆ, ಗರಿಷ್ಠ ಸಂಖ್ಯೆಯ ಅನುಮತಿಸುವ ದೋಷಗಳ ವಿಷಯದಲ್ಲಿ LRC ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳಿಗಿಂತ ಕೆಳಮಟ್ಟದ್ದಾಗಿದೆ. ಮೇಲಿನ ಉದಾಹರಣೆಗಳಲ್ಲಿ, ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳು ಯಾವುದೇ 4 ದೋಷಗಳಿಗೆ ಡೇಟಾವನ್ನು ಮರುಪಡೆಯಬಹುದು ಮತ್ತು ಡೇಟಾವನ್ನು ಮರುಪಡೆಯಲು ಸಾಧ್ಯವಾಗದಿದ್ದಾಗ LRC ಗಾಗಿ 2 ದೋಷಗಳ 4 ಸಂಯೋಜನೆಗಳಿವೆ.

ಹೆಚ್ಚು ಮುಖ್ಯವಾದದ್ದು ನಿರ್ದಿಷ್ಟ ಸನ್ನಿವೇಶದ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುತ್ತದೆ, ಆದರೆ LRC ಒದಗಿಸುವ ಹೆಚ್ಚುವರಿ ಹೊರೆಯಲ್ಲಿನ ಉಳಿತಾಯವು ಸ್ವಲ್ಪ ಕಡಿಮೆ ವಿಶ್ವಾಸಾರ್ಹ ಸಂಗ್ರಹಣೆಯನ್ನು ಮೀರಿಸುತ್ತದೆ.

4. ಇತರ ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳು

ರೀಡ್-ಸೊಲೊಮನ್ ಮತ್ತು LRC ಕೋಡ್‌ಗಳ ಹೊರತಾಗಿ, ಅನೇಕ ಇತರ ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳಿವೆ. ವಿಭಿನ್ನ ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳು ವಿಭಿನ್ನ ಗಣಿತವನ್ನು ಬಳಸುತ್ತವೆ. ಕೆಲವು ಇತರ ಪುನರಾವರ್ತನೆ ಕೋಡ್‌ಗಳು ಇಲ್ಲಿವೆ:

  • XOR ಆಪರೇಟರ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್. XOR ಕಾರ್ಯಾಚರಣೆಯನ್ನು n ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳಲ್ಲಿ ನಡೆಸಲಾಗುತ್ತದೆ, ಮತ್ತು 1 ಬ್ಲಾಕ್ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳನ್ನು ಪಡೆಯಲಾಗುತ್ತದೆ, ಅಂದರೆ, n+1 ಸ್ಕೀಮ್ (n ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳು, 1 ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್). ನಲ್ಲಿ ಬಳಸಲಾಗಿದೆ RAID 5, ಅಲ್ಲಿ ಡೇಟಾ ಬ್ಲಾಕ್‌ಗಳು ಮತ್ತು ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳನ್ನು ಸರಣಿಯ ಎಲ್ಲಾ ಡಿಸ್ಕ್‌ಗಳಿಗೆ ಆವರ್ತಕವಾಗಿ ಬರೆಯಲಾಗುತ್ತದೆ.
  • XOR ಕಾರ್ಯಾಚರಣೆಯ ಆಧಾರದ ಮೇಲೆ ಸಮ-ಬೆಸ ಅಲ್ಗಾರಿದಮ್. ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳ 2 ಬ್ಲಾಕ್‌ಗಳನ್ನು ನಿರ್ಮಿಸಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ, ಅಂದರೆ, n+2 ಸ್ಕೀಮ್.
  • XOR ಕಾರ್ಯಾಚರಣೆಯ ಆಧಾರದ ಮೇಲೆ STAR ಅಲ್ಗಾರಿದಮ್. ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳ 3 ಬ್ಲಾಕ್‌ಗಳನ್ನು ನಿರ್ಮಿಸಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ, ಅಂದರೆ, n+3 ಸ್ಕೀಮ್.
  • ಪಿರಮಿಡ್ ಕೋಡ್‌ಗಳು ಮೈಕ್ರೋಸಾಫ್ಟ್‌ನ ಮತ್ತೊಂದು ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳಾಗಿವೆ.

5. Yandex ನಲ್ಲಿ ಬಳಸಿ

ಹಲವಾರು Yandex ಮೂಲಸೌಕರ್ಯ ಯೋಜನೆಗಳು ವಿಶ್ವಾಸಾರ್ಹ ಡೇಟಾ ಸಂಗ್ರಹಣೆಗಾಗಿ ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳನ್ನು ಬಳಸುತ್ತವೆ. ಕೆಲವು ಉದಾಹರಣೆಗಳು ಇಲ್ಲಿವೆ:

  • MDS ಆಂತರಿಕ ವಸ್ತು ಸಂಗ್ರಹಣೆ, ನಾನು ಲೇಖನದ ಆರಂಭದಲ್ಲಿ ಬರೆದಿದ್ದೇನೆ.
  • YT - ಯಾಂಡೆಕ್ಸ್‌ನ ಮ್ಯಾಪ್‌ರೆಡ್ಯೂಸ್ ಸಿಸ್ಟಮ್.
  • ವೈಡಿಬಿ (Yandex DataBase) - newSQL ವಿತರಣೆ ಡೇಟಾಬೇಸ್.

MDS LRC ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳನ್ನು ಬಳಸುತ್ತದೆ, 8-2-2 ಯೋಜನೆ. ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳೊಂದಿಗಿನ ಡೇಟಾವನ್ನು 12 ವಿಭಿನ್ನ DC ಗಳಲ್ಲಿ ವಿಭಿನ್ನ ಸರ್ವರ್‌ಗಳಲ್ಲಿ 3 ವಿಭಿನ್ನ ಡಿಸ್ಕ್‌ಗಳಿಗೆ ಬರೆಯಲಾಗುತ್ತದೆ: ಪ್ರತಿ DC ಯಲ್ಲಿ 4 ಸರ್ವರ್‌ಗಳು. ಇದರ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ಓದಿ ಲೇಖನ.

YT ರೀಡ್-ಸೊಲೊಮನ್ ಕೋಡ್‌ಗಳನ್ನು (ಸ್ಕೀಮ್ 6-3) ಬಳಸುತ್ತದೆ, ಅವುಗಳು ಮೊದಲು ಕಾರ್ಯಗತಗೊಳಿಸಿದವು ಮತ್ತು LRC ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳನ್ನು (ಸ್ಕೀಮ್ 12-2-2), ಜೊತೆಗೆ LRC ಆದ್ಯತೆಯ ಶೇಖರಣಾ ವಿಧಾನವಾಗಿದೆ.

YDB ಸಮ-ಬೆಸ ಆಧಾರಿತ ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳನ್ನು ಬಳಸುತ್ತದೆ (ಚಿತ್ರ 4-2). ಈಗಾಗಲೇ YDB ಯಲ್ಲಿ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್‌ಗಳ ಬಗ್ಗೆ ಹೈಲೋಡ್‌ನಲ್ಲಿ ಹೇಳಲಾಗಿದೆ.

ವಿಭಿನ್ನ ರಿಡಂಡೆನ್ಸಿ ಕೋಡ್ ಸ್ಕೀಮ್‌ಗಳ ಬಳಕೆಯು ಸಿಸ್ಟಮ್‌ಗಳಿಗೆ ವಿಭಿನ್ನ ಅವಶ್ಯಕತೆಗಳ ಕಾರಣದಿಂದಾಗಿರುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, MDS ನಲ್ಲಿ, LRC ಬಳಸಿ ಸಂಗ್ರಹಿಸಲಾದ ಡೇಟಾವನ್ನು ಒಮ್ಮೆ 3 DC ಗಳಲ್ಲಿ ಇರಿಸಲಾಗುತ್ತದೆ. ಯಾವುದೇ DC ಗಳಲ್ಲಿ 1 ವಿಫಲವಾದರೆ ಓದಲು ಡೇಟಾ ಲಭ್ಯವಿರುವುದು ನಮಗೆ ಮುಖ್ಯವಾಗಿದೆ, ಆದ್ದರಿಂದ DC ಗಳಾದ್ಯಂತ ಬ್ಲಾಕ್‌ಗಳನ್ನು ವಿತರಿಸಬೇಕು ಆದ್ದರಿಂದ ಯಾವುದೇ DC ಲಭ್ಯವಿಲ್ಲದಿದ್ದರೆ, ಪ್ರವೇಶಿಸಲಾಗದ ಬ್ಲಾಕ್‌ಗಳ ಸಂಖ್ಯೆಯು ಅನುಮತಿಗಿಂತ ಹೆಚ್ಚಿಲ್ಲ. 8-2-2 ಯೋಜನೆಯಲ್ಲಿ, ನೀವು ಪ್ರತಿ DC ಯಲ್ಲಿ 4 ಬ್ಲಾಕ್‌ಗಳನ್ನು ಇರಿಸಬಹುದು, ನಂತರ ಯಾವುದೇ DC ಅನ್ನು ಆಫ್ ಮಾಡಿದಾಗ, 4 ಬ್ಲಾಕ್‌ಗಳು ಲಭ್ಯವಿರುವುದಿಲ್ಲ ಮತ್ತು ಡೇಟಾವನ್ನು ಓದಬಹುದು. 3 DC ಗಳಲ್ಲಿ ಇರಿಸುವಾಗ ನಾವು ಯಾವುದೇ ಸ್ಕೀಮ್ ಅನ್ನು ಆರಿಸಿಕೊಂಡರೂ, ಯಾವುದೇ ಸಂದರ್ಭದಲ್ಲಿ (r + l) / n >= 0,5 ಇರಬೇಕು, ಅಂದರೆ, ಶೇಖರಣಾ ಪುನರುಜ್ಜೀವನವು ಕನಿಷ್ಠ 50% ಆಗಿರುತ್ತದೆ.

YT ಯಲ್ಲಿ ಪರಿಸ್ಥಿತಿಯು ವಿಭಿನ್ನವಾಗಿದೆ: ಪ್ರತಿ YT ಕ್ಲಸ್ಟರ್ ಸಂಪೂರ್ಣವಾಗಿ 1 DC ಯಲ್ಲಿದೆ (ವಿವಿಧ DC ಗಳಲ್ಲಿ ವಿಭಿನ್ನ ಕ್ಲಸ್ಟರ್ಗಳು), ಆದ್ದರಿಂದ ಅಂತಹ ಯಾವುದೇ ನಿರ್ಬಂಧವಿಲ್ಲ. 12-2-2 ಯೋಜನೆಯು 33% ಪುನರಾವರ್ತನೆಯನ್ನು ಒದಗಿಸುತ್ತದೆ, ಅಂದರೆ, ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವುದು ಅಗ್ಗವಾಗಿದೆ ಮತ್ತು ಇದು MDS ಯೋಜನೆಯಂತೆಯೇ 4 ಏಕಕಾಲಿಕ ಡಿಸ್ಕ್ ಸ್ಥಗಿತಗಳವರೆಗೆ ಬದುಕಬಲ್ಲದು.

ಡೇಟಾ ಸಂಗ್ರಹಣೆ ಮತ್ತು ಸಂಸ್ಕರಣೆ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳ ಬಳಕೆಯ ಹಲವು ವೈಶಿಷ್ಟ್ಯಗಳಿವೆ: ಡೇಟಾ ಮರುಪಡೆಯುವಿಕೆಯ ಸೂಕ್ಷ್ಮ ವ್ಯತ್ಯಾಸಗಳು, ಪ್ರಶ್ನೆ ಕಾರ್ಯಗತಗೊಳಿಸುವ ಸಮಯದ ಮೇಲೆ ಚೇತರಿಕೆಯ ಪ್ರಭಾವ, ಡೇಟಾ ರೆಕಾರ್ಡಿಂಗ್ ವೈಶಿಷ್ಟ್ಯಗಳು, ಇತ್ಯಾದಿ. ನಾನು ಈ ಮತ್ತು ಇತರ ವೈಶಿಷ್ಟ್ಯಗಳ ಬಗ್ಗೆ ಪ್ರತ್ಯೇಕವಾಗಿ ಮಾತನಾಡುತ್ತೇನೆ. ವಿಷಯವು ಆಸಕ್ತಿದಾಯಕವಾಗಿದ್ದರೆ ಆಚರಣೆಯಲ್ಲಿ ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳ ಬಳಕೆ.

6. ಲಿಂಕ್‌ಗಳು

  1. ರೀಡ್-ಸೊಲೊಮನ್ ಸಂಕೇತಗಳು ಮತ್ತು ಗಲೋಯಿಸ್ ಕ್ಷೇತ್ರಗಳ ಬಗ್ಗೆ ಲೇಖನಗಳ ಸರಣಿ: https://habr.com/ru/company/yadro/blog/336286/
    https://habr.com/ru/company/yadro/blog/341506/
    ಅವರು ಪ್ರವೇಶಿಸಬಹುದಾದ ಭಾಷೆಯಲ್ಲಿ ಗಣಿತವನ್ನು ಆಳವಾಗಿ ನೋಡುತ್ತಾರೆ.
  2. LRC ಕುರಿತು Microsoft ನಿಂದ ಲೇಖನ: https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/LRC12-cheng20webpage.pdf
    ವಿಭಾಗ 2 ಸಿದ್ಧಾಂತವನ್ನು ಸಂಕ್ಷಿಪ್ತವಾಗಿ ವಿವರಿಸುತ್ತದೆ ಮತ್ತು ನಂತರ ಪ್ರಾಯೋಗಿಕವಾಗಿ LRC ಯೊಂದಿಗಿನ ಅನುಭವಗಳನ್ನು ಚರ್ಚಿಸುತ್ತದೆ.
  3. ಸಮ-ಬೆಸ ಯೋಜನೆ: https://people.eecs.berkeley.edu/~kubitron/courses/cs262a-F12/handouts/papers/p245-blaum.pdf
  4. ಸ್ಟಾರ್ ಯೋಜನೆ: https://www.usenix.org/legacy/event/fast05/tech/full_papers/huang/huang.pdf
  5. ಪಿರಮಿಡ್ ಸಂಕೇತಗಳು: https://www.microsoft.com/en-us/research/publication/pyramid-codes-flexible-schemes-to-trade-space-for-access-efficiency-in-reliable-data-storage-systems/
  6. MDS ನಲ್ಲಿ ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳು: https://habr.com/ru/company/yandex/blog/311806
  7. YT ಯಲ್ಲಿ ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳು: https://habr.com/ru/company/yandex/blog/311104/
  8. YDB ನಲ್ಲಿ ಪುನರುಕ್ತಿ ಸಂಕೇತಗಳು: https://www.youtube.com/watch?v=dCpfGJ35kK8

ಮೂಲ: www.habr.com

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ