காப்புப் பிரதி பகுதி 3: நகல், நகல் ஆகியவற்றின் மதிப்பாய்வு மற்றும் சோதனை

காப்புப் பிரதி பகுதி 3: நகல், நகல் ஆகியவற்றின் மதிப்பாய்வு மற்றும் சோதனை

காப்புப் பிரதி சேவையகத்தில் காப்பகங்களை உருவாக்குவதன் மூலம் காப்புப்பிரதிகளைச் செய்யும் காப்புப் பிரதி கருவிகளைப் பற்றி இந்தக் குறிப்பு விவாதிக்கிறது.

தேவைகளைப் பூர்த்தி செய்பவர்களில் டூப்ளிசிட்டி (தேஜா டூப் வடிவத்தில் நல்ல இடைமுகம் உள்ளது) மற்றும் டூப்ளிகேட்டி ஆகியவை அடங்கும்.

மற்றொரு குறிப்பிடத்தக்க காப்புப் பிரதி கருவி டார், ஆனால் இது மிகவும் விரிவான விருப்பங்களின் பட்டியலைக் கொண்டிருப்பதால் - சோதனை முறையானது அதன் திறனில் 10% மட்டுமே உள்ளடக்கியது - தற்போதைய சுழற்சியின் ஒரு பகுதியாக நாங்கள் அதைச் சோதிக்கவில்லை.

எதிர்பார்த்த முடிவுகள்

இரண்டு வேட்பாளர்களும் ஒரு வழியில் அல்லது வேறு வகையில் காப்பகங்களை உருவாக்குவதால், வழக்கமான தார் ஒரு வழிகாட்டியாகப் பயன்படுத்தப்படலாம்.

கூடுதலாக, ஒரு முழு நகலுக்கும் கோப்புகளின் தற்போதைய நிலைக்கும் அல்லது முந்தைய மற்றும் தற்போதைய காப்பகங்களுக்கு (அதிகரித்தல், குறைதல், முதலியன) இடையே உள்ள வித்தியாசத்தை மட்டுமே கொண்ட காப்பு பிரதிகளை உருவாக்குவதன் மூலம் சேமிப்பக சேவையகத்தில் தரவு சேமிப்பகம் எவ்வளவு சிறப்பாக மேம்படுத்தப்பட்டுள்ளது என்பதை மதிப்பீடு செய்வோம். .

காப்புப்பிரதிகளை உருவாக்கும் போது நடத்தை:

  1. காப்புப் பிரதி சேமிப்பக சேவையகத்தில் ஒப்பீட்டளவில் சிறிய எண்ணிக்கையிலான கோப்புகள் (காப்புப் பிரதிகளின் எண்ணிக்கை அல்லது ஜிபியில் உள்ள தரவின் அளவுடன் ஒப்பிடலாம்), ஆனால் அவற்றின் அளவு மிகப் பெரியது (பத்து முதல் நூற்றுக்கணக்கான மெகாபைட்கள்).
  2. களஞ்சிய அளவு மாற்றங்களை மட்டுமே உள்ளடக்கும் - எந்த நகல்களும் சேமிக்கப்படாது, எனவே களஞ்சிய அளவு rsync-அடிப்படையிலான மென்பொருளைக் காட்டிலும் சிறியதாக இருக்கும்.
  3. சுருக்க மற்றும்/அல்லது குறியாக்கத்தைப் பயன்படுத்தும் போது அதிக CPU சுமை எதிர்பார்க்கலாம், மேலும் காப்பகப்படுத்துதல் மற்றும்/அல்லது குறியாக்க செயல்முறை காப்புப் பிரதி சேமிப்பக சேவையகத்தில் இயங்கினால், அதிக நெட்வொர்க் மற்றும் வட்டு சுமை இருக்கும்.

பின்வரும் கட்டளையை குறிப்பு மதிப்பாக இயக்குவோம்:

cd /src/dir; tar -cf - * | ssh backup_server "cat > /backup/dir/archive.tar"

மரணதண்டனை முடிவுகள் பின்வருமாறு:

காப்புப் பிரதி பகுதி 3: நகல், நகல் ஆகியவற்றின் மதிப்பாய்வு மற்றும் சோதனை

செயல்படுத்தும் நேரம் 3m12s. காப்புப் பிரதி சேமிப்பக சேவையகத்தின் வட்டு துணை அமைப்பால் வேகம் வரையறுக்கப்பட்டிருப்பதைக் காணலாம். rsync. சற்று வேகமாக, ஏனெனில்... பதிவு ஒரு கோப்பிற்கு செல்கிறது.

மேலும், சுருக்கத்தை மதிப்பிட, அதே விருப்பத்தை இயக்குவோம், ஆனால் காப்புப்பிரதி சேவையக பக்கத்தில் சுருக்கத்தை இயக்கவும்:

cd /src/dir; tar -cf - * | ssh backup_server "gzip > /backup/dir/archive.tgz"

முடிவுகள்:

காப்புப் பிரதி பகுதி 3: நகல், நகல் ஆகியவற்றின் மதிப்பாய்வு மற்றும் சோதனை

செயல்படுத்தும் நேரம் 10m11s. பெரும்பாலும் அடைப்பு என்பது பெறும் முனையில் உள்ள ஒற்றை-பாய்ச்சல் அமுக்கி ஆகும்.

அதே கட்டளை, ஆனால் கம்ப்ரஷனுடன் அசல் தரவுகளுடன் சேவையகத்திற்கு மாற்றப்பட்டு, தடையானது ஒற்றை-திரிக்கப்பட்ட அமுக்கி என்ற கருதுகோளைச் சோதிக்கிறது.

cd /src/dir; tar -czf - * | ssh backup_server "cat > /backup/dir/archive.tgz"

இது இப்படி மாறியது:

காப்புப் பிரதி பகுதி 3: நகல், நகல் ஆகியவற்றின் மதிப்பாய்வு மற்றும் சோதனை

செயல்படுத்தும் நேரம் 9நி 37 வினாடிகள். அமுக்கி மூலம் ஒரு மையத்தில் சுமை தெளிவாக தெரியும், ஏனெனில் நெட்வொர்க் பரிமாற்ற வேகம் மற்றும் மூல வட்டு துணை அமைப்பில் உள்ள சுமை ஆகியவை ஒரே மாதிரியானவை.

குறியாக்கத்தை மதிப்பிட, கூடுதல் கட்டளையை இணைப்பதன் மூலம் openssl அல்லது gpg ஐப் பயன்படுத்தலாம். openssl அல்லது gpg குழாயில். குறிப்புக்கு இது போன்ற ஒரு கட்டளை இருக்கும்:

cd /src/dir; tar -cf - * | ssh backup_server "gzip | openssl enc -e -aes256 -pass pass:somepassword -out /backup/dir/archive.tgz.enc"

முடிவுகள் இப்படி வெளிவந்தன:

காப்புப் பிரதி பகுதி 3: நகல், நகல் ஆகியவற்றின் மதிப்பாய்வு மற்றும் சோதனை

செயல்படுத்தும் நேரம் 10 மீ 30 வினாடிகளாக மாறியது, ஏனெனில் 2 செயல்முறைகள் பெறும் பக்கத்தில் இயங்குகின்றன - தடையானது மீண்டும் ஒற்றை-திரிக்கப்பட்ட அமுக்கி, மேலும் சிறிய குறியாக்க மேல்நிலை ஆகும்.

யு பி எஸ்: bliznezz இன் வேண்டுகோளின்படி நான் pigz உடன் சோதனைகளைச் சேர்க்கிறேன். நீங்கள் அமுக்கியை மட்டும் பயன்படுத்தினால், அது 6m30s ஆகும், நீங்கள் குறியாக்கத்தையும் சேர்த்தால், அது சுமார் 7m ஆக இருக்கும். கீழே உள்ள வரைபடத்தில் உள்ள டிப் என்பது துலக்கப்படாத வட்டு தற்காலிக சேமிப்பாகும்:

காப்புப் பிரதி பகுதி 3: நகல், நகல் ஆகியவற்றின் மதிப்பாய்வு மற்றும் சோதனை

நகல் சோதனை

டூப்ளிசிட்டி என்பது தார் வடிவத்தில் மறைகுறியாக்கப்பட்ட காப்பகங்களை உருவாக்குவதன் மூலம் காப்புப்பிரதிக்கான பைதான் மென்பொருளாகும்.

அதிகரிக்கும் காப்பகங்களுக்கு, librsync பயன்படுத்தப்படுகிறது, எனவே நீங்கள் விவரிக்கப்பட்டுள்ள நடத்தையை எதிர்பார்க்கலாம் தொடரின் முந்தைய இடுகை.

காப்புப்பிரதிகளை gnupg ஐப் பயன்படுத்தி குறியாக்கம் செய்து கையொப்பமிடலாம், இது காப்புப்பிரதிகளைச் சேமிப்பதற்கு வெவ்வேறு வழங்குநர்களைப் பயன்படுத்தும் போது முக்கியமானது (s3, backblaze, gdrive, முதலியன)

முடிவுகள் என்னவென்று பார்ப்போம்:

குறியாக்கம் இல்லாமல் இயங்கும் போது கிடைத்த முடிவுகள் இவை

ஸ்பாய்லர்

காப்புப் பிரதி பகுதி 3: நகல், நகல் ஆகியவற்றின் மதிப்பாய்வு மற்றும் சோதனை

ஒவ்வொரு சோதனை ஓட்டத்தின் இயங்கும் நேரம்:

துவக்கம் 1
துவக்கம் 2
துவக்கம் 3

16 மீ33 வி
17 மீ20 வி
16 மீ30 வி

8 மீ29 வி
9 மீ3 வி
8 மீ45 வி

5 மீ21 வி
6 மீ04 வி
5 மீ53 வி

2048 பிட்களின் முக்கிய அளவுடன், gnupg குறியாக்கம் இயக்கப்பட்டால், முடிவுகள் இதோ:

காப்புப் பிரதி பகுதி 3: நகல், நகல் ஆகியவற்றின் மதிப்பாய்வு மற்றும் சோதனை

குறியாக்கத்துடன் ஒரே தரவில் செயல்படும் நேரம்:

துவக்கம் 1
துவக்கம் 2
துவக்கம் 3

17 மீ22 வி
17 மீ32 வி
17 மீ28 வி

8 மீ52 வி
9 மீ13 வி
9 மீ3 வி

5 மீ48 வி
5 மீ40 வி
5 மீ30 வி

தொகுதி அளவு சுட்டிக்காட்டப்பட்டது - 512 மெகாபைட்கள், இது வரைபடங்களில் தெளிவாகத் தெரியும்; செயலி சுமை உண்மையில் 50% ஆக இருந்தது, அதாவது நிரல் ஒன்றுக்கு மேற்பட்ட செயலி மையத்தைப் பயன்படுத்துவதில்லை.

நிரலின் செயல்பாட்டின் கொள்கையும் மிகவும் தெளிவாகத் தெரியும்: அவர்கள் ஒரு தரவை எடுத்து, அதை சுருக்கி, காப்பு சேமிப்பக சேவையகத்திற்கு அனுப்பினார்கள், இது மிகவும் மெதுவாக இருக்கும்.
மற்றொரு அம்சம், நிரலின் யூகிக்கக்கூடிய இயங்கும் நேரம் ஆகும், இது மாற்றப்பட்ட தரவின் அளவை மட்டுமே சார்ந்துள்ளது.

குறியாக்கத்தை இயக்குவது நிரலின் இயங்கும் நேரத்தை கணிசமாக அதிகரிக்கவில்லை, ஆனால் இது செயலி சுமையை சுமார் 10% அதிகரித்தது, இது ஒரு நல்ல போனஸாக இருக்கலாம்.

துரதிர்ஷ்டவசமாக, இந்த நிரல் கோப்பகத்தின் மறுபெயரிடுதலுடன் நிலைமையை சரியாகக் கண்டறிய முடியவில்லை, இதன் விளைவாக களஞ்சிய அளவு மாற்றங்களின் அளவிற்கு சமமாக மாறியது (அதாவது, அனைத்து 18 ஜிபி), ஆனால் காப்புப்பிரதிக்கு நம்பகமான சேவையகத்தைப் பயன்படுத்தும் திறன் தெளிவாக உள்ளது. இந்த நடத்தையை உள்ளடக்கியது.

நகல் சோதனை

இந்த மென்பொருள் C# இல் எழுதப்பட்டுள்ளது மற்றும் மோனோவில் இருந்து நூலகங்களின் தொகுப்பைப் பயன்படுத்தி இயங்குகிறது. ஒரு GUI மற்றும் CLI பதிப்பு உள்ளது.

முக்கிய அம்சங்களின் தோராயமான பட்டியல் டூப்ளிசிட்டியைப் போன்றது, பல்வேறு காப்புப் பிரதி சேமிப்பக வழங்குநர்கள் உட்பட, இருப்பினும், டூப்ளிசிட்டியைப் போலன்றி, பெரும்பாலான அம்சங்கள் மூன்றாம் தரப்பு கருவிகள் இல்லாமல் கிடைக்கின்றன. இது பிளஸ் அல்லது மைனஸ் என்பது குறிப்பிட்ட விஷயத்தைப் பொறுத்தது, ஆனால் ஆரம்பநிலைக்கு, பைத்தானுக்கு கூடுதல் தொகுப்புகளை நிறுவுவதை விட, அனைத்து அம்சங்களின் பட்டியலை ஒரே நேரத்தில் வைத்திருப்பது மிகவும் எளிதாக இருக்கும். இரட்டைத்தன்மை கொண்ட வழக்கு.

மற்றொரு சிறிய நுணுக்கம் - காப்புப்பிரதியைத் தொடங்கும் பயனரின் சார்பாக நிரல் உள்ளூர் sqlite தரவுத்தளத்தை தீவிரமாக எழுதுகிறது, எனவே ஒவ்வொரு முறையும் cli ஐப் பயன்படுத்தி செயல்முறை தொடங்கும் போது தேவையான தரவுத்தளம் சரியாக குறிப்பிடப்பட்டுள்ளதா என்பதை நீங்கள் கூடுதலாக உறுதிப்படுத்த வேண்டும். GUI அல்லது WEBGUI மூலம் பணிபுரியும் போது, ​​விவரங்கள் பயனரிடமிருந்து மறைக்கப்படும்.

இந்த தீர்வு என்ன குறிகாட்டிகளை உருவாக்க முடியும் என்பதைப் பார்ப்போம்:

நீங்கள் குறியாக்கத்தை முடக்கினால் (மற்றும் WEBGUI இதைச் செய்ய பரிந்துரைக்கவில்லை), முடிவுகள் பின்வருமாறு:

காப்புப் பிரதி பகுதி 3: நகல், நகல் ஆகியவற்றின் மதிப்பாய்வு மற்றும் சோதனை

வேலை நேரம்:

துவக்கம் 1
துவக்கம் 2
துவக்கம் 3

20 மீ43 வி
20 மீ13 வி
20 மீ28 வி

5 மீ21 வி
5 மீ40 வி
5 மீ35 வி

7 மீ36 வி
7 மீ54 வி
7 மீ49 வி

குறியாக்கம் இயக்கப்பட்டால், aes ஐப் பயன்படுத்தி, இது போல் தெரிகிறது:

காப்புப் பிரதி பகுதி 3: நகல், நகல் ஆகியவற்றின் மதிப்பாய்வு மற்றும் சோதனை

வேலை நேரம்:

துவக்கம் 1
துவக்கம் 2
துவக்கம் 3

29 மீ9 வி
30 மீ1 வி
29 மீ54 வி

5 மீ29 வி
6 மீ2 வி
5 மீ54 வி

8 மீ44 வி
9 மீ12 வி
9 மீ1 வி

நீங்கள் வெளிப்புற நிரல் gnupg ஐப் பயன்படுத்தினால், பின்வரும் முடிவுகள் வெளிவரும்:

காப்புப் பிரதி பகுதி 3: நகல், நகல் ஆகியவற்றின் மதிப்பாய்வு மற்றும் சோதனை

துவக்கம் 1
துவக்கம் 2
துவக்கம் 3

26 மீ6 வி
26 மீ35 வி
26 மீ17 வி

5 மீ20 வி
5 மீ48 வி
5 மீ40 வி

8 மீ12 வி
8 மீ42 வி
8 மீ15 வி

நீங்கள் பார்க்க முடியும் என, நிரல் பல நூல்களில் வேலை செய்ய முடியும், ஆனால் இது அதிக உற்பத்தித் தீர்வாக அமையாது, மேலும் குறியாக்கப் பணியை ஒப்பிட்டுப் பார்த்தால், அது வெளிப்புற நிரலைத் தொடங்கும்.
மோனோ தொகுப்பிலிருந்து நூலகத்தைப் பயன்படுத்துவதை விட வேகமானது. வெளிப்புற நிரல் மிகவும் உகந்ததாக இருப்பதால் இது இருக்கலாம்.

மற்றொரு நல்ல விஷயம் என்னவென்றால், களஞ்சியத்தின் அளவு உண்மையான மாற்றப்பட்ட தரவைப் போலவே எடுக்கும், அதாவது. டூப்ளிகாட்டி ஒரு அடைவு மறுபெயரைக் கண்டறிந்து இந்தச் சூழ்நிலையைச் சரியாகக் கையாண்டது. இரண்டாவது சோதனையை நடத்தும் போது இதைக் காணலாம்.

ஒட்டுமொத்தமாக, புதியவர்களுடன் மிகவும் நட்பாக இருப்பது உட்பட, திட்டத்தின் நேர்மறையான பதிவுகள்.

Результаты

இரண்டு வேட்பாளர்களும் மெதுவாக வேலை செய்தனர், ஆனால் பொதுவாக, வழக்கமான தார் ஒப்பிடுகையில், முன்னேற்றம் உள்ளது, குறைந்தபட்சம் டூப்ளிகேட்டியுடன். அத்தகைய முன்னேற்றத்தின் விலையும் தெளிவாக உள்ளது - ஒரு குறிப்பிடத்தக்க சுமை
செயலி. பொதுவாக, முடிவுகளை கணிப்பதில் சிறப்பு விலகல்கள் எதுவும் இல்லை.

கண்டுபிடிப்புகள்

நீங்கள் எங்கும் அவசரப்பட வேண்டிய அவசியமில்லை, மேலும் ஒரு உதிரி செயலி இருந்தால், கருத்தில் கொள்ளப்பட்ட எந்தவொரு தீர்வும் செய்யும், எந்தவொரு சந்தர்ப்பத்திலும், தார் மேல் ரேப்பர் ஸ்கிரிப்ட்களை எழுதுவதன் மூலம் மீண்டும் மீண்டும் செய்யக்கூடாத நிறைய வேலைகள் செய்யப்பட்டுள்ளன. . காப்பு பிரதிகளை சேமிப்பதற்கான சேவையகத்தை முழுமையாக நம்ப முடியாவிட்டால், குறியாக்கத்தின் இருப்பு மிகவும் அவசியமான சொத்து.

தீர்வுகளின் அடிப்படையில் ஒப்பிடும்போது rsync - தார் அதன் தூய வடிவத்தில் rsync ஐ விட 20-30% வேகமாக வேலை செய்த போதிலும், செயல்திறன் பல மடங்கு மோசமாக இருக்கும்.
களஞ்சியத்தின் அளவு சேமிப்புகள் உள்ளன, ஆனால் நகல் மூலம் மட்டுமே.

அறிவிப்பு

காப்புப்பிரதி, பகுதி 1: காப்புப்பிரதி ஏன் தேவைப்படுகிறது, முறைகள், தொழில்நுட்பங்கள் பற்றிய கண்ணோட்டம்
காப்புப் பிரதி பகுதி 2: rsync அடிப்படையிலான காப்புப் பிரதி கருவிகளை மதிப்பாய்வு செய்தல் மற்றும் சோதனை செய்தல்
காப்புப் பிரதி பகுதி 3: டூப்ளிசிட்டி, டூப்ளிகேட்டி, டெஜா டூப் ஆகியவற்றை மதிப்பாய்வு செய்து சோதனை செய்தல்
காப்புப் பிரதி பகுதி 4: zbackup, Restic, Borgbackup ஆகியவற்றை மதிப்பாய்வு செய்தல் மற்றும் சோதனை செய்தல்
காப்புப்பிரதி பகுதி 5: லினக்ஸிற்கான பாகுலா மற்றும் வீம் காப்புப்பிரதியை சோதித்தல்
காப்புப் பிரதி பகுதி 6: காப்புப் பிரதி கருவிகளை ஒப்பிடுதல்
காப்பு பகுதி 7: முடிவுகள்

பதிவிட்டவர்: பாவெல் டெம்கோவிச்

ஆதாரம்: www.habr.com

கருத்தைச் சேர்