சூழல் மாறி செயல்முறையை 40 மடங்கு வேகப்படுத்தும்போது

இன்று நாம் ஷெர்லாக் அமைப்பின் சில சமீபத்திய புதுப்பிப்புகளைப் பற்றி பேச விரும்புகிறோம் [இது ஸ்டான்போர்ட் பல்கலைக்கழகத்தில் உயர் செயல்திறன் கொண்ட கிளஸ்டர் - தோராயமாக. trans.], இது அதிக எண்ணிக்கையிலான உள்ளீடுகளைக் கொண்ட கோப்பகங்களில் கோப்புகளை பட்டியலிடுவதை கணிசமாக துரிதப்படுத்துகிறது.

வழக்கமான கட்டுரைகளைப் போலல்லாமல், இது ஷெர்லாக் எங்கள் பயனர்களுக்கு சிறந்த முறையில் இயங்குவதைத் தொடர்ந்து நாங்கள் எவ்வாறு வேலை செய்கிறோம் என்பது பற்றிய உள் அறிக்கையாகும். எதிர்காலத்தில் இது போன்ற கட்டுரைகளை வெளியிடுவோம் என நம்புகிறோம்.

பல கோப்புகளை பட்டியலிட நேரம் எடுக்கும்

இது அனைத்தும் ஒரு பயனரின் தொழில்நுட்ப ஆதரவு கேள்வியுடன் தொடங்கியது. தூக்கு தண்டனை என்று பிரச்சனையை தெரிவித்தார் ls 15 க்கும் மேற்பட்ட உள்ளீடுகளைக் கொண்ட ஒரு கோப்பகத்தில் சில நிமிடங்கள் ஆகும் $SCRATCH [தற்காலிக கோப்புகளுக்கான அடைவு - தோராயமாக. பாதை].

ஒரு கோப்பகத்தில் உள்ள ஆயிரக்கணக்கான கோப்புகள் பொதுவாக கோப்பு முறைமைக்கு ஒரு சுமையை ஏற்படுத்துகின்றன மற்றும் கண்டிப்பாக பரிந்துரைக்கப்படுவதில்லை. பயனர் இதை அறிந்திருந்தார் மற்றும் இது நல்லதல்ல என்று ஒப்புக்கொண்டார், ஆனால் ஷெர்லாக்கை விட தனது லேப்டாப்பில் பட்டியல் 1000 மடங்கு வேகமாக இருந்தது என்று குறிப்பிட்டுள்ளார். நிச்சயமாக, இது எங்களை காயப்படுத்தியது. எனவே ஆழமாகப் பார்த்தோம்.

ஏனென்றால் அது அழகாக இருக்கிறது

அது உண்மையில் என்ன செய்கிறது என்று பார்த்தோம் ls ஒரு கோப்பகத்தை பட்டியலிடும் போது மற்றும் செயல்முறை ஏன் அதிக நேரம் எடுக்கும். பெரும்பாலான நவீன விநியோகங்களில் ls முன்னிருப்பாக அது இயங்கும் ls --color=auto, ஏனென்றால் அனைவருக்கும் வண்ணங்கள் பிடிக்கும்.

ஆனால் அழகான வண்ணங்கள் ஒரு விலையில் வருகின்றன: ஒவ்வொரு கோப்பிற்கும் ls பொருத்தமான வண்ணத்தைத் தேர்ந்தெடுக்க கோப்பு வகை, அதன் அனுமதிகள், கொடிகள், நீட்டிக்கப்பட்ட பண்புக்கூறுகள் மற்றும் பலவற்றைப் பற்றிய தகவல்களைப் பெற வேண்டும்.

பிரச்சனைக்கு ஒரு எளிய தீர்வு, ls இல் நிறத்தை முழுவதுமாக முடக்குவது, ஆனால் பயனர்களின் சீற்றத்தை கற்பனை செய்து பாருங்கள். எந்த சூழ்நிலையிலும் நீங்கள் வண்ண வெளியீட்டை அகற்றக்கூடாது, நாங்கள் அரக்கர்கள் அல்ல.

எனவே ஆழமாகப் பார்த்தோம். ls சூழல் மாறி மூலம் நிறங்கள் உள்ளீடுகள் LS_COLORS, இது அமைக்கப்பட்டுள்ளது dircolors(1) கட்டமைப்பு கோப்பு அடிப்படையில் dir_colors(5)... ஆம், இயங்கக்கூடியது சூழல் மாறியை உருவாக்க உள்ளமைவு கோப்பைப் படிக்கிறது, அதை ls பின்னர் பயன்படுத்துகிறது (மற்றும் கோப்புகளைப் பற்றி உங்களுக்குத் தெரியாவிட்டால் கதவை (செய்), பின்னர் dir_colors இது வேலை செய்யும், எல்லாவற்றையும் மீறி).

இன்னும் விரிவாகப் பார்ப்போம்

எந்த வண்ணத் திட்டம் மந்தநிலையை ஏற்படுத்துகிறது என்பதைத் தீர்மானிக்க, நாங்கள் ஒரு சோதனைச் சூழலை உருவாக்கினோம்:

$ mkdir $SCRATCH/dont
$ touch $SCRATCH/dont/{1..10000} # don't try this at home!
$ time ls --color=always $SCRATCH/dont | wc -l
10000

real    0m12.758s
user    0m0.104s
sys     0m0.699s

12,7 கோப்புகளுக்கு 10 வினாடிகள், நன்றாக இல்லை.

மூலம், எங்களுக்கு ஒரு கொடி தேவை --color=always: அவர் திரும்பினாலும் ls --color=auto, ஆனால் ls டெர்மினலுடன் இணைக்கப்படாததைக் கண்டறிந்து (எ.கா. குழாய் மூலம் அல்லது வெளியீட்டுத் திசைதிருப்பலுடன்) மற்றும் என அமைக்கப்பட்டால் வண்ணத்தை முடக்குகிறது auto. புத்திசாலி பையன்.

அதனால் என்ன இவ்வளவு நேரம் எடுக்கிறது? உடன் பார்த்தோம் strace:

$ strace -c ls --color=always $SCRATCH/dont | wc -l
10000
% time     seconds  usecs/call     calls    errors syscall
------ ----------- ----------- --------- --------- ----------------
 44.21    0.186617          19     10000           lstat
 42.60    0.179807          18     10000     10000 getxattr
 12.19    0.051438           5     10000           capget
  0.71    0.003002          38        80           getdents
  0.07    0.000305          10        30           mmap
  0.05    0.000217          12        18           mprotect
  0.03    0.000135          14        10           read
  0.03    0.000123          11        11           open
  0.02    0.000082           6        14           close
[...]

ஆஹா: 10 அழைப்புகள் lstat()10 அழைப்புகள் getxattr() (எல்லாவற்றிலும் தோல்வியடைகிறது, ஏனென்றால் நமது சுற்றுச்சூழலில் ls தேடும் பண்புக்கூறுகள் இல்லை), 10 அழைப்புகள் capget().

நிச்சயமாக இதை மேம்படுத்தலாம்.

திறன் பண்பு? இல்லை

ஆலோசனையைப் பின்பற்றுதல் 10 ஆண்டுகளுக்கு முந்தைய பிழை, பண்புக்கூறு சரிபார்ப்பை முடக்க முயற்சித்தோம் திறன்களை:

$ eval $(dircolors -b | sed s/ca=[^:]*:/ca=:/)
$ time strace -c ls --color=always $SCRATCH/dont | wc -l
10000
% time     seconds  usecs/call     calls    errors syscall
------ ----------- ----------- --------- --------- ----------------
 98.95    0.423443          42     10000           lstat
  0.78    0.003353          42        80           getdents
  0.04    0.000188          10        18           mprotect
  0.04    0.000181           6        30           mmap
  0.02    0.000085           9        10           read
  0.02    0.000084          28         3           mremap
  0.02    0.000077           7        11           open
  0.02    0.000066           5        14           close
[...]
------ ----------- ----------- --------- --------- ----------------
100.00    0.427920                 10221         6 total

real    0m8.160s
user    0m0.115s
sys     0m0.961s

ஆஹா, 8 வினாடிகள் வரை முடுக்கம்! அந்த விலையுயர்ந்த அழைப்புகள் அனைத்தையும் நாங்கள் அகற்றிவிட்டோம் getxattr(), மற்றும் சவால்கள் capget() கூட காணாமல் போனது.

ஆனால் இன்னும் இந்த எரிச்சலூட்டும் அழைப்புகள் உள்ளன lstat(), இருந்தாலும்…

உங்களுக்கு எத்தனை பூக்கள் தேவை?

எனவே, நாங்கள் கூர்ந்து கவனித்தோம் LS_COLORS.

முதலில் இந்த மாறியை வெறுமனே முடக்கினோம்:

$ echo $LS_COLORS
rs=0:di=01;34:ln=01;36:mh=00:pi=40;33:so=01;35:do=01;35:bd=40;33;01:cd=40;33;01:or=40;31;01:su=37;41:sg=30;43:ca=:tw=30;42:ow=34;42:st=37;44:ex=01;32:*.tar=01;31:*.tgz=01;31:*.arc=01;31:*.arj=01;31:*.taz=01;31:*.lha=01;31:*.lz4=01;31:*.lzh=01;31:*.lzma=01;31:*.tlz=01;31:*.txz=01;31:*.tzo=01;31:*.t7z=01;31:*.zip=01;31:*.z=01;31:*.Z=01;31:*.dz=01;31:*.gz=01;31:*.lrz=01;31:*.lz=01;31:*.lzo=01;31:*.xz=01;31:*.bz2=01;31:*.bz=01;31:*.tbz=01;31:*.tbz2=01;31:*.tz=01;31:*.deb=01;31:*.rpm=01;31:*.jar=01;31:*.war=01;31:*.ear=01;31:*.sar=01;31:*.rar=01;31:*.alz=01;31:*.ace=01;31:*.zoo=01;31:*.cpio=01;31:*.7z=01;31:*.rz=01;31:*.cab=01;31:*.jpg=01;35:*.jpeg=01;35:*.gif=01;35:*.bmp=01;35:*.pbm=01;35:*.pgm=01;35:*.ppm=01;35:*.tga=01;35:*.xbm=01;35:*.xpm=01;35:*.tif=01;35:*.tiff=01;35:*.png=01;35:*.svg=01;35:*.svgz=01;35:*.mng=01;35:*.pcx=01;35:*.mov=01;35:*.mpg=01;35:*.mpeg=01;35:*.m2v=01;35:*.mkv=01;35:*.webm=01;35:*.ogm=01;35:*.mp4=01;35:*.m4v=01;35:*.mp4v=01;35:*.vob=01;35:*.qt=01;35:*.nuv=01;35:*.wmv=01;35:*.asf=01;35:*.rm=01;35:*.rmvb=01;35:*.flc=01;35:*.avi=01;35:*.fli=01;35:*.flv=01;35:*.gl=01;35:*.dl=01;35:*.xcf=01;35:*.xwd=01;35:*.yuv=01;35:*.cgm=01;35:*.emf=01;35:*.axv=01;35:*.anx=01;35:*.ogv=01;35:*.ogx=01;35:*.aac=00;36:*.au=00;36:*.flac=00;36:*.mid=00;36:*.midi=00;36:*.mka=00;36:*.mp3=00;36:*.mpc=00;36:*.ogg=00;36:*.ra=00;36:*.wav=00;36:*.axa=00;36:*.oga=00;36:*.spx=00;36:*.xspf=00;36:
$ unset LS_COLORS
$ echo $LS_COLORS

$  time ls --color=always $SCRATCH/dont | wc -l
10000

real    0m13.037s
user    0m0.077s
sys     0m1.092s

என்ன!?! இன்னும் 13 வினாடிகள் உள்ளதா?

சூழல் மாறி போது அது மாறிவிடும் LS_COLORS அதன் உறுப்புகளில் ஒன்று மட்டும் வரையறுக்கப்படவில்லை அல்லது காணவில்லை <type>=color:, இது முன்னிருப்பாக உள்ளமைக்கப்பட்ட தரவுத்தளத்தைப் பயன்படுத்துகிறது மற்றும் இன்னும் வண்ணங்களைப் பயன்படுத்துகிறது. எனவே ஒரு குறிப்பிட்ட கோப்பு வகைக்கு வண்ணமயமாக்கலை முடக்க விரும்பினால், அதை நீங்கள் மேலெழுத வேண்டும் <type>=: அல்லது <type> 00 கோப்பில் DIR_COLORS.

பல சோதனை மற்றும் பிழைகளுக்குப் பிறகு, எங்கள் தேடலை இவ்வாறு சுருக்கினோம்:

EXEC 00
SETUID 00
SETGID 00
CAPABILITY 00

என எழுதப்பட்டுள்ளது

LS_COLORS='ex=00:su=00:sg=00:ca=00:'

இதன் பொருள்: பண்புக்கூறு மூலம் கோப்புகளை வண்ணமயமாக்க வேண்டாம். திறன்களை, ஆனால் கொஞ்சம் கொஞ்சமாக setuid/setgid, மூலமாகவும் இல்லை செயல்படுத்தும் கொடி.

நாங்கள் வேகப்படுத்துகிறோம் ls

நீங்கள் இந்த காசோலைகள் எதையும் செய்யவில்லை என்றால், பின்னர் அழைப்புகள் lstat() மறைந்துவிடும், இப்போது இது முற்றிலும் வேறுபட்ட விஷயம்:

$ export LS_COLORS='ex=00:su=00:sg=00:ca=00:'
$ time strace -c ls --color=always $SCRATCH/dont | wc -l
10000
% time     seconds  usecs/call     calls    errors syscall
------ ----------- ----------- --------- --------- ----------------
 63.02    0.002865          36        80           getdents
  8.10    0.000368          12        30           mmap
  5.72    0.000260          14        18           mprotect
  3.72    0.000169          15        11           open
  2.79    0.000127          13        10           read
[...]
------ ----------- ----------- --------- --------- ----------------
100.00    0.004546                   221         6 total

real    0m0.337s
user    0m0.032s
sys     0m0.029s

0,3 கோப்புகளின் பட்டியலில் 10 வினாடிகள், ஒரு பதிவு.

ஷெர்லாக்கை அமைத்தல்

இயல்புநிலை அமைப்புகளுடன் 13 வினாடிகள் முதல் சிறிய மாற்றங்களுடன் 0,3 வினாடிகள் வரை LS_COLORS இல்லாத காரணத்தால் 40 மடங்கு முடுக்கம் என்று பொருள் setuid / setgid மற்றும் வண்ண இயங்கக்கூடிய கோப்புகள். அவ்வளவு பெரிய இழப்பு இல்லை.

நிச்சயமாக, இது இப்போது ஒவ்வொரு பயனருக்கும் ஷெர்லாக்கில் கட்டமைக்கப்பட்டுள்ளது.

ஆனால் நீங்கள் வண்ணத்தைத் திரும்பப் பெற விரும்பினால், இயல்புநிலை அமைப்புகளுக்குத் திரும்பலாம்:

$ unset LS_COLORS

ஆனால் நிறைய கோப்புகள் உள்ள கோப்பகங்களில், அது இயங்கும் போது காபி காய்ச்சுவதை உறுதிப்படுத்திக் கொள்ளுங்கள் ls.

ஆதாரம்: www.habr.com

கருத்தைச் சேர்