Ang unang stable na release ng utility para sa pag-download ng GNU web content na Wget2

Pagkatapos ng tatlo at kalahating taon ng pag-unlad, ang unang matatag na paglabas ng proyekto ng GNU Wget2 ay ipinakita, na bumubuo ng isang ganap na muling idinisenyong bersyon ng programa para sa pag-automate ng recursive na pag-download ng GNU Wget na nilalaman. Ang GNU Wget2 ay idinisenyo at muling isinulat mula sa simula at kapansin-pansin para sa paglipat ng pangunahing pag-andar ng isang web client sa libwget library, na maaaring gamitin nang hiwalay sa mga application. Ang utility ay lisensyado sa ilalim ng GPLv3+, at ang library ay lisensyado sa ilalim ng LGPLv3+.

Sa halip na unti-unting i-rework ang umiiral na code base, napagpasyahan na gawing muli ang lahat mula sa simula at magtatag ng isang hiwalay na sangay ng Wget2 upang ipatupad ang mga ideya para sa muling pagsasaayos, pagpapataas ng functionality at paggawa ng mga pagbabago na sumisira sa compatibility. Maliban sa pagtigil sa paggamit ng FTP protocol at sa WARC na format, ang wget2 ay maaaring kumilos bilang isang transparent na kapalit para sa classic na wget utility sa karamihan ng mga sitwasyon.

Gayunpaman, ang wget2 ay may ilang dokumentadong pagkakaiba sa pag-uugali, nagbibigay ng humigit-kumulang 30 karagdagang mga opsyon, at huminto sa pagsuporta sa ilang dosenang mga opsyon. Kasama ang pagpoproseso ng mga opsyon gaya ng "-ask-password", "-header", "-exclude-directories", "-ftp*", "-warc*", "-limit-rate", "-relative" ay naging huminto " at "--unlink".

Kabilang sa mga pangunahing inobasyon ang:

  • Ang paglipat ng pag-andar sa libwget library.
  • Paglipat sa multi-threaded na arkitektura.
  • Kakayahang magtatag ng maraming koneksyon nang magkatulad at mag-download sa maraming mga thread. Posible ring i-parallelize ang pag-download ng isang file na nahahati sa mga bloke gamit ang opsyong "-chunk-size".
  • Suporta sa HTTP/2 protocol.
  • Gamitin ang If-Modified-Since HTTP header para i-download lang ang binagong data.
  • Lumipat sa paggamit ng mga external na limitasyon ng bandwidth gaya ng trickle.
  • Suporta para sa Accept-Encoding header, compressed data transfer, at brotli, zstd, lzip, gzip, deflate, lzma, at bzip2 compression algorithm.
  • Suporta para sa TLS 1.3, OCSP (Online Certificate Status Protocol) para sa pagsuri sa mga binawi na certificate, mekanismo ng HSTS (HTTP Strict Transport Security) para sa pagpilit ng pag-redirect sa HTTPS at HPKP (HTTP Public Key Pinning) para sa pag-binding ng certificate.
  • Kakayahang gumamit ng GnuTLS, WolfSSL at OpenSSL bilang mga backend para sa TLS.
  • Suporta para sa mabilis na pagbubukas ng mga koneksyon sa TCP (TCP FastOpen).
  • Built-in na Metalink format na suporta.
  • Suporta para sa mga internasyonal na pangalan ng domain (IDNA2008).
  • Ang kakayahang sabay na magtrabaho sa maraming proxy server (ilo-load ang isang stream sa pamamagitan ng isang proxy, at ang pangalawa sa pamamagitan ng isa pa).
  • Built-in na suporta para sa mga news feed sa mga format ng Atom at RSS (halimbawa, para sa pag-scan at pag-download ng mga link). Maaaring ma-download ang data ng RSS/Atom mula sa isang lokal na file o sa network.
  • Suporta para sa pagkuha ng mga URL mula sa Sitemaps. Availability ng mga parser para sa pagkuha ng mga link mula sa CSS at XML file.
  • Suporta para sa 'isama' na direktiba sa mga configuration file at pamamahagi ng mga setting sa ilang mga file (/etc/wget/conf.d/*.conf).
  • Built-in na mekanismo ng pag-cache ng query ng DNS.
  • Posibilidad ng pag-recoding ng nilalaman sa pamamagitan ng pagbabago ng pag-encode ng dokumento.
  • Accounting para sa "robots.txt" file sa panahon ng recursive download.
  • Maaasahang write mode na may fsync() na tawag pagkatapos mag-save ng data.
  • Ang kakayahang ipagpatuloy ang mga naantalang session ng TLS, pati na rin ang pag-cache at pag-save ng mga parameter ng session ng TLS sa isang file.
  • "--input-file-" mode para sa paglo-load ng mga URL na dumarating sa karaniwang input stream.
  • Sinusuri ang saklaw ng Cookie laban sa direktoryo ng mga pampublikong domain suffix (Listahan ng Pampublikong Suffix) upang ihiwalay sa bawat isa ang iba't ibang mga site na naka-host sa parehong pangalawang antas na domain (halimbawa, "a.github.io" at "b.github. io”).
  • Sinusuportahan ang pag-download ng ICEcast/SHOUTcast streaming.

Pinagmulan: opennet.ru

Magdagdag ng komento