Comhbhrú Teip-Sábháilte Ardluais (Ar lean)

Is é an t-alt seo an dara ceann cheana féin maidir le comhbhrú sonraí ardluais. Rinne an chéad alt cur síos ar chomhbhrúiteoir a oibríonn ar luas 10 GB/soic. in aghaidh an chroí próiseálaí (comhbhrú íosta, RTT-Min).

Tá an comhbhrúiteoir seo curtha i bhfeidhm cheana féin i dtrealamh na ndúblach fóiréinseach le haghaidh comhbhrú ardluais ar dhumpaí meán stórála agus chun neart na cripteagrafaíochta a fheabhsú; is féidir é a úsáid freisin chun íomhánna de mheaisíní fíorúla agus comhaid babhtála RAM a chomhbhrú agus iad á shábháil ar ardluais Tiománaithe SSD.

D'fhógair an chéad alt freisin forbairt algartam comhbhrú chun cóipeanna cúltaca de thiomáineann diosca HDD agus SSD (comhbhrú meánach, RTT-Mid) a chomhbhrú le paraiméadair comhbhrú sonraí feabhsaithe go mór. Faoin am seo, tá an comhbhrúiteoir seo go hiomlán réidh agus tá an t-alt seo faoi.

Soláthraíonn comhbhrúiteoir a chuireann an algartam RTT-Mid i bhfeidhm cóimheas comhbhrú atá inchomparáide le cartlannaithe caighdeánacha mar WinRar, 7-Zip, ag feidhmiú i mód ardluais. Ag an am céanna, tá a luas oibriúcháin ar a laghad ord méide níos airde.

Is paraiméadar ríthábhachtach é luas pacála/díphacáil sonraí a chinneann scóip chur i bhfeidhm na dteicneolaíochtaí comhbhrú. Ní dócha go smaoineodh aon duine ar terabyte sonraí a chomhbhrú ag luas 10-15 Meigibheart in aghaidh an tsoicind (is é seo go díreach luas na gcartlann i mód comhbhrú caighdeánach), mar go dtógfadh sé beagnach fiche uair an chloig le ualach próiseálaí iomlán. .

Ar an láimh eile, is féidir an terabyte céanna a chóipeáil ar luasanna den ord 2-3Gigabytes in aghaidh an tsoicind i thart ar deich nóiméad.

Mar sin, tá sé tábhachtach faisnéis mhóriméid a chomhbhrú má dhéantar é ar luas nach ísle ná luas an fhíorionchuir/aschuir. I gcás córais nua-aimseartha tá sé seo ar a laghad 100 Meigeavata in aghaidh an tsoicind.

Ní féidir le comhbhrúiteoirí nua-aimseartha luasanna den sórt sin a tháirgeadh ach amháin i mód “tapa”. Is sa mhodh reatha seo a chuirfimid an algartam RTT-Mid i gcomparáid le comhbhrúiteoirí traidisiúnta.

Tástáil chomparáideach ar algartam comhbhrú nua

D'oibrigh an comhbhrúiteoir RTT-Mid mar chuid den chlár tástála. I bhfíor-fheidhmchlár "oibre" oibríonn sé i bhfad níos tapúla, úsáideann sé multithreading go ciallmhar agus úsáideann "gnáth" tiomsaitheoir, ní C#.

Ós rud é go bhfuil na comhbhrúiteoirí a úsáidtear sa tástáil chomparáideach tógtha ar phrionsabail éagsúla agus ar chineálacha éagsúla comhbhrú sonraí ar dhóigh dhifriúil, chun oibiachtúlacht na tástála, baineadh úsáid as an modh chun "meánach teocht san ospidéal" a thomhas ...

Cruthaíodh comhad dumpála earnáil-ar-earnáil de dhiosca loighciúil le córas oibriúcháin Windows 10; is é seo an meascán is nádúrtha de struchtúir sonraí éagsúla atá ar fáil i ndáiríre ar gach ríomhaire. Má dhéantar an comhad seo a chomhbhrú, beidh tú in ann luas agus méid comhbhrú an algartam nua a chur i gcomparáid leis na comhbhrúiteoirí is airde a úsáidtear i gcartlannaithe nua-aimseartha.

Seo é an comhad dumpála:

Comhbhrú Teip-Sábháilte Ardluais (Ar lean)

Comhbhrúíodh an comhad dumpála ag baint úsáide as comhbhrúiteoirí PTT-Mid, 7-zip, agus WinRar. Socraíodh an WinRar agus an comhbhrúiteoir 7-zip chuig uasluas.

Comhbhrúiteoir ag rith 7-zip:

Comhbhrú Teip-Sábháilte Ardluais (Ar lean)

Luchtaíonn sé an próiseálaí faoi 100%, agus is é an meánluas chun an dumpáil bhunaidh a léamh ná thart ar 60 Meigibheart/soicind.

Comhbhrúiteoir ag rith fíona:

Comhbhrú Teip-Sábháilte Ardluais (Ar lean)

Tá an scéal mar an gcéanna, tá an t-ualach próiseálaí beagnach 100%, is é an meánluas léitheoireachta dumpála thart ar 125 Meigibheart / soicind.

Mar a tharla sa chás roimhe seo, tá luas an chartlannóra teoranta ag cumais an phróiseálaí.

Tá an clár tástála comhbhrúiteora ar siúl anois RTT-Lár:

Comhbhrú Teip-Sábháilte Ardluais (Ar lean)

Taispeánann an screenshot go bhfuil an próiseálaí luchtaithe ag 50% agus go bhfuil sé díomhaoin an chuid eile den am, toisc nach bhfuil aon áit chun na sonraí comhbhrúite a uaslódáil. Tá an diosca uaslódála sonraí (Diosca 0) beagnach lánluchtaithe. Athraíonn luas léitheoireachta na sonraí (Diosca 1) go mór, ach ar an meán níos mó ná 200 Meigeavata/soicind.

Tá luas an chomhbhrúiteora teoranta sa chás seo ag an gcumas sonraí comhbhrúite a scríobh chuig Diosca 0.

Anois cóimheas comhbhrú na gcartlann dá bharr:

Comhbhrú Teip-Sábháilte Ardluais (Ar lean)

Comhbhrú Teip-Sábháilte Ardluais (Ar lean)

Comhbhrú Teip-Sábháilte Ardluais (Ar lean)

Is féidir a fheiceáil go ndearna an comhbhrúiteoir RTT-Mid an jab is fearr maidir le comhbhrú; bhí an chartlann a chruthaigh sé 1,3 GigaBytes níos lú ná cartlann WinRar agus 2,1 GigaBytes níos lú ná an chartlann 7z.

Am caite ag cruthú na cartlainne:

  • 7-zip - 26 nóiméad 10 soicind;
  • WinRar - 17 nóiméad 40 soicind;
  • RTT-Lár - 7 nóiméad 30 soicind.

Mar sin, bhí fiú clár tástála, neamh-optamaithe, ag baint úsáide as an algartam RTT-Mid, in ann cartlann a chruthú níos mó ná dhá uair go leith níos tapúla, agus bhí an chartlann i bhfad níos lú ná cartlann a iomaitheoirí ...

Is féidir leo siúd nach gcreideann na screenshots a bharántúlacht a sheiceáil iad féin. Tá an clár tástála ar fáil ag nasc, a íoslódáil agus a sheiceáil.

Ach amháin ar phróiseálaithe le tacaíocht AVX-2, gan tacaíocht do na treoracha seo ní oibríonn an comhbhrúiteoir, agus ní dhéanann siad tástáil ar an algartam ar phróiseálaithe AMD níos sine, tá siad mall i dtéarmaí treoracha AVX a fhorghníomhú ...

Modh comhbhrúite a úsáidtear

Úsáideann an algartam modh chun blúirí téacs arís agus arís eile a innéacsú i mbeart granularity. Tá an modh comhbhrúite seo ar eolas le fada an lá, ach níor úsáideadh é toisc go raibh an oibríocht meaitseála an-chostasach i dtéarmaí na n-acmhainní riachtanacha agus go raibh i bhfad níos mó ama ag teastáil uaidh ná foclóir a thógáil. Mar sin is sampla clasaiceach é an algartam RTT-Mid de bhogadh “ar ais go dtí an todhchaí”...

Úsáideann an comhbhrúiteoir PTT scanóir cuardaigh meaitseála ardluais uathúil, a ligeann dúinn an próiseas comhbhrú a bhrostú. Scanóir féin-déanta, is é seo "mo charm ...", "tá sé costasach go leor, toisc go bhfuil sé go hiomlán lámhdhéanta" (scríofa sa cóimeálaí).

Déantar an scanóir cuardaigh meaitseála de réir scéime dóchúlachta dhá leibhéal: ar dtús, déantar “comhartha” meaitseála a scanadh, agus go dtí go n-aithnítear an “comhartha” san áit seo, an nós imeachta chun fíormheaitseáil a bhrath. a thosaítear.

Tá méid dothuartha ag an bhfuinneog cuardaigh meaitseála, ag brath ar mhéid an eantrópachta sa bhloc sonraí próiseáilte. I gcás sonraí atá go hiomlán randamach (do-chomhbhrúite) tá méid meigibheart aige, le haghaidh sonraí a athrá tá sé i gcónaí níos mó ná meigibheart.

Ach tá go leor formáidí sonraí nua-aimseartha do-chomhbhrúite agus tá sé gan úsáid agus cur amú an scanóir atá dian ar acmhainní a rith, mar sin úsáideann an scanóir dhá mhodh oibriúcháin. Ar an gcéad dul síos, déantar cuardach ar chodanna den bhuntéacs a bhféadfaí athrá a dhéanamh orthu; déantar an oibríocht seo freisin trí úsáid a bhaint as modh dóchúlachta agus déantar é go han-tapa (ar luas 4-6 GigaBytes/soicind). Ansin déanann an príomhscanóir na réimsí ina bhfuil meaitseanna féideartha a phróiseáil.

Níl an comhbhrú innéacs an-éifeachtach, caithfidh tú innéacsanna a chur in ionad blúirí dúblacha, agus laghdaíonn an t-eagar innéacs go mór an cóimheas comhbhrú.

Chun an cóimheas comhbhrú a mhéadú, ní hamháin go ndéantar meaitseálacha iomlána na teaghráin beart a innéacsú, ach cinn pháirteacha freisin, nuair a bhíonn bearta meaitseála agus beart neamhmheaitseála sa teaghrán. Chun seo a dhéanamh, cuimsíonn an fhormáid innéacs réimse masc meaitseála a léiríonn bearta meaitseála dhá bhloc. Ar mhaithe le comhbhrú níos mó fós, baintear úsáid as innéacsú chun roinnt bloic atá meaitseála go páirteach a fhorshuí ar an mbloc reatha.

D'fhág sé seo go léir gur féidir cóimheas comhbhrú a fháil sa chomhbhrúiteoir PTT-Lár atá inchomparáide le comhbhrúiteoirí a rinneadh ag baint úsáide as an modh foclóir, ach a oibríonn i bhfad níos tapúla.

Luas an algartam comhbhrú nua

Má oibríonn an comhbhrúiteoir le húsáid eisiach cuimhne taisce (tá 4 Meigeavata ag teastáil in aghaidh an tsnáithe), ansin raonta an luas oibriúcháin ó 700-2000 Meigeavata/soicind. in aghaidh croí an phróiseálaí, ag brath ar an gcineál sonraí atá á gcomhbhrú agus ag brath beagán ar mhinicíocht oibriúcháin an phróiseálaí.

Le cur i bhfeidhm il-snáithithe an chomhbhrúiteora, déantar scalability éifeachtach a chinneadh de réir mhéid an taisce tríú leibhéal. Mar shampla, le 9 Meigeavata de chuimhne taisce “ar bord”, níl aon phointe ann níos mó ná dhá shnáithe comhbhrú a sheoladh; ní mhéadóidh an luas uaidh seo. Ach le taisce 20 Meigeavata, is féidir leat cúig snáithe comhbhrú a rith cheana féin.

Chomh maith leis sin, bíonn latency an RAM ina pharaiméadar tábhachtach a chinneann luas an chomhbhrúiteora. Úsáideann an algartam rochtain randamach ar an OP, agus ní théann cuid acu isteach sa chuimhne taisce (thart ar 10%) agus caithfidh sé díomhaoin, ag fanacht le sonraí ón OP, rud a laghdaíonn luas na hoibríochta.

Bíonn tionchar suntasach aige ar luas an chomhbhrúiteora agus ar oibriú an chórais ionchuir/aschuir sonraí. Cuireann iarratais chuig an OP ó I/O bac ar iarratais ar shonraí ón LAP, rud a laghdaíonn an luas comhbhrú freisin. Tá an fhadhb seo suntasach do ríomhairí glúine agus deasc; do fhreastalaithe níl sé chomh suntasach mar gheall ar aonad rialaithe rochtana bus córais níos forbartha agus RAM ilchainéil.

Ar fud an téacs san alt bímid ag caint faoi chomhbhrú; fanann dí-chomhbhrú lasmuigh de raon feidhme an ailt seo ós rud é go bhfuil “gach rud clúdaithe le seacláid”. Tá an dí-chomhbhrú i bhfad níos tapúla agus tá sé teoranta ag luas I/O. Soláthraíonn croí fisiciúil amháin i snáithe amháin luasanna díphacáil 3-4 GB/soic go héasca.

Tá sé seo mar gheall ar an easpa oibríocht chuardaigh meaitseála le linn an phróisis dí-chomhbhrúite, a "itheann suas" príomh-acmhainní an phróiseálaí agus cuimhne taisce le linn comhbhrú.

Iontaofacht stórála sonraí comhbhrúite

Mar a thugann ainm an aicme iomlán bogearraí a úsáideann comhbhrú sonraí (cartlanna), tá siad deartha chun faisnéis a stóráil go fadtéarmach, ní ar feadh na mblianta, ach ar feadh na gcéadta bliain agus na mílte bliain ...

Le linn stórála, cailleann meáin stórála roinnt sonraí, seo sampla:

Comhbhrú Teip-Sábháilte Ardluais (Ar lean)

Tá an t-iompróir faisnéise “analógach” seo míle bliain d'aois, tá roinnt blúirí caillte, ach go ginearálta tá an fhaisnéis “inléite”...

Ní sholáthraíonn aon cheann de na monaróirí atá freagrach as córais stórála sonraí digiteacha nua-aimseartha agus meáin dhigiteacha ráthaíochtaí maidir le sábháilteacht sonraí iomlán ar feadh níos mó ná 75 bliain.
Agus is fadhb í seo, ach fadhb ar athló, réiteoidh ár sliocht é ...

Is féidir le córais stórála sonraí digiteacha sonraí a chailleadh, ní hamháin tar éis 75 bliain, is féidir le hearráidí i sonraí a bheith le feiceáil tráth ar bith, fiú le linn a dtaifeadta, déanann siad iarracht na saobhadh seo a íoslaghdú trí úsáid a bhaint as iomarcaíocht agus iad a cheartú le córais ceartúcháin earráide. Ní féidir le córais iomarcaíochta agus ceartúcháin faisnéis caillte a thabhairt ar ais i gcónaí, agus má dhéanann siad, níl aon ráthaíocht ann gur críochnaíodh an oibríocht athchóirithe i gceart.

Agus is fadhb mhór é seo freisin, ach ní fadhb iarchurtha é, ach fadhb reatha.

Tá comhbhrúiteoirí nua-aimseartha a úsáidtear chun sonraí digiteacha a chur i gcartlann bunaithe ar mhodhnuithe éagsúla ar mhodh an fhoclóra, agus i gcartlann dá leithéid is teagmhas marfach a bheidh ann píosa faisnéise a chailleadh; tá téarma bunaithe fiú dá leithéid de chás - cartlann “briste”. ...

Baineann iontaofacht íseal faisnéise a stóráil i gcartlann le comhbhrú foclóir le struchtúr na sonraí comhbhrúite. Níl an téacs foinseach san fhaisnéis i gcartlann den sórt sin, stóráiltear líon na n-iontrálacha san fhoclóir ann, agus déantar an foclóir féin a mhodhnú go dinimiciúil leis an téacs comhbhrúite reatha. Má chailltear nó má thruaillítear blúire cartlainne, ní féidir gach iontráil cartlainne ina dhiaidh sin a aithint de réir an ábhair nó fad na hiontrála san fhoclóir, toisc nach léir cad a fhreagraíonn d’uimhir iontrála an fhoclóra.

Ní féidir faisnéis a thabhairt ar ais ó chartlann “briste” dá leithéid.

Tá an algartam RTT bunaithe ar mhodh níos iontaofa chun sonraí comhbhrúite a stóráil. Úsáideann sé an modh innéacs chun blúirí athfhillteacha a chuntas. Ligeann an cur chuige seo maidir le comhbhrú duit na hiarmhairtí a bhaineann le saobhadh faisnéise ar an meán stórála a íoslaghdú, agus i go leor cásanna saobhadh a d'eascair le linn stórála faisnéise a cheartú go huathoibríoch.
Tá sé seo mar gheall ar an bhfíric go bhfuil dhá réimse sa chomhad cartlainne i gcás comhbhrú innéacs:

  • réimse téacs foinse le hailt athdhéanta bainte as;
  • réimse innéacs.

Níl an réimse innéacs, atá ríthábhachtach maidir le haisghabháil faisnéise, mór i méid agus is féidir é a mhacasamhlú le haghaidh stórála iontaofa sonraí. Mar sin, fiú má chailltear blúire den téacs foinse nó den eagar innéacs, déanfar an fhaisnéis eile ar fad a athchóiriú gan fadhbanna, mar atá sa phictiúr le meán stórála “analógach”.

Míbhuntáistí an algartam

Níl aon buntáistí gan míbhuntáistí. Ní dhéanann an modh comhbhrú innéacs sraitheanna gearra athfhillteacha a chomhbhrú. Tá sé seo mar gheall ar theorainneacha an mhodha innéacs. Tá innéacsanna 3 beart ar a laghad i méid agus is féidir leo a bheith suas le 12 beart. Má aimsítear athrá le méid níos lú ná an t-innéacs a chuireann síos air, ní chuirtear san áireamh é, is cuma cé chomh minic a aimsítear athrá den sórt sin sa chomhad comhbhrúite.

Comhbhrúíonn an modh comhbhrú foclóir traidisiúnta go héifeachtach athrá iolrach de fhad gearr agus mar sin baintear amach cóimheas comhbhrú níos airde ná comhbhrú innéacs. Fíor, baintear é seo amach mar gheall ar an ualach ard ar an bpróiseálaí lárnach; ionas gur féidir leis an modh foclóir sonraí a chomhbhrú níos éifeachtaí ná an modh innéacs, caithfidh sé an luas próiseála sonraí a laghdú go 10-20 meigibheart in aghaidh an tsoicind ar fhíor. suiteálacha ríomhaireachta le ualach iomlán LAP.

Níl a leithéid de luasanna ísle inghlactha do chórais stórála sonraí nua-aimseartha agus is díol spéise iad níos “acadúla” ná mar is praiticiúil.

Méadófar go mór an méid comhbhrú faisnéise sa chéad mhodhnú eile ar an algartam RTT (RTT-Max), atá á fhorbairt cheana féin.

Mar sin, mar i gcónaí, le leanúint ar aghaidh ...

Foinse: will.com

Add a comment