Fumana ka nepo litšepeho tsa ts'ebetso ho li-database

Ho fumana ts'ebetso ea ts'ebetso ho data ho sebelisoa libakeng tse fapaneng tsa tlhahlobo ea data: taolo ea database, tlhoekiso ea data, boenjineri ba reverse database le tlhahlobo ea data. Re se re phatlalalitse ka ba itšetlehileng ka bona sengoloa Anastasia Birillo le Nikita Bobrov. Lekhetlong lena, Anastasia, ea fumaneng mangolo Setsing sa Saense ea Khomphutha selemong sena, o arolelana nts'etsopele ea mosebetsi ona e le karolo ea mosebetsi oa lipatlisiso oo a ileng a o sireletsa setsing.

Fumana ka nepo litšepeho tsa ts'ebetso ho li-database

Khetho ea mosebetsi

Ha ke ntse ke ithuta setsing sa CS, ke ile ka qala ho ithuta li-database ka botebo, e leng, ho batla ho sebetsa le ho itšetleha ka phapang. Sehlooho sena se ne se amana le sehlooho sa mosebetsi oa ka oa thuto univesithing, kahoo ha ke ntse ke sebetsa mosebetsing oa thuto, ke ile ka qala ho bala lihlooho tse mabapi le mefuta e fapaneng ea ho itšetleha ka marang-rang. Ke ngotse tlhahlobo ea sebaka sena - e 'ngoe ea pele lihlooho ka Senyesemane mme a e romela ho seboka sa SEIM-2017. Ke ile ka thaba haholo ha ke fumana hore o amohetsoe ka mor'a tsohle, 'me ka etsa qeto ea ho teba ka taba ena. Khopolo ka boeona ha e ncha - e qalile ho sebelisoa morao lilemong tsa bo-90, empa le hona joale e sebelisoa libakeng tse ngata.

Nakong ea semester ea ka ea bobeli setsing, ke ile ka qala morero oa ho etsa lipatlisiso ho ntlafatsa li-algorithms bakeng sa ho fumana litšepiso tse sebetsang. O ile a sebetsa ho eona hammoho le seithuti se fumaneng mangolo Univesithing ea St. Petersburg State, Nikita Bobrov ho JetBrains Research.

Ho rarahana ha khomphutha ea ho batla litšepeho tsa ts'ebetso

Bothata bo boholo ke ho rarahana ha computational. Palo ea ho itšetleha ka mokhoa o fokolang le o sa reng letho e lekantsoe ka holimo ka boleng Fumana ka nepo litšepeho tsa ts'ebetso ho li-databasekae Fumana ka nepo litšepeho tsa ts'ebetso ho li-database - palo ea litšobotsi tsa tafole. Nako ea ts'ebetso ea li-algorithms ha e itšetlehe feela ka palo ea litšoaneleho, empa hape le palo ea mela. Lilemong tsa bo-90, li-algorithms tsa patlo ea molao ho komporo ea kamehla ea komporo e ne e ka sebetsana le li-data tse nang le litšobotsi tse fihlang ho 20 le mela e mashome a likete ka lihora tse 'maloa. Li-algorithms tsa sejoale-joale tse sebetsang ho li-processor tsa li-multi-core processor li lemoha ho its'etleha bakeng sa sete ea data e nang le litšobotsi tse makholo (ho fihla ho 200) le mela e likete tse makholo ka nako e ts'oanang. Leha ho le joalo, sena ha sea lekana: nako e joalo ha e amoheloe bakeng sa lits'ebetso tse ngata tsa lefats'e la nnete. Ka hona, re thehile mekhoa ea ho potlakisa li-algorithm tse teng.

Merero ea caching bakeng sa mateano a litsela

Karolong ea pele ea mosebetsi, re thehile merero ea caching bakeng sa sehlopha sa li-algorithms tse sebelisang mokhoa oa ho arohana ha litsela. Karohano ea tšobotsi ke lethathamo la manane, moo lenane ka leng le nang le linomoro tsa mela tse nang le boleng bo tšoanang bakeng sa tšobotsi e fanoeng. Lethathamo le leng le le leng le joalo le bitsoa sehlopha. Li-algorithms tse ngata tsa sejoale-joale li sebelisa li-partitions ho fumana hore na botšepehi bo tšoaretsoe kapa che, e leng, ba latela lemma: Ho itšetleha. Fumana ka nepo litšepeho tsa ts'ebetso ho li-database tšoaroa haeba Fumana ka nepo litšepeho tsa ts'ebetso ho li-database. Mona Fumana ka nepo litšepeho tsa ts'ebetso ho li-database karohano e khethiloe mme mohopolo oa boholo ba karohano o sebelisoa - palo ea lihlopha ho eona. Li-algorithms tse sebelisang li-partitions, ha boits'oaro bo hatakeloa, eketsa litšoaneleho tse ling ho lehlakoreng le letšehali la boits'oaro, ebe u li pheta hape, ho etsa ts'ebetso ea mateano a li-partitions. Opereishene ena e bitsoa specialization lihloohong. Empa re hlokometse hore li-partitions tsa ho itšetleha tse neng li tla bolokoa feela ka mor'a hore ho be le mekhahlelo e 'maloa ea litsebi li ka sebelisoa hape ka mafolofolo, e leng se ka fokotsang haholo nako ea ho sebetsa ha li-algorithms, kaha ts'ebetso ea mateano a litsela e theko e boima.

Ka hona, re ile ra sisinya hore ho be le heuristic e thehiloeng ho Shannon Entropy le Ginny Uncertainty, hammoho le metric ea rona, eo re e bitsitseng Reverse Entropy. Ke phetoho e nyane ea Shannon Entropy mme e eketseha ha bo ikhethang ba sete ea data bo ntse bo eketseha. The heuristic e sisintsoeng ke e latelang:

Fumana ka nepo litšepeho tsa ts'ebetso ho li-database

ke Fumana ka nepo litšepeho tsa ts'ebetso ho li-database - tekanyo ea ho ikhetha ea karohano e sa tsoa baloa Fumana ka nepo litšepeho tsa ts'ebetso ho li-databasele Fumana ka nepo litšepeho tsa ts'ebetso ho li-database ke bohareng ba likhato tsa ho ikhetha bakeng sa litšobotsi tsa motho ka mong. Li-metrics tse tharo tse hlalositsoeng kaholimo li lekoa joalo ka metric e ikhethang. U ka boela ua hlokomela hore ho na le liphetoho tse peli ho heuristic. Ea pele e bonts'a hore na karohano ea hajoale e haufi hakae le senotlolo sa mantlha mme e u lumella ho boloka li-partitions tse hole le senotlolo se ka bang teng. Mofetoleli oa bobeli o u lumella ho lekola ho lula ha cache mme ka hona o khothaletsa ho eketsa likarolo tse ling ho cache haeba sebaka sa mahala se fumaneha. Tharollo e atlehileng ea bothata bona e ile ea re lumella ho potlakisa algorithm ea PYRO ka 10-40%, ho itšetlehile ka dataset. Ke habohlokoa ho hlokomela hore algorithm ea PYRO ke eona e atlehileng ka ho fetisisa sebakeng sena.

Setšoantšong se ka tlase u ka bona liphetho tsa ho sebelisa mokhoa o reriloeng oa heuristic ha o bapisoa le mokhoa oa motheo oa ho boloka chelete ea tšepe. X axis ke logarithmic.

Fumana ka nepo litšepeho tsa ts'ebetso ho li-database

Mokhoa o mong oa ho boloka li-partitions

Joale re ile ra etsa tlhahiso ea mokhoa o mong oa ho boloka li-partitions. Li-partitions ke sehlopha sa lihlopha, tseo e 'ngoe le e' ngoe ea tsona e bolokang palo ea li-tuples tse nang le boleng bo tšoanang bakeng sa litšobotsi tse itseng. Lihlopha tsena li ka ba le tatellano e telele ea linomoro tsa tuple, mohlala, haeba lintlha tse tafoleng li laetsoe. Ka hona, re khothalelitse leano la compression bakeng sa ho boloka li-partitions, e leng polokelo ea nako ea boleng ka lihlopha tsa likarolo:

$$display$$pi(X) = {{underbrace{1, 2, 3, 4, 5}_{Lekhetlo la pele}, katlase{7, 8}_{Second interval}, 10}}\ downarrow{ Compression} \ pi(X) = {{underbrace{$, 1, 5}_{First~interval}, underbrace{7, 8}_{Second~interval}, 10}}$$display$$

Mokhoa ona o khonne ho fokotsa tšebeliso ea mohopolo nakong ea ts'ebetso ea algorithm ea TANE ho tloha ho 1 ho isa ho 25%. TANE algorithm ke algorithm ea khale ea ho batla melao ea federal; e sebelisa li-partitions nakong ea mosebetsi oa eona. E le karolo ea mokhoa ona, ho ile ha khethoa algorithm ea TANE, kaha ho ne ho le bonolo haholo ho kenya ts'ebetsong polokelo ea nakoana ho eona ho feta, ka mohlala, ho PYRO e le ho hlahloba hore na mokhoa o hlophisitsoeng o sebetsa. Liphetho tse fumanoeng li hlahisoa setšoantšong se ka tlase. X axis ke logarithmic.

Fumana ka nepo litšepeho tsa ts'ebetso ho li-database

Seboka sa ADBIS-2019

Ho ipapisitse le liphetho tsa lipatlisiso, ka Loetse 2019 ke phatlalalitse sengoloa Smart Caching bakeng sa ho Fumaneha ho Tšepahalang ho Ts'ebetsong ho Molemo Sebokeng sa 23 sa Europe mabapi le Tsoelo-pele ho Databases le Information Systems (ADBIS-2019). Nakong ea nehelano, mosebetsi o ile oa hlokomeloa ke Bernhard Thalheim, motho oa bohlokoa lefapheng la database. Liphetho tsa liphuputso li ile tsa theha motheo oa lengolo la ka la thuto ea mahlale a lipalo le mechanics Univesithing ea St. Petersburg State, eo ka eona mekhoa e 'meli e sisintsoeng (caching le compression) e kenngoeng ts'ebetsong ho li-algorithms ka bobeli: TANE le PYRO. Ho feta moo, liphetho li bonts'itse hore mekhoa e reriloeng ke ea bokahohleng, kaha ho li-algorithms ka bobeli, ka mekhoa e 'meli, ho ile ha bonoa phokotso e kholo ea tšebeliso ea mohopolo, hammoho le phokotso e kholo ea nako ea ts'ebetso ea li-algorithms.

Source: www.habr.com

Eketsa ka tlhaloso