Ho fumana ts'ebetso ea ts'ebetso ho data ho sebelisoa libakeng tse fapaneng tsa tlhahlobo ea data: taolo ea database, tlhoekiso ea data, boenjineri ba reverse database le tlhahlobo ea data. Re se re phatlalalitse ka ba itšetlehileng ka bona
Khetho ea mosebetsi
Ha ke ntse ke ithuta setsing sa CS, ke ile ka qala ho ithuta li-database ka botebo, e leng, ho batla ho sebetsa le ho itšetleha ka phapang. Sehlooho sena se ne se amana le sehlooho sa mosebetsi oa ka oa thuto univesithing, kahoo ha ke ntse ke sebetsa mosebetsing oa thuto, ke ile ka qala ho bala lihlooho tse mabapi le mefuta e fapaneng ea ho itšetleha ka marang-rang. Ke ngotse tlhahlobo ea sebaka sena - e 'ngoe ea pele
Nakong ea semester ea ka ea bobeli setsing, ke ile ka qala morero oa ho etsa lipatlisiso ho ntlafatsa li-algorithms bakeng sa ho fumana litšepiso tse sebetsang. O ile a sebetsa ho eona hammoho le seithuti se fumaneng mangolo Univesithing ea St. Petersburg State, Nikita Bobrov ho JetBrains Research.
Ho rarahana ha khomphutha ea ho batla litšepeho tsa ts'ebetso
Bothata bo boholo ke ho rarahana ha computational. Palo ea ho itšetleha ka mokhoa o fokolang le o sa reng letho e lekantsoe ka holimo ka boleng kae - palo ea litšobotsi tsa tafole. Nako ea ts'ebetso ea li-algorithms ha e itšetlehe feela ka palo ea litšoaneleho, empa hape le palo ea mela. Lilemong tsa bo-90, li-algorithms tsa patlo ea molao ho komporo ea kamehla ea komporo e ne e ka sebetsana le li-data tse nang le litšobotsi tse fihlang ho 20 le mela e mashome a likete ka lihora tse 'maloa. Li-algorithms tsa sejoale-joale tse sebetsang ho li-processor tsa li-multi-core processor li lemoha ho its'etleha bakeng sa sete ea data e nang le litšobotsi tse makholo (ho fihla ho 200) le mela e likete tse makholo ka nako e ts'oanang. Leha ho le joalo, sena ha sea lekana: nako e joalo ha e amoheloe bakeng sa lits'ebetso tse ngata tsa lefats'e la nnete. Ka hona, re thehile mekhoa ea ho potlakisa li-algorithm tse teng.
Merero ea caching bakeng sa mateano a litsela
Karolong ea pele ea mosebetsi, re thehile merero ea caching bakeng sa sehlopha sa li-algorithms tse sebelisang mokhoa oa ho arohana ha litsela. Karohano ea tšobotsi ke lethathamo la manane, moo lenane ka leng le nang le linomoro tsa mela tse nang le boleng bo tšoanang bakeng sa tšobotsi e fanoeng. Lethathamo le leng le le leng le joalo le bitsoa sehlopha. Li-algorithms tse ngata tsa sejoale-joale li sebelisa li-partitions ho fumana hore na botšepehi bo tšoaretsoe kapa che, e leng, ba latela lemma: Ho itšetleha. tšoaroa haeba . Mona karohano e khethiloe mme mohopolo oa boholo ba karohano o sebelisoa - palo ea lihlopha ho eona. Li-algorithms tse sebelisang li-partitions, ha boits'oaro bo hatakeloa, eketsa litšoaneleho tse ling ho lehlakoreng le letšehali la boits'oaro, ebe u li pheta hape, ho etsa ts'ebetso ea mateano a li-partitions. Opereishene ena e bitsoa specialization lihloohong. Empa re hlokometse hore li-partitions tsa ho itšetleha tse neng li tla bolokoa feela ka mor'a hore ho be le mekhahlelo e 'maloa ea litsebi li ka sebelisoa hape ka mafolofolo, e leng se ka fokotsang haholo nako ea ho sebetsa ha li-algorithms, kaha ts'ebetso ea mateano a litsela e theko e boima.
Ka hona, re ile ra sisinya hore ho be le heuristic e thehiloeng ho Shannon Entropy le Ginny Uncertainty, hammoho le metric ea rona, eo re e bitsitseng Reverse Entropy. Ke phetoho e nyane ea Shannon Entropy mme e eketseha ha bo ikhethang ba sete ea data bo ntse bo eketseha. The heuristic e sisintsoeng ke e latelang:
ke - tekanyo ea ho ikhetha ea karohano e sa tsoa baloa le ke bohareng ba likhato tsa ho ikhetha bakeng sa litšobotsi tsa motho ka mong. Li-metrics tse tharo tse hlalositsoeng kaholimo li lekoa joalo ka metric e ikhethang. U ka boela ua hlokomela hore ho na le liphetoho tse peli ho heuristic. Ea pele e bonts'a hore na karohano ea hajoale e haufi hakae le senotlolo sa mantlha mme e u lumella ho boloka li-partitions tse hole le senotlolo se ka bang teng. Mofetoleli oa bobeli o u lumella ho lekola ho lula ha cache mme ka hona o khothaletsa ho eketsa likarolo tse ling ho cache haeba sebaka sa mahala se fumaneha. Tharollo e atlehileng ea bothata bona e ile ea re lumella ho potlakisa algorithm ea PYRO ka 10-40%, ho itšetlehile ka dataset. Ke habohlokoa ho hlokomela hore algorithm ea PYRO ke eona e atlehileng ka ho fetisisa sebakeng sena.
Setšoantšong se ka tlase u ka bona liphetho tsa ho sebelisa mokhoa o reriloeng oa heuristic ha o bapisoa le mokhoa oa motheo oa ho boloka chelete ea tšepe. X axis ke logarithmic.
Mokhoa o mong oa ho boloka li-partitions
Joale re ile ra etsa tlhahiso ea mokhoa o mong oa ho boloka li-partitions. Li-partitions ke sehlopha sa lihlopha, tseo e 'ngoe le e' ngoe ea tsona e bolokang palo ea li-tuples tse nang le boleng bo tšoanang bakeng sa litšobotsi tse itseng. Lihlopha tsena li ka ba le tatellano e telele ea linomoro tsa tuple, mohlala, haeba lintlha tse tafoleng li laetsoe. Ka hona, re khothalelitse leano la compression bakeng sa ho boloka li-partitions, e leng polokelo ea nako ea boleng ka lihlopha tsa likarolo:
$$display$$pi(X) = {{underbrace{1, 2, 3, 4, 5}_{Lekhetlo la pele}, katlase{7, 8}_{Second interval}, 10}}\ downarrow{ Compression} \ pi(X) = {{underbrace{$, 1, 5}_{First~interval}, underbrace{7, 8}_{Second~interval}, 10}}$$display$$
Mokhoa ona o khonne ho fokotsa tšebeliso ea mohopolo nakong ea ts'ebetso ea algorithm ea TANE ho tloha ho 1 ho isa ho 25%. TANE algorithm ke algorithm ea khale ea ho batla melao ea federal; e sebelisa li-partitions nakong ea mosebetsi oa eona. E le karolo ea mokhoa ona, ho ile ha khethoa algorithm ea TANE, kaha ho ne ho le bonolo haholo ho kenya ts'ebetsong polokelo ea nakoana ho eona ho feta, ka mohlala, ho PYRO e le ho hlahloba hore na mokhoa o hlophisitsoeng o sebetsa. Liphetho tse fumanoeng li hlahisoa setšoantšong se ka tlase. X axis ke logarithmic.
Seboka sa ADBIS-2019
Ho ipapisitse le liphetho tsa lipatlisiso, ka Loetse 2019 ke phatlalalitse sengoloa
Source: www.habr.com