Функционалдык көз карандылыктарга киришүү

Бул макалада биз маалымат базаларындагы функционалдык көз карандылыктар жөнүндө сүйлөшөбүз - алар эмне, алар кайда колдонулат жана аларды табуу үчүн кандай алгоритмдер бар.

Функционалдык көз карандылыктарды реляциялык маалымат базаларынын контекстинде карайбыз. Болжол менен айтканда, мындай маалымат базаларында маалымат таблица түрүндө сакталат. Андан кийин, биз катаал реляциялык теорияда бири-бирин алмаштырууга мүмкүн болбогон болжолдуу түшүнүктөрдү колдонобуз: биз таблицанын өзүн байланыш деп атайбыз, мамычаларды - атрибуттар (алардын жыйындысы - мамилелердин схемасы) жана атрибуттардын бир бөлүгүндөгү сап маанилеринин жыйындысы. - кортеж.

Функционалдык көз карандылыктарга киришүү

Мисалы, жогорудагы таблицада, (Бенсон, М, М орган) атрибуттардын жыйындысы (Бейтап, Пол, Доктур).
Расмий түрдө бул төмөнкүчө жазылган: Функционалдык көз карандылыктарга киришүү[Пациент, Жыныс, Дарыгер] = (Бенсон, M, M органы).
Эми биз функционалдык көз карандылык (FD) түшүнүгүн киргизсек болот:

Аныктама 1. R катышы X → Y федералдык мыйзамын (мында X, Y ⊆ R) канааттандырат, эгер кандайдыр бир кортеждер үчүн гана Функционалдык көз карандылыктарга киришүү, Функционалдык көз карандылыктарга киришүү ∈ R кармайт: эгерде Функционалдык көз карандылыктарга киришүү[X] = Функционалдык көз карандылыктарга киришүү[X], анда Функционалдык көз карандылыктарга киришүү[Y] = Функционалдык көз карандылыктарга киришүү[Y]. Бул учурда, биз X (аныктоочу же аныктоочу атрибуттар жыйындысы) функционалдык түрдө Y (көз каранды топтом) аныктайт деп айтабыз.

Башкача айтканда, федералдык мыйзамдын болушу X → Y дегенди билдирет, эгерде бизде эки кортеж бар болсо R жана алар атрибуттары боюнча дал келет X, анда алар атрибуттары боюнча дал келет Y.
Ал эми азыр, тартиби. Келгиле, атрибуттарды карап көрөлү Оорулуу и Пабыл бул үчүн биз алардын ортосунда көз карандылык бар же жок экенин билгибиз келет. Мындай атрибуттар топтому үчүн төмөнкү көз карандылыктар болушу мүмкүн:

  1. Пациент → Жынысы
  2. Жынысы → Пациент

Жогоруда аныкталгандай, биринчи көз карандылык сакталышы үчүн, ар бир уникалдуу мамычанын мааниси Оорулуу бир гана мамычанын мааниси дал келиши керек Пабыл. Ал эми мисал таблицасы үчүн бул чындыгында ушундай. Бирок, бул карама-каршы багытта иштебейт, башкача айтканда, экинчи көз карандылык канааттандырылбайт жана атрибут Пабыл үчүн аныктоочу эмес Пациент. Ошо сыяктуу эле, эгерде биз көз карандылыкты алсак Дарыгер → Пациент, нарктан бери бузулганын көрө аласыз Robin бул атрибут бир нече ар кандай мааниге ээ - Эллис жана Грэм.

Функционалдык көз карандылыктарга киришүү

Функционалдык көз карандылыктарга киришүү

Ошентип, функционалдык көз карандылыктар таблица атрибуттарынын топтомдорунун ортосундагы болгон байланыштарды аныктоого мүмкүндүк берет. Мындан ары биз эң кызыктуу байланыштарды, тагыраак айтканда, ушундайларды карап чыгабыз X → Yалар эмне:

  • тривиалдуу эмес, башкача айтканда, көз карандылыктын оң жагы солдун бир бөлүгү эмес (Y ̸⊆ X);
  • минималдуу, башкача айтканда, мындай көз карандылык жок Z → Yошол Z ⊂ X.

Ушул кезге чейин каралып жаткан көз карандылык катуу болгон, башкача айтканда, алар үстөлдө эч кандай бузууларды караган эмес, бирок аларга кошумча, кортеждердин баалуулуктарынын ортосунда кандайдыр бир карама-каршылыкка жол бергендер да бар. Мындай көз карандылыктар болжолдуу деп аталган өзүнчө класска жайгаштырылат жана кортеждердин белгилүү бир саны үчүн бузууга жол берилет. Бул сумма максималдуу ката көрсөткүчү emax менен жөнгө салынат. Мисалы, ката ылдамдыгы Функционалдык көз карандылыктарга киришүү = 0.01 көз карандылыкты атрибуттардын каралып жаткан топтомундагы жеткиликтүү кортеждердин 1% бузууга мүмкүн экенин билдириши мүмкүн. Башкача айтканда, 1000 жазуу үчүн эң көп дегенде 10 кортеж Федералдык Мыйзамды бузушу мүмкүн. Салыштырылып жаткан кортеждердин ар кандай маанилерине негизделген бир аз башкача метриканы карап чыгабыз. Көз карандылык үчүн X → Y мамилеси боюнча r мындай деп эсептелет:

Функционалдык көз карандылыктарга киришүү

Келгиле, катаны эсептеп көрөлү Дарыгер → Пациент жогорудагы мисалдан. Бизде баалуулуктары атрибут боюнча айырмаланган эки кортеж бар Оорулуу, бирок дал келет Доктур: Функционалдык көз карандылыктарга киришүү[Дарыгер, Пациент] = (Робин, Эллис) жана Функционалдык көз карандылыктарга киришүү[Дарыгер, Пациент] = (Робин, Грэм). Ката аныктамасынан кийин, биз карама-каршы келген бардык жуптарды эске алышыбыз керек, демек, алардын экөөсү болот: (Функционалдык көз карандылыктарга киришүү, Функционалдык көз карандылыктарга киришүү) жана анын тескери (Функционалдык көз карандылыктарга киришүү, Функционалдык көз карандылыктарга киришүү). Аны формулага алмаштырып, аны алалы:

Функционалдык көз карандылыктарга киришүү

Эми суроого жооп берүүгө аракет кылып көрөлү: "Мунун баары эмне үчүн?" Чынында, федералдык мыйзамдар ар түрдүү. Биринчи түрү - бул маалымат базасын долбоорлоо баскычында администратор тарабынан аныкталган көз карандылыктар. Адатта, алардын саны аз, катаал жана негизги колдонмо маалыматтарды нормалдаштыруу жана реляциялык схемаларды долбоорлоо болуп саналат.

Экинчи түрү - "жашыруун" маалыматтарды жана атрибуттардын ортосундагы мурда белгисиз мамилелерди билдирген көз карандылыктар. Башкача айтканда, мындай көз карандылыктар долбоорлоо учурунда ойлонулган эмес жана алар бар маалыматтар топтому үчүн табылган, ошондуктан кийинчерээк аныкталган көптөгөн федералдык мыйзамдардын негизинде сакталган маалымат боюнча кандайдыр бир тыянак чыгарууга болот. Дал ушул көз карандылыктар менен биз иштейбиз. Алар ар кандай издөө ыкмалары жана алардын негизинде түзүлгөн алгоритмдер менен маалыматтарды казып алуунун бүтүндөй чөйрөсү менен алектенет. Келгиле, ар кандай маалыматтарда табылган функционалдык көз карандылыктар (так же болжолдуу) кандайча пайдалуу болушу мүмкүн экенин карап көрөлү.

Функционалдык көз карандылыктарга киришүү

Бүгүнкү күндө, көз карандылыктын негизги колдонмолорунун бири маалыматтарды тазалоо болуп саналат. Ал "ыплас маалыматтарды" аныктоо процесстерин иштеп чыгууну жана аны оңдоону камтыйт. "Кирги маалыматтардын" көрүнүктүү мисалдары - дубликаттар, маалымат каталары же каталар, жетишпеген маанилер, эскирген маалыматтар, кошумча боштуктар жана ушул сыяктуулар.

Маалымат катасынын мисалы:

Функционалдык көз карандылыктарга киришүү

Маалыматтардагы кайталанмалардын мисалы:

Функционалдык көз карандылыктарга киришүү

Мисалы, бизде үстөл жана аткарылышы керек федералдык мыйзамдардын жыйындысы бар. Бул учурда маалыматтарды тазалоо Федералдык мыйзамдар туура болушу үчүн маалыматтарды өзгөртүүнү камтыйт. Бул учурда, өзгөртүүлөрдүн саны минималдуу болушу керек (бул процедуранын өзүнүн алгоритмдери бар, биз бул макалада токтолбойбуз). Төмөндө мындай маалыматтарды трансформациялоонун мисалы келтирилген. Сол жакта оригиналдуу мамилелер, анда, албетте, зарыл болгон FL жооп бербейт (FL'лердин биринин бузулушунун мисалы кызыл менен белгиленген). Оң жакта жаңыланган байланыш, жашыл уячалар өзгөртүлгөн маанилерди көрсөтүүдө. Бул процедурадан кийин керектүү көз карандылык сактала баштады.

Функционалдык көз карандылыктарга киришүү

Дагы бир популярдуу колдонмо маалымат базасынын дизайны болуп саналат. Бул жерде нормалдуу формаларды жана нормалдаштырууну эске салуу керек. Нормалдаштыруу - бул мамилелерди белгилүү бир талаптардын жыйындысына ылайык келтирүү процесси, алардын ар бири өз жолу менен нормалдуу форма менен аныкталат. Биз ар кандай нормалдуу формалардын талаптарын сүрөттөбөйбүз (бул үйрөнчүктөр үчүн маалымат базасы курсу боюнча кандайдыр бир китепте жасалган), бирок алардын ар бири функционалдык көз карандылык түшүнүгүн өз алдынча колдоноорун гана белгилейбиз. Анткени, FL - бул маалымат базасын иштеп чыгууда эске алынуучу бүтүндүктүн чектөөлөрү (бул тапшырманын контекстинде FL кээде супер баскычтар деп аталат).

Төмөндөгү сүрөттө төрт нормалдуу формага алардын арызын карап көрөлү. Эске салсак, Бойс-Кодддун нормалдуу формасы үчүнчү формага караганда катуураак, бирок төртүнчүгө караганда анча катуу эмес. Биз азыр акыркысын карап жаткан жокпуз, анткени аны түзүү үчүн бул макалада биз үчүн кызыксыз болгон көп маанилүү көз карандылыктарды түшүнүү талап кылынат.

Функционалдык көз карандылыктарга киришүү
Функционалдык көз карандылыктарга киришүү
Функционалдык көз карандылыктарга киришүү
Функционалдык көз карандылыктарга киришүү

Көз карандылыктын колдонулушун тапкан дагы бир чөйрө - бул жөнөкөй Бейс классификаторун куруу, маанилүү өзгөчөлүктөрдү аныктоо жана регрессия моделин кайра параметрлөө сыяктуу милдеттерде функция мейкиндигинин өлчөмдүүлүгүн азайтуу. Түпнуска макалаларда бул милдет ашыкча жана өзгөчөлүктүн актуалдуулугун аныктоо деп аталат [5, 6] жана ал маалымат базасы түшүнүктөрүн активдүү колдонуу менен чечилет. Мындай иштердин пайда болушу менен бүгүнкү күндө маалымат базасын, аналитиканы жана жогорудагы оптималдаштыруу маселелерин ишке ашырууну бир куралга бириктирүүгө мүмкүндүк берүүчү чечимдерге суроо-талап бар деп айта алабыз [7, 8, 9].

Берилиштер топтомунда федералдык мыйзамдарды издөө үчүн көптөгөн алгоритмдер (заманбап да, анчалык деле заманбап эмес) бар.Мындай алгоритмдерди үч топко бөлүүгө болот:

  • Алгебралык торлордун өтүүсүн колдонуучу алгоритмдер (Реткаларды өтүү алгоритмдери)
  • макулдашылган баалуулуктарды издөөгө негизделген алгоритмдер (айырма жана макулдашылган алгоритмдер)
  • Жуптук салыштырууларга негизделген алгоритмдер (Көз карандылыкты индукциялоо алгоритмдери)

Алгоритмдин ар бир түрүнүн кыскача сүрөттөлүшү төмөнкү таблицада берилген:
Функционалдык көз карандылыктарга киришүү

Бул классификация тууралуу кененирээк окуй аласыз [4]. Төмөндө ар бир түр үчүн алгоритмдердин мисалдары келтирилген:

Функционалдык көз карандылыктарга киришүү

Функционалдык көз карандылыктарга киришүү

Учурда функционалдык көз карандылыкты табуу үчүн бир нече ыкмаларды бириктирген жаңы алгоритмдер пайда болууда. Мындай алгоритмдердин мисалдары Pyro [2] жана HyFD [3]. Алардын ишинин анализи ушул сериянын кийинки макалаларында күтүлүүдө. Бул макалада биз көз карандылыкты аныктоо ыкмаларын түшүнүү үчүн зарыл болгон негизги түшүнүктөрдү жана лемманы гана карап чыгабыз.

Жөнөкөйдөн баштайлы - экинчи типтеги алгоритмдерде колдонулган айырма жана макул-топтом. Дифференциялар топтому – бул бирдей мааниге ээ болбогон кортеждердин жыйындысы, ал эми макул-топтом, тескерисинче, бирдей мааниге ээ кортеждер. Бул учурда биз көз карандылыктын сол тарабын гана карап жатканыбызды айта кетели.

Жогоруда жолуккан дагы бир маанилүү түшүнүк - алгебралык тор. Көптөгөн заманбап алгоритмдер бул концепцияда иштегендиктен, биз анын эмне экенин түшүнүшүбүз керек.

Решетка түшүнүгүн киргизүү үчүн жарым-жартылай иреттелген көптүктү (же жарым-жартылай иреттелген көптүктү, посет деп кыскартууну) аныктоо керек.

Аныктама 2. Эгерде бардык a, b, c ∈ S үчүн төмөнкү касиеттер аткарылса, S көптүгү экилик катнаш ⩽ боюнча жарым-жартылай иреттелген деп айтылат:

  1. Рефлексивдүүлүк, башкача айтканда, а ⩽ а
  2. Антисиметрия, башкача айтканда, а ⩽ b жана b ⩽ a болсо, анда a = b
  3. Өткөөлдүүлүк, башкача айтканда, a ⩽ b жана b ⩽ c үчүн a ⩽ c


Мындай катыш (бос) жарым-жартылай иреттүү байланыш, ал эми көптүктүн өзү жарым-жартылай иреттелген көптүк деп аталат. Формалдуу белгилер: ⟨S, ⩽⟩.

Жарым-жартылай иреттелген көптүктүн эң жөнөкөй мисалы катары биз кадимки тартиптеги ⩽ катышы бар бардык натурал сандардын N көптүгүн алсак болот. Керектүү аксиомалардын баары канааттандырылганын текшерүү оңой.

Маанилүүраак мисал. ⊆ кошуу байланышы боюнча иреттелген бардык бөлүмчөлөрдүн {1, 2, 3} топтомун карап көрөлү. Чынында эле, бул катыш бардык жарым-жартылай тартип шарттарын канааттандырат, ошондуктан ⟨P ({1, 2, 3}), ⊆⟩ жарым-жартылай иреттелген топтом. Төмөндөгү сүрөттө бул топтомдун структурасы көрсөтүлгөн: эгерде бир элемент башка элементке жебелер менен жетсе, анда алар иреттүү байланышта болушат.

Функционалдык көз карандылыктарга киришүү

Бизге математика тармагынан дагы эки жөнөкөй аныктама керек болот - supremum жана infimum.

Аныктама 3. ⟨S, ⩽⟩ жарым-жартылай иреттелген көптүк, A ⊆ S болсун. Aнын жогорку чеги ∀x ∈ S: x ⩽ u болгон u ∈ S элементи. S бардык жогорку чектеринин жыйындысы U болсун. Эгерде U ичинде эң кичине элемент болсо, анда ал жогорку деп аталат жана A sup деп белгиленет.

так төмөнкү чек түшүнүгү да ушундай эле киргизилген.

Аныктама 4. ⟨S, ⩽⟩ жарым-жартылай иреттелген көптүк, A ⊆ S болсун. L S бардык төмөнкү чектеринин жыйындысы болсун. Эгерде Lде эң чоң элемент бар болсо, анда ал инфимум деп аталат жана inf А деп белгиленет.

Мисал катары жогорудагы жарым-жартылай иреттелген ⟨P ({1, 2, 3}), ⊆⟩ көптүгүн карап көрөлү жана андагы supremum менен infimumду табыңыз:

Функционалдык көз карандылыктарга киришүү

Эми биз алгебралык тордун аныктамасын түзө алабыз.

Аныктама 5. ⟨P,⩽⟩ жарым-жартылай иреттелген көптүк болсун, ар бир эки элементтен турган ички топтом жогорку жана төмөнкү чектерге ээ болсун. Анда Р алгебралык тор деп аталат. Бул учурда, sup{x, y} x ∨ y, ал эми inf {x, y} x ∧ y катары жазылат.

Биздин жумушчу мисалыбыз ⟨P ({1, 2, 3}), ⊆⟩ тор экенин текшерип көрөлү. Чынында эле, ар кандай a үчүн b ∈ P ({1, 2, 3}), a∨b = a∪b жана a∧b = a∩b. Мисалы, {1, 2} жана {1, 3} көптүктөрүн карап, алардын инфимум жана супримумун табыңыз. Эгерде биз аларды кесип өтсөк, анда биз инфимум боло турган {1} көптүгүн алабыз. Аларды бириктирүү менен биз жогорку көрсөткүчтү алабыз - {1, 2, 3}.

Физикалык маселелерди аныктоо алгоритмдеринде издөө мейкиндиги көбүнчө тор түрүндө көрсөтүлөт, мында бир элементтин топтому (издөө торчосунун биринчи деңгээлин оку, мында көз карандылыктын сол жагы бир атрибуттан турат) ар бир атрибутту көрсөтөт. баштапкы мамиледен.
Биринчиден, ∅ → түрүндөгү көз карандылыктарды карайбыз Жалгыз атрибут. Бул кадам кайсы атрибуттар негизги ачкыч экенин аныктоого мүмкүндүк берет (мындай атрибуттар үчүн детерминанттар жок, демек, сол жагы бош). Андан ары мындай алгоритмдер тордун боюнда өйдө карай жылышат. Белгилей кетчү нерсе, торду толугу менен басып өтүүгө болбойт, башкача айтканда, сол тараптын каалаган максималдуу өлчөмү киргизүүгө берилсе, анда алгоритм ошол өлчөмдөгү деңгээлден ары кетпейт.

Төмөнкү сүрөттө алгебралык тордун ФЗ табуу маселесинде кандайча колдонулушу көрсөтүлгөн. Бул жерде ар бир чети (X, XY) көз карандылыкты билдирет X → Y. Мисалы, биз биринчи деңгээлден өтүп, көз карандылык сакталып калганын билебиз A → B (биз муну чокулардын ортосундагы жашыл байланыш катары көрсөтөбүз A и B). Бул мындан ары, биз тор боюнча өйдө жылып, биз көз карандылыкты текшербей калышыбыз мүмкүн дегенди билдирет A, C → B, анткени ал мындан ары минималдуу болбойт. Анын сыңарындай, эгер көз карандылык сакталса, биз аны текшербейт элек C → B.

Функционалдык көз карандылыктарга киришүү
Функционалдык көз карандылыктарга киришүү

Мындан тышкары, эреже катары, федералдык мыйзамдарды издөө үчүн бардык заманбап алгоритмдер бөлүм сыяктуу маалымат структурасын колдонушат (оригиналдуу булакта - ажыратылган бөлүм [1]). Бөлүмдүн формалдуу аныктамасы төмөнкүдөй:

Аныктама 6. X ⊆ R r катышы үчүн атрибуттардын жыйындысы болсун. Кластер – бул X үчүн бирдей мааниге ээ, б.а. c(t) = {i|ti[X] = t[X]} r ичиндеги кортеждердин индекстеринин жыйындысы. Бөлүм узундуктагы кластерлерди кошпогондо кластерлердин жыйындысы:

Функционалдык көз карандылыктарга киришүү

Жөнөкөй сөз менен айтканда, атрибут үчүн бөлүм X тизмелердин жыйындысы болуп саналат, мында ар бир тизмеде бирдей маанидеги сап номерлери бар X. Заманбап адабиятта бөлүмдөрдү билдирген структура позициялар тизмеси индекси (PLI) деп аталат. Бирдик узундуктагы кластерлер PLI кысуу максаттары үчүн алынып салынган, анткени алар ар дайым аныктоо оңой болгон уникалдуу мааниге ээ рекорддук санды гана камтыган кластерлер.

Келгиле, бир мисал карап көрөлү. Келгиле, бейтаптар менен бир таблицага кайрылып, мамычалар үчүн бөлүктөрдү курабыз Оорулуу и Пабыл (сол жакта жаңы тилке пайда болду, анда таблица саптарынын номерлери белгиленген):

Функционалдык көз карандылыктарга киришүү

Функционалдык көз карандылыктарга киришүү

Мындан тышкары, аныктамага ылайык, мамычаны үчүн бөлүм Оорулуу чындыгында бош болот, анткени жалгыз кластерлер бөлүмдөн чыгарылат.

Бөлүмдөрдү бир нече атрибуттар боюнча алууга болот. Жана муну жасоонун эки жолу бар: таблицадан өтүп, бир эле учурда бардык керектүү атрибуттарды колдонуу менен бөлүктү куруңуз же атрибуттардын кичи жыйындысын колдонуу менен бөлүмдөрдүн кесилишинин операциясын колдонуп куруңуз. Федералдык мыйзам издөө алгоритмдери экинчи вариантты колдонушат.

Жөнөкөй сөз менен айтканда, мисалы, тилкелер боюнча бөлүктү алуу ABC, үчүн бөлүктөрүн ала аласыз AC и B (же башка бөлүктөрүнүн топтомдору) жана аларды бири-бири менен кесип. Эки бөлүмдүн кесилишинин операциясы эки бөлүмгө тең жалпы болгон эң чоң узундуктагы кластерлерди тандайт.

Келгиле, бир мисал карап көрөлү:

Функционалдык көз карандылыктарга киришүү

Функционалдык көз карандылыктарга киришүү

Биринчи учурда, биз бош бөлүктү алдык. Эгер үстөлгө кылдаттык менен карасаңыз, анда чындап эле, эки атрибут үчүн бирдей маанилер жок. Эгерде биз үстөлдү бир аз өзгөртсөк (оң жактагы корпус), биз бош эмес кесилишке ээ болобуз. Мындан тышкары, 1 жана 2-саптар чындыгында атрибуттар үчүн бирдей маанилерди камтыйт Пабыл и доктор.

Андан кийин, бизге бөлүмдүн өлчөмү сыяктуу түшүнүк керек болот. Расмий түрдө:

Функционалдык көз карандылыктарга киришүү

Жөнөкөй сөз менен айтканда, бөлүмдүн өлчөмү - бул бөлүмгө кирген кластерлердин саны (бөлүмгө бирдиктүү кластерлер кирбей турганын унутпаңыз!):

Функционалдык көз карандылыктарга киришүү

Функционалдык көз карандылыктарга киришүү

Эми биз негизги леммалардын бирин аныктай алабыз, ал берилген бөлүмдөр үчүн көз карандылык сакталганбы же жокпу аныктоого мүмкүндүк берет:

Лемма 1. A, B → C көз карандылыгы, эгерде жана эгерде гана сакталат

Функционалдык көз карандылыктарга киришүү

Леммага ылайык, көз карандылык бар же жок экенин аныктоо үчүн төрт кадам аткарылышы керек:

  1. Көз карандылыктын сол тарабы үчүн бөлүктү эсептеңиз
  2. Көз карандылыктын оң тарабы үчүн бөлүктү эсептеңиз
  3. Биринчи жана экинчи кадамдын продуктусун эсептегиле
  4. Биринчи жана үчүнчү кадамдарда алынган бөлүмдөрдүн өлчөмдөрүн салыштырыңыз

Төмөндө көз карандылыктын ушул леммага ылайык келерин текшерүүнүн мисалы келтирилген:

Функционалдык көз карандылыктарга киришүү
Функционалдык көз карандылыктарга киришүү
Функционалдык көз карандылыктарга киришүү
Функционалдык көз карандылыктарга киришүү

Бул макалада биз функционалдык көз карандылык, болжолдуу функциялык көз карандылык сыяктуу түшүнүктөрдү карап чыктык, алар кайда колдонуларын, ошондой эле физикалык функцияларды издөө үчүн кандай алгоритмдер бар экенин карап чыктык. Биз ошондой эле федералдык мыйзамдарды издөө үчүн заманбап алгоритмдерде жигердүү колдонулган негизги, бирок маанилүү түшүнүктөрдү кылдат карап чыктык.

Шилтемелер:

  1. Huhtala Y. жана башкалар. TANE: Функционалдык жана болжолдуу көз карандылыкты табуу үчүн эффективдүү алгоритм //Компьютер журналы. – 1999. – Т. 42. – Жок. 2. – 100-111-бб.
  2. Kruse S., Naumann F. Болжолдуу көз карандылыктарды натыйжалуу ачуу // VLDB фондусунун материалдары. – 2018. – Т. 11. – Жок. 7. – 759-772-бб.
  3. Papenbrock T., Naumann F. Функционалдык көз карандылыкты табууга гибриддик мамиле // Маалыматтарды башкаруу боюнча 2016-жылдагы Эл аралык конференциянын материалдары. – ACM, 2016. – 821-833-бб.
  4. Papenbrock T. et al. Функционалдык көз карандылыктын ачылышы: Жети алгоритмдин эксперименталдык баасы //VLDB Endowmentинин материалдары. – 2015. – Т. 8. – Жок. 10. – 1082-1093-бб.
  5. Кумар А. жана башкалар. Кошулуубу же кошулбоо керекпи?: Функцияны тандоодон мурун кошулуу жөнүндө эки жолу ойлонуп көрүңүз // Маалыматтарды башкаруу боюнча 2016-жылдагы Эл аралык конференциянын материалдары. – АКМ, 2016. – 19-34-б.
  6. Або Хамис М. жана башкалар. Сейрек тензорлор менен маалымат базасында окутуу // Маалыматтар базасы тутумдарынын принциптери боюнча 37th ACM SIGMOD-SIGACT-SIGAI симпозиумунун материалдары. – АКМ, 2018. – 325-340-б.
  7. Hellerstein J. M. et al. MADlib аналитикалык китепканасы: же MAD көндүмдөрү, SQL //VLDB фондусунун материалдары. – 2012. – Т. 5. – Жок. 12. – 1700-1711-беттер.
  8. Qin C., Rusu F. Terascale бөлүштүрүлгөн градиент ылдый оптималдаштыруу үчүн спекуляциялык болжолдоо // Булуттагы маалыматтар аналитикасы боюнча төртүнчү семинардын материалдары. – АКМ, 2015. – 1-б.
  9. Мэн X. жана башкалар. Mllib: Apache учкунунда машинаны үйрөнүү // The Journal of Machine Learning Research. – 2016. – Т. 17. – Жок. 1. – 1235-1241-бб.

Макаланын авторлору: Анастасия Бирильо, илимий кызматкер JetBrains изилдөө, CS борборунун студенти и Никита Бобров, илимий кызматкер JetBrains изилдөө

Source: www.habr.com

Комментарий кошуу