Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π’ этой ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΌΡ‹ ΠΏΠΎΠ³ΠΎΠ²ΠΎΡ€ΠΈΠΌ ΠΎ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… зависимостях Π² Π±Π°Π·Π°Ρ… Π΄Π°Π½Π½Ρ‹Ρ… β€” Ρ‡Ρ‚ΠΎ это Ρ‚Π°ΠΊΠΎΠ΅, Π³Π΄Π΅ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ ΠΈ ΠΊΠ°ΠΊΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ для ΠΈΡ… поиска.

Π Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ Π² контСкстС рСляционных Π±Π°Π· Π΄Π°Π½Π½Ρ‹Ρ…. Если Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ΡŒ совсСм Π³Ρ€ΡƒΠ±ΠΎ, Ρ‚ΠΎ Π² Ρ‚Π°ΠΊΠΈΡ… Π±Π°Π·Π°Ρ… Π΄Π°Π½Π½Ρ‹Ρ… информациях хранится Π² Π²ΠΈΠ΄Π΅ Ρ‚Π°Π±Π»ΠΈΡ†. Π”Π°Π»Π΅Π΅ ΠΌΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ΅Π½Π½Ρ‹Π΅ понятия, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π² строгой рСляционной Ρ‚Π΅ΠΎΡ€ΠΈΠΈ Π½Π΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ взаимозамСняСмыми: саму Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ Π±ΡƒΠ΄Π΅ΠΌ Π½Π°Π·Ρ‹Π²Π°Ρ‚ΡŒ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ΠΌ, столбцы β€” Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π°ΠΌΠΈ (ΠΈΡ… мноТСство β€” схСмой ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ), Π° Π½Π°Π±ΠΎΡ€ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ строки Π½Π° подмноТСствС Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ΠΎΠ² β€” ΠΊΠΎΡ€Ρ‚Π΅ΠΆΠ΅ΠΌ.

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

НапримСр, Π² Ρ‚Π°Π±Π»ΠΈΡ†Π΅ Π²Ρ‹ΡˆΠ΅, (Benson, M, M organ) являСтся ΠΊΠΎΡ€Ρ‚Π΅ΠΆΠ΅ΠΌ ΠΏΠΎ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π°ΠΌ (ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚, Пол, Π”ΠΎΠΊΡ‚ΠΎΡ€).
Π‘ΠΎΠ»Π΅Π΅ Ρ„ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎ это записываСтся Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ Π²ΠΈΠ΄Π΅: Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости[ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚, Пол, Π”ΠΎΠΊΡ‚ΠΎΡ€] = (Benson, M, M organ).
Π’Π΅ΠΏΠ΅Ρ€ΡŒ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ввСсти понятиС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠΉ зависимости (Π€Π—):

ΠžΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ 1. ΠžΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ R удовлСтворяСт Π€Π— X β†’ Y (Π³Π΄Π΅ X, Y βŠ† R) Ρ‚ΠΎΠ³Π΄Π° ΠΈ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‚ΠΎΠ³Π΄Π°, ΠΊΠΎΠ³Π΄Π° для Π»ΡŽΠ±Ρ‹Ρ… ΠΊΠΎΡ€Ρ‚Π΅ΠΆΠ΅ΠΉ Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости, Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости ∈ R выполняСтся: Ссли Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости[X] = Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости[X], Ρ‚ΠΎ Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости[Y ] = Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости[Y ]. Π’ Ρ‚Π°ΠΊΠΎΠΌ случаС говорят, Ρ‡Ρ‚ΠΎ X (Π΄Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Π½Ρ‚, ΠΈΠ»ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‰Π΅Π΅ мноТСство Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ΠΎΠ²) Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½ΠΎ опрСдСляСт Y (зависимоС мноТСство).

Π˜Π½Ρ‹ΠΌΠΈ словами, Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ Π€Π— X β†’ Y ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Ссли ΠΌΡ‹ ΠΈΠΌΠ΅Π΅ΠΌ Π΄Π²Π° ΠΊΠΎΡ€Ρ‚Π΅ΠΆΠ° Π² R ΠΈ ΠΎΠ½ΠΈ ΡΠΎΠ²ΠΏΠ°Π΄Π°ΡŽΡ‚ ΠΏΠΎ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π°ΠΌ X, Ρ‚ΠΎ ΠΎΠ½ΠΈ Π±ΡƒΠ΄ΡƒΡ‚ ΡΠΎΠ²ΠΏΠ°Π΄Π°Ρ‚ΡŒ ΠΈ ΠΏΠΎ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π°ΠΌ Y.
А Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ ΠΏΠΎ порядку. Рассмотрим Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Ρ‹ ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚ ΠΈ Пол для ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Ρ…ΠΎΡ‚ΠΈΠΌ ΡƒΠ·Π½Π°Ρ‚ΡŒ, Π΅ΡΡ‚ΡŒ Π»ΠΈ ΠΌΠ΅ΠΆΠ΄Ρƒ Π½ΠΈΠΌΠΈ зависимости ΠΈΠ»ΠΈ Π½Π΅Ρ‚. Для Ρ‚Π°ΠΊΠΎΠ³ΠΎ мноТСства Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ΠΎΠ² ΠΌΠΎΠ³ΡƒΡ‚ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ зависимости:

  1. ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚ β†’ Пол
  2. Пол β†’ ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚

Богласно ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΡŽ Π²Ρ‹ΡˆΠ΅, для Ρ‚ΠΎΠ³ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡƒΠ΄Π΅Ρ€ΠΆΠ°Π»Π°ΡΡŒ пСрвая Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ, ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠΌΡƒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ столбца ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚ Π΄ΠΎΠ»ΠΆΠ½ΠΎ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄Π½ΠΎ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ столбца Пол. И для Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹-ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° это Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Ρ‚Π°ΠΊ. Однако Π² ΠΎΠ±Ρ€Π°Ρ‚Π½ΡƒΡŽ сторону это Π½Π΅ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ вторая Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ Π½Π΅ выполняСтся, Π° Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ Пол Π½Π΅ являСтся Π΄Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Π½Ρ‚ΠΎΠΌ для ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚Π°. Аналогично, Ссли Π²Π·ΡΡ‚ΡŒ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ Π”ΠΎΠΊΡ‚ΠΎΡ€ β†’ ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚, ΠΌΠΎΠΆΠ½ΠΎ Π·Π°ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΎΠ½Π° Π½Π°Ρ€ΡƒΡˆΠ°Π΅Ρ‚ΡΡ, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Robin ΠΏΠΎ этому Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Ρƒ ΠΈΠΌΠ΅Π΅Ρ‚ нСсколько Ρ€Π°Π·Π½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ β€” Ellis ΠΈ Graham.

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΠ΅ΡΡ связи ΠΌΠ΅ΠΆΠ΄Ρƒ мноТСствами Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ΠΎΠ² Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹. ΠžΡ‚ΡΡŽΠ΄Π° ΠΈ Π²ΠΏΡ€Π΅Π΄ΡŒ ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ интСрСсныС связи, Π° Ρ‚ΠΎΡ‡Π½Π΅Π΅ Ρ‚Π°ΠΊΠΈΠ΅ X β†’ Y, Ρ‡Ρ‚ΠΎ ΠΎΠ½ΠΈ ΡΠ²Π»ΡΡŽΡ‚ΡΡ:

  • Π½Π΅Ρ‚Ρ€ΠΈΠ²ΠΈΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ правая Ρ‡Π°ΡΡ‚ΡŒ зависимости Π½Π΅ являСтся подмноТСством Π»Π΅Π²ΠΎΠΉ (Y ΜΈβŠ† X);
  • ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π½Π΅Ρ‚ Ρ‚Π°ΠΊΠΎΠΉ зависимости Z β†’ Y, Ρ‡Ρ‚ΠΎ Z βŠ‚ X.

РассматриваСмыС Π΄ΠΎ этого ΠΌΠΎΠΌΠ΅Π½Ρ‚Π° зависимости Π±Ρ‹Π»ΠΈ строгими, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π½Π΅ ΠΏΡ€Π΅Π΄ΡƒΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°ΡŽΡ‰ΠΈΠΌΠΈ Π½ΠΈΠΊΠ°ΠΊΠΈΡ… Π½Π°Ρ€ΡƒΡˆΠ΅Π½ΠΈΠΉ Π½Π° Ρ‚Π°Π±Π»ΠΈΡ†Π΅, Π½ΠΎ ΠΏΠΎΠΌΠΈΠΌΠΎ Π½ΠΈΡ… Π΅ΡΡ‚ΡŒ ΠΈ Ρ‚Π°ΠΊΠΈΠ΅, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄ΠΎΠΏΡƒΡΠΊΠ°ΡŽΡ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ Π½Π΅ΡΠΎΠ³Π»Π°ΡΠΎΠ²Π°Π½Π½ΠΎΡΡ‚ΡŒ ΠΌΠ΅ΠΆΠ΄Ρƒ значСниями ΠΊΠΎΡ€Ρ‚Π΅ΠΆΠ΅ΠΉ. Π’Π°ΠΊΠΈΠ΅ зависимости выносят Π² ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΉ класс, Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ΅Π½Π½Ρ‹ΠΌΠΈ ΠΈ Ρ€Π°Π·Ρ€Π΅ΡˆΠ°ΡŽΡ‚ ΠΈΠΌ Π½Π°Ρ€ΡƒΡˆΠ°Ρ‚ΡŒΡΡ Π½Π° ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΌ количСствС ΠΊΠΎΡ€Ρ‚Π΅ΠΆΠ΅ΠΉ. Π­Ρ‚ΠΎ количСство рСгулируСтся ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»Π΅ΠΌ максимальной ошибки emax. НапримСр, доля ошибки Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости = 0.01 ΠΌΠΎΠΆΠ΅Ρ‚ ΠΎΠ·Π½Π°Ρ‡Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ ΠΌΠΎΠΆΠ΅Ρ‚ Π½Π°Ρ€ΡƒΡˆΠ°Ρ‚ΡŒΡΡ Π½Π° 1% ΠΎΡ‚ ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ…ΡΡ ΠΊΠΎΡ€Ρ‚Π΅ΠΆΠ΅ΠΉ Π½Π° рассматриваСмом мноТСствС Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ΠΎΠ². Π’ΠΎ Π΅ΡΡ‚ΡŒ для 1000 записСй максимум 10 ΠΊΠΎΡ€Ρ‚Π΅ΠΆΠ΅ΠΉ ΠΌΠΎΠ³ΡƒΡ‚ Π½Π°Ρ€ΡƒΡˆΠ°Ρ‚ΡŒ Π€Π—. ΠœΡ‹ ΠΆΠ΅ Π±ΡƒΠ΄Π΅ΠΌ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ ΠΈΠ½ΡƒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ, ΠΎΡΠ½ΠΎΠ²Π°Π½Π½ΡƒΡŽ Π½Π° ΠΏΠΎΠΏΠ°Ρ€Π½ΠΎ-Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… значСниях сравниваСмых ΠΊΠΎΡ€Ρ‚Π΅ΠΆΠ΅ΠΉ. Для зависимости X β†’ Y Π½Π° ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΈ r ΠΎΠ½Π° считаСтся Ρ‚Π°ΠΊ:

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

ΠŸΠΎΡΡ‡ΠΈΡ‚Π°Π΅ΠΌ ΠΎΡˆΠΈΠ±ΠΊΡƒ для Π”ΠΎΠΊΡ‚ΠΎΡ€ β†’ ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚ ΠΈΠ· ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° Π²Ρ‹ΡˆΠ΅. ИмССм Π΄Π²Π° ΠΊΠΎΡ€Ρ‚Π΅ΠΆΠ°, значСния ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… разнятся Π½Π° Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π΅ ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚, Π½ΠΎ ΡΠΎΠ²ΠΏΠ°Π΄Π°ΡŽΡ‚ Π½Π° Π”ΠΎΠΊΡ‚ΠΎΡ€Π΅: Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости[Π”ΠΎΠΊΡ‚ΠΎΡ€, ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚] = (Robin, Ellis) ΠΈ Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости[Π”ΠΎΠΊΡ‚ΠΎΡ€, ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚] = (Robin, Graham). БлСдуя ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΡŽ ошибки, ΠΌΡ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ всС ΠΊΠΎΠ½Ρ„Π»ΠΈΠΊΡ‚ΡƒΡŽΡ‰ΠΈΠ΅ ΠΏΠ°Ρ€Ρ‹, Π° Π·Π½Π°Ρ‡ΠΈΡ‚ Ρ‚Π°ΠΊΠΎΠ²Ρ‹Ρ… Π±ΡƒΠ΄Π΅Ρ‚ Π΄Π²Π΅: (Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости, Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости) ΠΈ Π΅Π΅ инвСрсия (Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости, Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости). ΠŸΠΎΠ΄ΡΡ‚Π°Π²ΠΈΠΌ Π² Ρ„ΠΎΡ€ΠΌΡƒΠ»Ρƒ ΠΈ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ:

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

А Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ попытаСмся ΠΎΡ‚Π²Π΅Ρ‚ΠΈΡ‚ΡŒ Π½Π° вопрос: «А Π·Π°Ρ‡Π΅ΠΌ ΠΎΠ½ΠΎ всС?Β». На самом Π΄Π΅Π»Π΅, Π€Π— Π±Ρ‹Π²Π°ΡŽΡ‚ Ρ€Π°Π·Π½Ρ‹Π΅. ΠŸΠ΅Ρ€Π²Ρ‹ΠΉ Ρ‚ΠΈΠΏ β€” это Ρ‚Π°ΠΊΠΈΠ΅ зависимости, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‚ΡΡ администратором Π½Π° этапС проСктирования Π±Π°Π·Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ…. Π˜Ρ… ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ, ΠΎΠ½ΠΈ строгиС, Π° основноС ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ β€” нормализация Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Π΄ΠΈΠ·Π°ΠΉΠ½ схСмы ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ.

Π’Ρ‚ΠΎΡ€ΠΎΠΉ Ρ‚ΠΈΠΏ β€” зависимости, ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‰ΠΈΠ΅ «скрытыС» Π΄Π°Π½Π½Ρ‹Π΅ ΠΈ Ρ€Π°Π½Π΅Π΅ нСизвСстныС связи ΠΌΠ΅ΠΆΠ΄Ρƒ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π°ΠΌΠΈ. Π’ΠΎ Π΅ΡΡ‚ΡŒ ΠΎ Ρ‚Π°ΠΊΠΈΡ… зависимостях Π½Π΅ Π΄ΡƒΠΌΠ°Π»ΠΈ Π² ΠΌΠΎΠΌΠ΅Π½Ρ‚ проСктирования ΠΈ ΠΈΡ… находят ΡƒΠΆΠ΅ для ΠΈΠΌΠ΅ΡŽΡ‰Π΅Π³ΠΎΡΡ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΡ‚ΠΎΠΌ Π½Π° основС мноТСства выявлСнных Π€Π— ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΠΊΠ°ΠΊΠΈΠ΅-Π»ΠΈΠ±ΠΎ Π²Ρ‹Π²ΠΎΠ΄Ρ‹ ΠΎ Ρ…Ρ€Π°Π½ΠΈΠΌΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ. Как Ρ€Π°Π· с Ρ‚Π°ΠΊΠΈΠΌΠΈ зависимостями ΠΌΡ‹ ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°Π΅ΠΌ. Ими занимаСтся цСлая ΠΎΠ±Π»Π°ΡΡ‚ΡŒ Π΄Π°Ρ‚Π° ΠΌΠ°ΠΉΠ½ΠΈΠ½Π³Π° с Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ°ΠΌΠΈ поиска ΠΈ построСнными Π½Π° ΠΈΡ… основС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ. Π”Π°Π²Π°ΠΉΡ‚Π΅ Ρ€Π°Π·Π±ΠΈΡ€Π°Ρ‚ΡŒΡΡ, Ρ‡Π΅ΠΌ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ Π½Π°ΠΉΠ΄Π΅Π½Π½Ρ‹Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости (Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ ΠΈΠ»ΠΈ ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ΅Π½Π½Ρ‹Π΅) Π² ΠΊΠ°ΠΊΠΈΡ…-Π»ΠΈΠ±ΠΎ Π΄Π°Π½Π½Ρ‹Ρ….

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

БСгодня срСди основных областСй примСнСния зависимостСй Π²Ρ‹Π΄Π΅Π»ΡΡŽΡ‚ очистку Π΄Π°Π½Π½Ρ‹Ρ…. Она ΠΏΠΎΠ΄Ρ€Π°Π·ΡƒΠΌΠ΅Π²Π°Π΅Ρ‚ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΡƒ процСссов выявлСния «грязных Π΄Π°Π½Π½Ρ‹Ρ…Β» с ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΈΡ… исправлСниСм. Π―Ρ€ΠΊΠΈΠΌΠΈ прСдставитСлями «грязных Π΄Π°Π½Π½Ρ‹Ρ…Β» ΡΠ²Π»ΡΡŽΡ‚ΡΡ Π΄ΡƒΠ±Π»ΠΈΠΊΠ°Ρ‚Ρ‹, ошибки Π² Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ»ΠΈ ΠΎΠΏΠ΅Ρ‡Π°Ρ‚ΠΊΠΈ, ΠΏΡ€ΠΎΠΏΡƒΡ‰Π΅Π½Π½Ρ‹Π΅ значСния, ΡƒΡΡ‚Π°Ρ€Π΅Π²ΡˆΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Π΅, лишниС ΠΏΡ€ΠΎΠ±Π΅Π»Ρ‹ ΠΈ Ρ‚ΠΎΠΌΡƒ ΠΏΠΎΠ΄ΠΎΠ±Π½ΠΎΠ΅.

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ ошибки Π² Π΄Π°Π½Π½Ρ‹Ρ…:

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ Π΄ΡƒΠ±Π»ΠΈΠΊΠ°Ρ‚ΠΎΠ² Π² Π΄Π°Π½Π½Ρ‹Ρ…:

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

НапримСр, ΠΌΡ‹ ΠΈΠΌΠ΅Π΅ΠΌ Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ ΠΈ Π½Π°Π±ΠΎΡ€ Π€Π—, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒΡΡ. ΠžΡ‡ΠΈΡΡ‚ΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ… Π² Π΄Π°Π½Π½ΠΎΠΌ случаС ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅Ρ‚ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Π΅ Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π€Π— стали Π²Π΅Ρ€Π½Ρ‹. ΠŸΡ€ΠΈ этом число ΠΌΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΉ Π΄ΠΎΠ»ΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ минимально (для Π΄Π°Π½Π½ΠΎΠΉ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ свои Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΌΡ‹ Π½Π΅ Π±ΡƒΠ΄Π΅ΠΌ ΡΠΎΡΡ€Π΅Π΄ΠΎΡ‚Π°Ρ‡ΠΈΠ²Π°Ρ‚ΡŒ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π² Π΄Π°Π½Π½ΠΎΠΉ ΡΡ‚Π°Ρ‚ΡŒΠ΅). НиТС ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Ρ‚Π°ΠΊΠΎΠ³ΠΎ прСобразования Π΄Π°Π½Π½Ρ‹Ρ…. Π‘Π»Π΅Π²Π° исходноС ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ, ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎ, Π½Π΅ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡŽΡ‚ΡΡ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹Π΅ Π€Π— (красным Ρ†Π²Π΅Ρ‚ΠΎΠΌ Π²Ρ‹Π΄Π΅Π»Π΅Π½ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Π½Π°Ρ€ΡƒΡˆΠ΅Π½ΠΈΡ ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· Π€Π—). Π‘ΠΏΡ€Π°Π²Π° прСдставлСно ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½Π½ΠΎΠ΅ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ Π·Π΅Π»Π΅Π½Ρ‹Π΅ ячСйки ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½Π½Ρ‹Π΅ значСния. ПослС провСдСния Ρ‚Π°ΠΊΠΎΠΉ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹Π΅ зависимости стали ΡƒΠ΄Π΅Ρ€ΠΆΠΈΠ²Π°Ρ‚ΡŒΡΡ.

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π”Ρ€ΡƒΠ³ΠΎΠΉ популярной ΠΎΠ±Π»Π°ΡΡ‚ΡŒΡŽ примСнСния являСтся Π΄ΠΈΠ·Π°ΠΉΠ½ Π±Π°Π·Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ…. Π—Π΄Π΅ΡΡŒ стоит Π½Π°ΠΏΠΎΠΌΠ½ΠΈΡ‚ΡŒ ΠΏΡ€ΠΎ Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½Ρ‹Π΅ Ρ„ΠΎΡ€ΠΌΡ‹ ΠΈ Π½ΠΎΡ€ΠΌΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ. Нормализация β€” это процСсс привСдСния ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ Π² соотвСтствиС Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌΡƒ Π½Π°Π±ΠΎΡ€Ρƒ Ρ‚Ρ€Π΅Π±ΠΎΠ²Π°Π½ΠΈΠΉ, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… опрСдСляСтся Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎΠΉ Ρ„ΠΎΡ€ΠΌΠΎΠΉ ΠΏΠΎ-своСму. Π Π°ΡΠΏΠΈΡΡ‹Π²Π°Ρ‚ΡŒ трСбования Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ ΠΌΡ‹ Π½Π΅ станСм (это дСлаСтся Π² любой ΠΊΠ½ΠΈΠ³Π΅ ΠΏΠΎ курсу Π‘Π” для Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‰ΠΈΡ…), Π° лишь Π·Π°ΠΌΠ΅Ρ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎ каТдая ΠΈΠ· Π½ΠΈΡ… ΠΏΠΎ-своСму ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… зависимостСй. Π’Π΅Π΄ΡŒ Π€Π— ΠΏΠΎ своСй сути ΡΠ²Π»ΡΡŽΡ‚ΡΡ ограничСниями цСлостности, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°ΡŽΡ‚ΡΡ ΠΏΡ€ΠΈ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ Π±Π°Π·Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… (Π² контСкстС этой Π·Π°Π΄Π°Ρ‡ΠΈ Π€Π— ΠΈΠ½ΠΎΠ³Π΄Π° Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ ΡΡƒΠΏΠ΅Ρ€ΠΊΠ»ΡŽΡ‡Π°ΠΌΠΈ).

Рассмотрим ΠΈΡ… ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ для Ρ‡Π΅Ρ‚Ρ‹Ρ€Π΅Ρ… Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ Π½Π° ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ΅ Π½ΠΈΠΆΠ΅. Напомним, Ρ‡Ρ‚ΠΎ Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½Π°Ρ Ρ„ΠΎΡ€ΠΌΠ° Бойса-Кодда являСтся Π±ΠΎΠ»Π΅Π΅ строгой, Ρ‡Π΅ΠΌ Ρ‚Ρ€Π΅Ρ‚ΡŒΡ Ρ„ΠΎΡ€ΠΌΠ°, Π½ΠΎ ΠΏΡ€ΠΈ этом ΠΌΠ΅Π½Π΅Π΅ строгой, Ρ‡Π΅ΠΌ чСтвСртая. ПослСднюю ΠΏΠΎΠΊΠ° Π½Π΅ рассматриваСм, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ для Π΅Π΅ постановки Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ ΠΌΠ½ΠΎΠ³ΠΎΠ·Π½Π°Ρ‡Π½Ρ‹Ρ… зависимостСй, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π² Π΄Π°Π½Π½ΠΎΠΉ ΡΡ‚Π°Ρ‚ΡŒΠ΅ Π½Π°ΠΌ Π½Π΅ интСрСсны.

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости
Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости
Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости
Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π•Ρ‰Π΅ ΠΎΠ΄Π½ΠΎΠΈΜ† ΠΎΠ±Π»Π°ΡΡ‚ΡŒΡŽ, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΈΜ† зависимости нашли своС ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅, являСтся ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности пространства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π² Ρ‚Π°ΠΊΠΈΡ… Π·Π°Π΄Π°Ρ‡Π°Ρ… ΠΊΠ°ΠΊ построСниС Π½Π°ΠΈΠ²Π½ΠΎΠ³ΠΎ байСсовского классификатора, Π²Ρ‹Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π·Π½Π°Ρ‡ΠΈΠΌΡ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΈ рСпарамСтризация рСгрСссионной ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π’ ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… ΡΡ‚Π°Ρ‚ΡŒΡΡ… эта Π·Π°Π΄Π°Ρ‡Π° называСтся ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ΠΌ ΠΈΠ·Π±Ρ‹Ρ‚ΠΎΡ‡Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² (feature redundancy) ΠΈ Ρ€Π΅Π»Π΅Π²Π°Π½Ρ‚Π½Ρ‹Ρ… (feature relevancy) [5, 6], ΠΈ Ρ€Π΅ΡˆΠ°Π΅Ρ‚ΡΡ ΠΎΠ½Π° с Π°ΠΊΡ‚ΠΈΠ²Π½Ρ‹ΠΌ использованиСм ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΠΈΜ† Π±Π°Π· Π΄Π°Π½Π½Ρ‹Ρ…. Π‘ появлСниСм Ρ‚Π°ΠΊΠΈΡ… Ρ€Π°Π±ΠΎΡ‚ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ сСгодня Π½Π°Π±Π»ΡŽΠ΄Π°Π΅Ρ‚ΡΡ запрос Π½Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰ΠΈΠ΅ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ Π±Π°Π·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…, Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΡƒ ΠΈ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ Π²Ρ‹ΡˆΠ΅ΠΏΠ΅Ρ€Π΅Ρ‡ΠΈΡΠ»Π΅Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ Π² ΠΎΠ΄ΠΈΠ½ инструмСнт [7, 8, 9].

Для поиска Π€Π— Π² Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… сущСствуСт мноТСство Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² (ΠΊΠ°ΠΊ соврСмСнных, Ρ‚Π°ΠΊ ΠΈ Π½Π΅ ΠΎΡ‡Π΅Π½ΡŒ).Π’Π°ΠΊΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½Π° Ρ‚Ρ€ΠΈ Π³Ρ€ΡƒΠΏΠΏΡ‹:

  • Алгоритмы, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠ΅ ΠΎΠ±Ρ…ΠΎΠ΄ алгСбраичСских Ρ€Π΅ΡˆΠ΅Ρ‚ΠΎΠΊ (Lattice traversal algorithms)
  • Алгоритмы, основанныС Π½Π° поискС согласованных Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ (Difference- and agree-set algorithms)
  • Алгоритмы, основанныС Π½Π° ΠΏΠΎΠΏΠ°Ρ€Π½Ρ‹Ρ… сравнСниях (Dependency induction algorithms)

ΠšΡ€Π°Ρ‚ΠΊΠΎΠ΅ описаниС ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Ρ‚ΠΈΠΏΠ° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² прСдставлСно Π² Ρ‚Π°Π±Π»ΠΈΡ†Π΅ Π½ΠΈΠΆΠ΅:
Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

ΠŸΠΎΠ΄Ρ€ΠΎΠ±Π½Π΅Π΅ ΠΎ Π΄Π°Π½Π½ΠΎΠΉ классификации ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ [4]. НиТС прСдставлСны ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² Π½Π° ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ· Ρ‚ΠΈΠΏΠΎΠ²:

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π’ настоящСС врСмя ΠΏΠΎΡΠ²Π»ΡΡŽΡ‚ΡΡ Π½ΠΎΠ²Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡΠΎΡ‡Π΅Ρ‚Π°ΡŽΡ‚ Π² сСбС сразу нСсколько ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΎΠ² ΠΊ поиску Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… зависимостСй. ΠŸΡ€ΠΈΠΌΠ΅Ρ€Π°ΠΌΠΈ Ρ‚Π°ΠΊΠΈΡ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² ΡΠ²Π»ΡΡŽΡ‚ΡΡ Pyro [2] ΠΈ HyFD [3]. Π Π°Π·Π±ΠΎΡ€ ΠΈΡ… Ρ€Π°Π±ΠΎΡ‚Ρ‹ прСдполагаСтся Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… ΡΡ‚Π°Ρ‚ΡŒΡΡ… Π΄Π°Π½Π½ΠΎΠ³ΠΎ Ρ†ΠΈΠΊΠ»Π°. Π’ этой ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΌΡ‹ лишь Ρ€Π°Π·Π±Π΅Ρ€Π΅ΠΌ основныС понятия ΠΈ Π»Π΅ΠΌΠΌΡƒ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹ для понимания Ρ‚Π΅Ρ…Π½ΠΈΠΊ выявлСния зависимостСй.

НачнСм с простого β€” difference- ΠΈ agree-set, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Π΅ Π²ΠΎ Π²Ρ‚ΠΎΡ€ΠΎΠΌ Ρ‚ΠΈΠΏΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ². Difference-set прСдставляСт собой мноТСство ΠΊΠΎΡ€Ρ‚Π΅ΠΆΠ΅ΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ ΡΠΎΠ²ΠΏΠ°Π΄Π°ΡŽΡ‚ ΠΏΠΎ значСниям, Π° agree-set Π½Π°ΠΎΠ±ΠΎΡ€ΠΎΡ‚ β€” ΠΊΠΎΡ€Ρ‚Π΅ΠΆΠΈ, ΡΠΎΠ²ΠΏΠ°Π΄Π°ΡŽΡ‰ΠΈΠ΅ ΠΏΠΎ значСниям. Π‘Ρ‚ΠΎΠΈΡ‚ΡŒ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π² Π΄Π°Π½Π½ΠΎΠΌ случаС ΠΌΡ‹ рассматриваСм Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π»Π΅Π²ΡƒΡŽ Ρ‡Π°ΡΡ‚ΡŒ зависимости.

Π’Π°ΠΊΠΆΠ΅ Π²Π°ΠΆΠ½Ρ‹ΠΌ понятиСм, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Π²ΡΡ‚Ρ€Π΅Ρ‡Π°Π»ΠΎΡΡŒ Π²Ρ‹ΡˆΠ΅, являСтся алгСбраичСская Ρ€Π΅ΡˆΠ΅Ρ‚ΠΊΠ°. Π’Π°ΠΊ ΠΊΠ°ΠΊ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ соврСмСнныС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΎΠΏΠ΅Ρ€ΠΈΡ€ΡƒΡŽΡ‚ Π΄Π°Π½Π½Ρ‹ΠΌ понятиСм, Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ ΠΈΠΌΠ΅Ρ‚ΡŒ прСдставлСниС ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ это Ρ‚Π°ΠΊΠΎΠ΅.

Для Ρ‚ΠΎΠ³ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ ввСсти понятиС Ρ€Π΅ΡˆΠ΅Ρ‚ΠΊΠΈ, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ частично упорядочСнного мноТСства (ΠΈΠ»ΠΈ partially ordered set, сокращСнно β€” poset).

ΠžΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ 2. Говорят, Ρ‡Ρ‚ΠΎ мноТСство S частично упорядочСно Π±ΠΈΠ½Π°Ρ€Π½Ρ‹ΠΌ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ΠΌ β©½, Ссли для всяких a, b, c ∈ S Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½Ρ‹ свойства:

  1. Π Π΅Ρ„Π»Π΅ΠΊΡΠΈΠ²Π½ΠΎΡΡ‚ΡŒ, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ a β©½ a
  2. ΠΠ½Ρ‚ΠΈΡΠΈΠΌΠΌΠ΅Ρ‚Ρ€ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ, Ссли a β©½ b ΠΈ b β©½ a, Ρ‚ΠΎ a = b
  3. Π’Ρ€Π°Π½Π·ΠΈΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ для a β©½ b ΠΈ b β©½ c слСдуСт, Ρ‡Ρ‚ΠΎ a β©½ c


Π’Π°ΠΊΠΎΠ΅ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ называСтся ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ΠΌ (нСстрогого) частичного порядка, Π° само мноТСство β€” частично упорядочСнным мноТСством. Π€ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎΠ΅ ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅: ⟨S, ⩽⟩.

Π’ качСствС ΠΏΡ€ΠΎΡΡ‚Π΅ΠΉΡˆΠ΅Π³ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° частично упорядочСнного мноТСства ΠΌΠΎΠΆΠ½ΠΎ Π²Π·ΡΡ‚ΡŒ мноТСство всСх Π½Π°Ρ‚ΡƒΡ€Π°Π»ΡŒΠ½Ρ‹Ρ… чисСл N с ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹ΠΌ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ΠΌ порядка β©½. НСтрудно ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ всС Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹Π΅ аксиомы Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡŽΡ‚ΡΡ.

Π‘ΠΎΠ»Π΅Π΅ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ ΠΏΡ€ΠΈΠΌΠ΅Ρ€. Рассмотрим мноТСство всСх подмноТСств {1, 2, 3}, упорядочСнноС ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ΠΌ Π²ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡ βŠ†. Π”Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ, это ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ удовлСтворяСт всСм условиям частичного порядка, поэтому ⟨P ({1, 2, 3}), βŠ†βŸ© β€” частично упорядочСнноС мноТСство. На рисункС Π½ΠΈΠΆΠ΅ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½Π° структура этого мноТСства: Ссли ΠΈΠ· ΠΎΠ΄Π½ΠΎΠ³ΠΎ элСмСнта ΠΌΠΎΠΆΠ½ΠΎ Π΄ΠΎΠΉΡ‚ΠΈ ΠΏΠΎ стрСлочкам Π΄ΠΎ Π΄Ρ€ΡƒΠ³ΠΎΠ³ΠΎ элСмСнта, Ρ‚ΠΎ ΠΎΠ½ΠΈ находятся Π² ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΈ порядка.

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Нам ΠΏΠΎΡ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ΡΡ Π΅Ρ‰Π΅ Π΄Π²Π° простых опрСдСлСния ΠΈΠ· области ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠΈ β€” супрСмум (supremum) ΠΈ ΠΈΠ½Ρ„ΠΈΠΌΡƒΠΌ (infimum).

ΠžΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ 3. ΠŸΡƒΡΡ‚ΡŒ ⟨S, ⩽⟩ β€” частично упорядочСнноС мноТСство, A βŠ† S. ВСрхняя Π³Ρ€Π°Π½ΠΈΡ†Π° A β€” это Ρ‚Π°ΠΊΠΎΠΉ элСмСнт u ∈ S, Ρ‡Ρ‚ΠΎ βˆ€x ∈ S: x β©½ u. ΠŸΡƒΡΡ‚ΡŒ U β€” мноТСство всСх Π²Π΅Ρ€Ρ…Π½ΠΈΡ… Π³Ρ€Π°Π½ΠΈΡ† S. Если Π² U сущСствуСт наимСньший элСмСнт, Ρ‚ΠΎΠ³Π΄Π° ΠΎΠ½ называСтся супрСмумом ΠΈ обозначаСтся ΠΊΠ°ΠΊ sup A.

Аналогично вводится понятиС Ρ‚ΠΎΡ‡Π½ΠΎΠΉ Π½ΠΈΠΆΠ½Π΅ΠΉ Π³Ρ€Π°Π½ΠΈΡ†Ρ‹.

ΠžΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ 4. ΠŸΡƒΡΡ‚ΡŒ ⟨S, ⩽⟩ β€” частично упорядочСнноС мноТСство, A βŠ† S. НиТняя Π³Ρ€Π°Π½ΠΈΡ†Π° A β€” это Ρ‚Π°ΠΊΠΎΠΉ элСмСнт l ∈ S, Ρ‡Ρ‚ΠΎ βˆ€x ∈ S: l β©½ x. ΠŸΡƒΡΡ‚ΡŒ L β€” мноТСство всСх Π½ΠΈΠΆΠ½ΠΈΡ… Π³Ρ€Π°Π½ΠΈΡ† S. Если Π² L сущСствуСт наибольший элСмСнт, Ρ‚ΠΎΠ³Π΄Π° ΠΎΠ½ называСтся ΠΈΠ½Ρ„ΠΈΠΌΡƒΠΌΠΎΠΌ ΠΈ обозначаСтся ΠΊΠ°ΠΊ inf A.

Рассмотрим Π² качСствС ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠ΅ Π²Ρ‹ΡˆΠ΅ частично упорядочСнноС мноТСство ⟨P ({1, 2, 3}), βŠ†βŸ© ΠΈ Π½Π°ΠΉΠ΄Π΅ΠΌ Π² Π½Π΅ΠΌ супрСмум ΠΈ ΠΈΠ½Ρ„ΠΈΠΌΡƒΠΌ:

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π’Π΅ΠΏΠ΅Ρ€ΡŒ ΠΌΠΎΠΆΠ½ΠΎ ΡΡ„ΠΎΡ€ΠΌΡƒΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ алгСбраичСской Ρ€Π΅ΡˆΠ΅Ρ‚ΠΊΠΈ.

ΠžΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ 5. ΠŸΡƒΡΡ‚ΡŒ ⟨P, ⩽⟩ β€” частично упорядочСнноС мноТСство, Ρ‚Π°ΠΊΠΎΠ΅ Ρ‡Ρ‚ΠΎ всякоС двухэлСмСнтноС подмноТСство ΠΈΠΌΠ΅Π΅Ρ‚ Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ Π²Π΅Ρ€Ρ…Π½ΡŽΡŽ ΠΈ ниТнюю Π³Ρ€Π°Π½ΠΈΡ†Ρ‹. Π’ΠΎΠ³Π΄Π° P называСтся алгСбраичСской Ρ€Π΅ΡˆΠ΅Ρ‚ΠΊΠΎΠΉ. ΠŸΡ€ΠΈ этом sup{x, y} Π·Π°ΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‚ ΠΊΠ°ΠΊ x ∨ y, Π° inf {x, y} β€” ΠΊΠ°ΠΊ x ∧ y.

ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΈΠΌ, Ρ‡Ρ‚ΠΎ наш Ρ€Π°Π±ΠΎΡ‡ΠΈΠΉ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ⟨P ({1, 2, 3}), βŠ†βŸ© являСтся Ρ€Π΅ΡˆΠ΅Ρ‚ΠΊΠΎΠΉ. Π”Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ, для всяких a, b ∈ P ({1, 2, 3}), a∨b = aβˆͺb, Π° a∧b = a∩b. НапримСр, рассмотрим мноТСства {1, 2} ΠΈ {1, 3} ΠΈ Π½Π°ΠΉΠ΄Π΅ΠΌ ΠΈΡ… ΠΈΠ½Ρ„ΠΈΠΌΡƒΠΌ ΠΈ супрСмум. Если ΠΌΡ‹ ΠΈΡ… пСрСсСчСм, Ρ‚ΠΎ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ мноТСство {1}, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ ΠΈ Π±ΡƒΠ΄Π΅Ρ‚ ΡΠ²Π»ΡΡ‚ΡŒΡΡ ΠΈΠ½Ρ„ΠΈΠΌΡƒΠΌΠΎΠΌ. Π‘ΡƒΠΏΡ€Π΅ΠΌΡƒΠΌ ΠΆΠ΅ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ ΠΈΡ… объСдинСниСм β€” {1, 2, 3}.

Π’ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°Ρ… выявлСния Π€Π— пространство поиска Π·Π°Ρ‡Π°ΡΡ‚ΡƒΡŽ прСдставляСтся Π² Ρ„ΠΎΡ€ΠΌΠ΅ Ρ€Π΅ΡˆΠ΅Ρ‚ΠΊΠΈ, Π³Π΄Π΅ мноТСства ΠΈΠ· ΠΎΠ΄Π½ΠΎΠ³ΠΎ элСмСнта (Ρ‡ΠΈΡ‚Π°ΠΉ ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ Ρ€Π΅ΡˆΠ΅Ρ‚ΠΊΠΈ поиска, Π³Π΄Π΅ лСвая Ρ‡Π°ΡΡ‚ΡŒ зависимостСй состоит ΠΈΠ· ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π°) ΡΠ²Π»ΡΡŽΡ‚ собой ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ исходного ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ.
Π’ Π½Π°Ρ‡Π°Π»Π΅ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°ΡŽΡ‚ΡΡ зависимости Π²ΠΈΠ΄Π° βˆ… β†’ ΠžΠ΄ΠΈΠ½ΠΎΡ‡Π½Ρ‹ΠΉ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚. Π”Π°Π½Π½Ρ‹ΠΉ шаг позволяСт ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ, ΠΊΠ°ΠΊΠΈΠ΅ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Ρ‹ ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΏΠ΅Ρ€Π²ΠΈΡ‡Π½Ρ‹ΠΌΠΈ ΠΊΠ»ΡŽΡ‡Π°ΠΌΠΈ (для Ρ‚Π°ΠΊΠΈΡ… Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ΠΎΠ² Π½Π΅ Π±Ρ‹Π²Π°Π΅Ρ‚ Π΄Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Π½Ρ‚ΠΎΠ², Π° ΠΏΠΎΡ‚ΠΎΠΌΡƒ лСвая Ρ‡Π°ΡΡ‚ΡŒ пуста). Π”Π°Π»Π΅Π΅ Ρ‚Π°ΠΊΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ Π΄Π²ΠΈΠ³Π°ΡŽΡ‚ΡΡ ΠΏΠΎ Ρ€Π΅ΡˆΠ΅Ρ‚ΠΊΠ΅ Π²Π²Π΅Ρ€Ρ…. ΠŸΡ€ΠΈ этом стоит ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Ρ€Π΅ΡˆΠ΅Ρ‚ΠΊΡƒ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ Π½Π΅ всю, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Ссли Π½Π° Π²Ρ…ΠΎΠ΄ ΠΏΠ΅Ρ€Π΅Π΄Π°Ρ‚ΡŒ ΠΆΠ΅Π»Π°Π΅ΠΌΡ‹ΠΉ ΠΌΠ°ΠΊΡΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ Ρ€Π°Π·ΠΌΠ΅Ρ€ Π»Π΅Π²ΠΎΠΉ части, Ρ‚ΠΎ дальшС уровня с Ρ‚Π°ΠΊΠΈΠΌ Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΎΠΌ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΈΠ΄Ρ‚ΠΈ Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚.

На рисункС Π½ΠΈΠΆΠ΅ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ, ΠΊΠ°ΠΊ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π°Π»Π³Π΅Π±Ρ€Π°ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ Ρ€Π΅ΡˆΠ΅Ρ‚ΠΊΡƒ Π² Π·Π°Π΄Π°Ρ‡Π΅ поиска Π€Π—. Π—Π΄Π΅ΡΡŒ ΠΊΠ°ΠΆΠ΄ΠΎΠ΅ Ρ€Π΅Π±Ρ€ΠΎ (X, XY) прСдставляСт собой Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ X β†’ Y. НапримСр, ΠΌΡ‹ ΠΏΡ€ΠΎΡˆΠ»ΠΈ ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ ΠΈ Π·Π½Π°Π΅ΠΌ, Ρ‡Ρ‚ΠΎ удСрТиваСтся Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ A β†’ B (ΠΎΡ‚ΠΎΠ±Ρ€Π°Π·ΠΈΠΌ это Π·Π΅Π»Π΅Π½ΠΎΠΉ связью ΠΌΠ΅ΠΆΠ΄Ρƒ Π²Π΅Ρ€ΡˆΠΈΠ½Π°ΠΌΠΈ A ΠΈ B). Π—Π½Π°Ρ‡ΠΈΡ‚ Π΄Π°Π»Π΅Π΅, ΠΊΠΎΠ³Π΄Π° Π±ΡƒΠ΄Π΅ΠΌ ΠΏΡ€ΠΎΠ΄Π²ΠΈΠ³Π°Ρ‚ΡŒΡΡ ΠΏΠΎ Ρ€Π΅ΡˆΠ΅Ρ‚ΠΊΠ΅ Π²Π²Π΅Ρ€Ρ…, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Π½Π΅ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡΡ‚ΡŒ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ A, C β†’ B, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ ΠΎΠ½Π° Π±ΡƒΠ΄Π΅Ρ‚ ΡƒΠΆΠ΅ Π½Π΅ минимальной. Аналогично ΠΌΡ‹ Π±Ρ‹ Π½Π΅ стали Π΅Π΅ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡΡ‚ΡŒ, Ссли Π±Ρ‹ ΡƒΠ΄Π΅Ρ€ΠΆΠΈΠ²Π°Π»Π°ΡΡŒ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ C β†’ B.

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости
Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, всС соврСмСнныС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΏΠΎ поиску Π€Π— ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Ρ‚Π°ΠΊΡƒΡŽ структуру Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠ°ΠΊ партиция (Π² пСрвоисточникС β€” stripped partition [1]). Π€ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎΠ΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΈ выглядит ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

ΠžΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ 6. ΠŸΡƒΡΡ‚ΡŒ X βŠ† R β€” Π½Π°Π±ΠΎΡ€ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ΠΎΠ² для ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ r. ΠšΠ»Π°ΡΡ‚Π΅Ρ€ прСдставляСт собой Π½Π°Π±ΠΎΡ€ индСксов ΠΊΠΎΡ€Ρ‚Π΅ΠΆΠ΅ΠΉ ΠΈΠ· r, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΠΌΠ΅ΡŽΡ‚ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ для X, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ c(t) = {i|ti[X] = t[X]}. ΠŸΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΡ прСдставляСт собой мноТСство кластСров, ΠΈΡΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‰Π΅Π΅ кластСры Π΅Π΄ΠΈΠ½ΠΈΡ‡Π½ΠΎΠΉ Π΄Π»ΠΈΠ½Ρ‹:

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

ΠŸΡ€ΠΎΡΡ‚Ρ‹ΠΌΠΈ словами, партиция для Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π° X прСдставляСт собой Π½Π°Π±ΠΎΡ€ списков, Π³Π΄Π΅ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ список содСрТит Π½ΠΎΠΌΠ΅Ρ€Π° строк с ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹ΠΌΠΈ значСниями для X. Π’ соврСмСнной Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Π΅ структура, ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‰Π°Ρ ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΈ, называСтся position list index (PLI). ΠšΠ»Π°ΡΡ‚Π΅Ρ€Ρ‹ Π΅Π΄ΠΈΠ½ΠΈΡ‡Π½ΠΎΠΉ Π΄Π»ΠΈΠ½Ρ‹ ΠΈΡΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‚ΡΡ Π² цСлях сТатия PLI, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ это кластСры, содСрТащиС лишь Π½ΠΎΠΌΠ΅Ρ€ записи с ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ всСгда Π±ΡƒΠ΄Π΅Ρ‚ Π»Π΅Π³ΠΊΠΎ ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ.

Рассмотрим ΠΏΡ€ΠΈΠΌΠ΅Ρ€. ВСрнСмся всС ΠΊ Ρ‚ΠΎΠΉ ΠΆΠ΅ Ρ‚Π°Π±Π»ΠΈΡ†Π΅ с ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚Π°ΠΌΠΈ ΠΈ построим ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΈ для столбцов ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚ ΠΈ Пол (слСва появился Π½ΠΎΠ²Ρ‹ΠΉ столбСц, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ ΠΎΡ‚ΠΌΠ΅Ρ‡Π΅Π½Ρ‹ Π½ΠΎΠΌΠ΅Ρ€Π° строк Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹):

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

ΠŸΡ€ΠΈ этом, согласно ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΡŽ, партиция для столбца ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚ Π½Π° самом Π΄Π΅Π»Π΅ Π±ΡƒΠ΄Π΅Ρ‚ пустая, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΎΠ΄ΠΈΠ½ΠΎΡ‡Π½Ρ‹Π΅ кластСры ΠΈΡΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‚ΡΡ ΠΈΠ· ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΈ.

ΠŸΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΈ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΡƒΡ‡Π°Ρ‚ΡŒ ΠΏΠΎ нСскольким Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π°ΠΌ. И для этого сущСствуСт Π΄Π²Π° ΠΏΡƒΡ‚ΠΈ: ΠΏΡ€ΠΎΠΉΠ΄ΡΡΡŒ ΠΏΠΎ Ρ‚Π°Π±Π»ΠΈΡ†Π΅, ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΡŽ сразу ΠΏΠΎ всСм Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹ΠΌ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π°ΠΌ, ΠΈΠ»ΠΈ ΠΆΠ΅ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ Π΅Π΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΈ пСрСсСчСния ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΉ ΠΏΠΎ подмноТСству Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ΠΎΠ². Алгоритмы поиска Π€Π— ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Π²Ρ‚ΠΎΡ€ΠΎΠΉ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚.

ΠŸΡ€ΠΎΡΡ‚Ρ‹ΠΌΠΈ словами, Ρ‡Ρ‚ΠΎΠ±Ρ‹, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΡŽ ΠΏΠΎ столбцам ABC, ΠΌΠΎΠΆΠ½ΠΎ Π²Π·ΡΡ‚ΡŒ ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΈ для AC ΠΈ B (ΠΈΠ»ΠΈ любой Π΄Ρ€ΡƒΠ³ΠΎΠΉ Π½Π°Π±ΠΎΡ€ Π½Π΅ΠΏΠ΅Ρ€Π΅ΡΠ΅ΠΊΠ°ΡŽΡ‰ΠΈΡ…ΡΡ подмноТСств) ΠΈ ΠΏΠ΅Ρ€Π΅ΡΠ΅Ρ‡ΡŒ ΠΈΡ… ΠΌΠ΅ΠΆΠ΄Ρƒ собой. ΠžΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ пСрСсСчСния Π΄Π²ΡƒΡ… ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΉ выдСляСт кластСры наибольшСй Π΄Π»ΠΈΠ½Ρ‹, ΠΎΠ±Ρ‰ΠΈΠ΅ для ΠΎΠ±Π΅ΠΈΡ… ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΉ.

Π”Π°Π²Π°ΠΉΡ‚Π΅ рассмотрим ΠΏΡ€ΠΈΠΌΠ΅Ρ€:

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π’ ΠΏΠ΅Ρ€Π²ΠΎΠΌ случаС ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΈ ΠΏΡƒΡΡ‚ΡƒΡŽ ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΡŽ. Если ΠΏΡ€ΠΈΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒΡΡ ΠΊ Ρ‚Π°Π±Π»ΠΈΡ†Π΅, Ρ‚ΠΎ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ, ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΏΠΎ Π΄Π²ΡƒΠΌ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π°ΠΌ Ρ‚Π°ΠΌ Π½Π΅Ρ‚. Если ΠΆΠ΅ ΠΌΡ‹ Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ ΠΌΠΎΠ΄ΠΈΡ„ΠΈΡ†ΠΈΡ€ΡƒΠ΅ΠΌ Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ (случай справа), Ρ‚ΠΎ ΡƒΠΆΠ΅ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ нСпустоС пСрСсСчСниС. ΠŸΡ€ΠΈ этом строки 1 ΠΈ 2 ΠΈ ΠΏΡ€Π°Π²Π΄Π° содСрТат ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹Π΅ значСния ΠΏΠΎ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π°ΠΌ Пол ΠΈ Π”ΠΎΠΊΡ‚ΠΎΡ€.

Π”Π°Π»Π΅Π΅ Π½Π°ΠΌ понадобится Ρ‚Π°ΠΊΠΎΠ΅ понятиС, ΠΊΠ°ΠΊ Ρ€Π°Π·ΠΌΠ΅Ρ€ ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΈ. Π€ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎ:

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

ΠŸΡ€ΠΎΡ‰Π΅ говоря, Ρ€Π°Π·ΠΌΠ΅Ρ€ ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΈ прСдставляСт собой количСство кластСров, входящих Π² ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΡŽ (ΠΏΠΎΠΌΠ½ΠΈΠΌ, Ρ‡Ρ‚ΠΎ Π΅Π΄ΠΈΠ½ΠΈΡ‡Π½Ρ‹Π΅ кластСры Π² ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΡŽ Π½Π΅ входят!):

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π’Π΅ΠΏΠ΅Ρ€ΡŒ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΎΠ΄Π½Ρƒ ΠΈΠ· ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… Π»Π΅ΠΌΠΌ, которая для Π·Π°Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΉ позволяСт ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ, удСрТиваСтся Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ ΠΈΠ»ΠΈ Π½Π΅Ρ‚:

Π›Π΅ΠΌΠΌΠ° 1. Π—Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ A, B β†’ C удСрТиваСтся, Ссли ΠΈ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ссли

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Богласно Π»Π΅ΠΌΠΌΠ΅, для опрСдСлСния, удСрТиваСтся Π»ΠΈ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ Ρ‡Π΅Ρ‚Ρ‹Ρ€Π΅ шага:

  1. Π’Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΡŽ для Π»Π΅Π²ΠΎΠΉ части зависимости
  2. Π’Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΡŽ для ΠΏΡ€Π°Π²ΠΎΠΉ части зависимости
  3. Π’Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΠ΅ ΠΏΠ΅Ρ€Π²ΠΎΠ³ΠΎ ΠΈ Π²Ρ‚ΠΎΡ€ΠΎΠ³ΠΎ шага
  4. Π‘Ρ€Π°Π²Π½ΠΈΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€Ρ‹ ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΉ, ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… Π½Π° ΠΏΠ΅Ρ€Π²ΠΎΠΌ ΠΈ Ρ‚Ρ€Π΅Ρ‚ΡŒΠ΅ΠΌ шагС

НиТС прСдставлСн ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ, удСрТиваСтся Π»ΠΈ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ ΠΏΠΎ Π΄Π°Π½Π½ΠΎΠΉ Π»Π΅ΠΌΠΌΠ΅:

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости
Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости
Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости
Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ зависимости

Π’ Π΄Π°Π½Π½ΠΎΠΉ ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΌΡ‹ Ρ€Π°Π·ΠΎΠ±Ρ€Π°Π»ΠΈ Ρ‚Π°ΠΊΠΈΠ΅ понятия, ΠΊΠ°ΠΊ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Π°Ρ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ, приблиТСнная Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Π°Ρ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ, рассмотрСли, Π³Π΄Π΅ ΠΎΠ½ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ, Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΊΠ°ΠΊΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ поиска Π€Π— ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚. Π’Π°ΠΊΠΆΠ΅ ΠΌΡ‹ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ Ρ€Π°Π·ΠΎΠ±Ρ€Π°Π»ΠΈ Π±Π°Π·ΠΎΠ²Ρ‹Π΅, Π½ΠΎ Π²Π°ΠΆΠ½Ρ‹Π΅ понятия, Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Π΅ Π² соврСмСнных Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°Ρ… ΠΏΠΎ поиску Π€Π—.

Бсылки Π½Π° Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Ρƒ:

  1. Huhtala Y. et al. TANE: An efficient algorithm for discovering functional and approximate dependencies //The computer journal. – 1999. – Π’. 42. – β„–. 2. – Π‘. 100-111.
  2. Kruse S., Naumann F. Efficient discovery of approximate dependencies //Proceedings of the VLDB Endowment. – 2018. – Π’. 11. – β„–. 7. – Π‘. 759-772.
  3. Papenbrock T., Naumann F. A hybrid approach to functional dependency discovery //Proceedings of the 2016 International Conference on Management of Data. – ACM, 2016. – Π‘. 821-833.
  4. Papenbrock T. et al. Functional dependency discovery: An experimental evaluation of seven algorithms //Proceedings of the VLDB Endowment. – 2015. – Π’. 8. – β„–. 10. – Π‘. 1082-1093.
  5. Kumar A. et al. To join or not to join?: Thinking twice about joins before feature selection //Proceedings of the 2016 International Conference on Management of Data. – ACM, 2016. – Π‘. 19-34.
  6. Abo Khamis M. et al. In-database learning with sparse tensors //Proceedings of the 37th ACM SIGMOD-SIGACT-SIGAI Symposium on Principles of Database Systems. – ACM, 2018. – Π‘. 325-340.
  7. Hellerstein J. M. et al. The MADlib analytics library: or MAD skills, the SQL //Proceedings of the VLDB Endowment. – 2012. – Π’. 5. – β„–. 12. – Π‘. 1700-1711.
  8. Qin C., Rusu F. Speculative approximations for terascale distributed gradient descent optimization //Proceedings of the Fourth Workshop on Data analytics in the Cloud. – ACM, 2015. – Π‘. 1.
  9. Meng X. et al. Mllib: Machine learning in apache spark //The Journal of Machine Learning Research. – 2016. – Π’. 17. – β„–. 1. – Π‘. 1235-1241.

Авторы ΡΡ‚Π°Ρ‚ΡŒΠΈ: Анастасия Π‘ΠΈΡ€ΠΈΠ»Π»ΠΎ, ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒ Π² JetBrains Research, студСнтка CS Ρ†Π΅Π½Ρ‚Ρ€Π° ΠΈ Никита Π‘ΠΎΠ±Ρ€ΠΎΠ², ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒ Π² JetBrains Research

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: habr.com

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ