ለተግባራዊ ጥገኛዎች መግቢያ

በዚህ ጽሑፍ ውስጥ በመረጃ ቋቶች ውስጥ ስለ ተግባራዊ ጥገኛዎች እንነጋገራለን - ምን እንደሆኑ ፣ የት ጥቅም ላይ እንደሚውሉ እና እነሱን ለማግኘት ምን ስልተ ቀመሮች አሉ ።

የተግባር ጥገኝነቶችን በተዛማጅ የውሂብ ጎታዎች አውድ ውስጥ እንመለከታለን። በጣም በግምት ለማስቀመጥ, እንደዚህ ባሉ የውሂብ ጎታዎች ውስጥ መረጃ በጠረጴዛዎች መልክ ይከማቻል. በመቀጠል ፣ በጥብቅ የግንኙነት ፅንሰ-ሀሳብ የማይለዋወጡ ግምታዊ ፅንሰ-ሀሳቦችን እንጠቀማለን-ሠንጠረዡን ራሱ ግንኙነት ፣ ዓምዶች - ባህሪዎች (ስብስባቸው - የግንኙነት ንድፍ) እና የረድፍ እሴቶች ስብስብ በባህሪያት ንዑስ ክፍል ላይ እንጠራዋለን። - አንድ tuple.

ለተግባራዊ ጥገኛዎች መግቢያ

ለምሳሌ ከላይ ባለው ሠንጠረዥ ውስጥ. (ቤንሰን፣ ኤም፣ ኤም ኦርጋን።) የባህሪዎች ስብስብ ነው። (ታካሚ፣ ፖል፣ ዶክተር).
በመደበኛነት ይህ እንደሚከተለው ተጽፏል፡- ለተግባራዊ ጥገኛዎች መግቢያ[ታካሚ, ጾታ, ዶክተር] = (ቤንሰን፣ ኤም፣ ኤም ኦርጋን).
አሁን ተግባራዊ ጥገኝነት (FD) ጽንሰ-ሐሳብን ማስተዋወቅ እንችላለን፡-

ፍቺ 1. ግንኙነቱ R የፌደራል ህግን ያሟላል X → Y (X, Y ⊆ R) ለማንኛውም tuples ከሆነ እና ብቻ ከሆነ ለተግባራዊ ጥገኛዎች መግቢያ, ለተግባራዊ ጥገኛዎች መግቢያ ∈ R ይይዛል፡ ከሆነ ለተግባራዊ ጥገኛዎች መግቢያ[X] = ለተግባራዊ ጥገኛዎች መግቢያ[X]፣ እንግዲህ ለተግባራዊ ጥገኛዎች መግቢያ[Y] = ለተግባራዊ ጥገኛዎች መግቢያ[Y] በዚህ አጋጣሚ X (መለያ ወይም የባህሪ ስብስብ) በተግባር Y (ጥገኛውን ስብስብ) ይወስናል እንላለን።

በሌላ አነጋገር የፌደራል ህግ መኖር X → Y ሁለት ቱፕልስ ከገባን ማለት ነው። R እና በባህሪያቸው ይጣጣማሉ X, ከዚያም በባህሪያት ውስጥ ይጣጣማሉ Y.
እና አሁን ፣ በቅደም ተከተል። ባህሪያቱን እንይ ታካሚ и ወሲብ ለዚህም በመካከላቸው ጥገኝነት መኖሩን ወይም እንደሌለ ለማወቅ እንፈልጋለን. ለእንደዚህ አይነት ባህሪያት ስብስብ የሚከተሉት ጥገኞች ሊኖሩ ይችላሉ፡

  1. ታካሚ → ጾታ
  2. ጾታ → ታካሚ

ከላይ እንደተገለጸው፣ የመጀመሪያው ጥገኝነት እንዲይዝ፣ እያንዳንዱ ልዩ የአምድ ዋጋ ታካሚ አንድ የአምድ ዋጋ ብቻ መዛመድ አለበት። ወሲብ. እና ለአብነት ሠንጠረዥ ይህ በእርግጥ ነው. ሆኖም, ይህ በተቃራኒ አቅጣጫ አይሰራም, ማለትም, ሁለተኛው ጥገኝነት አልረካም, እና ባህሪው ወሲብ አይደለም የሚወስነው ታካሚ. በተመሳሳይ, ጥገኝነቱን ከወሰድን ዶክተር → ታካሚከዋጋው ጀምሮ, እንደተጣሰ ማየት ይችላሉ ሮቢን ይህ ባህሪ የተለያዩ ትርጉሞች አሉት- ኤሊስ እና ግሬም.

ለተግባራዊ ጥገኛዎች መግቢያ

ለተግባራዊ ጥገኛዎች መግቢያ

ስለዚህ, ተግባራዊ ጥገኞች በሠንጠረዥ ባህሪያት ስብስቦች መካከል ያሉትን ግንኙነቶች ለመወሰን ያስችላሉ. ከዚህ ጀምሮ በጣም አስደሳች የሆኑትን ግንኙነቶች እንመለከታለን, ወይም ይልቁንስ X → Yምን ናቸው፡-

  • ቀላል ያልሆነ ፣ ማለትም ፣ የጥገኛው የቀኝ ጎን የግራ ንዑስ ክፍል አይደለም። (Y ̸⊆ X);
  • አነስተኛ, ማለትም, እንደዚህ አይነት ጥገኝነት የለም Z → Y, ያ Z ⊂ X.

እስከዚህ ነጥብ ድረስ ግምት ውስጥ የገቡት ጥገኞች ጥብቅ ነበሩ, ማለትም, በጠረጴዛው ላይ ምንም አይነት ጥሰቶች አልሰጡም, ነገር ግን ከነሱ በተጨማሪ, በ tuples እሴቶች መካከል አንዳንድ አለመግባባቶችን የሚፈቅዱም አሉ. እንደነዚህ ያሉ ጥገኞች በተለየ ክፍል ውስጥ ተቀምጠዋል, ግምታዊ ተብለው ይጠራሉ, እና ለተወሰኑ የ tuples ቁጥር እንዲጣሱ ይፈቀድላቸዋል. ይህ መጠን በከፍተኛው የስህተት አመልካች ከፍተኛ ቁጥጥር ይደረግበታል። ለምሳሌ, የስህተት መጠን ለተግባራዊ ጥገኛዎች መግቢያ = 0.01 ጥገኝነት ሊጣስ ይችላል 1% ሊጣስ ይችላል tuples ስብስብ ባህሪያት ስብስብ ላይ. ለ 1000 መዝገቦች, ቢበዛ 10 ቱፕልስ የፌደራል ህግን ሊጥስ ይችላል. በተነፃፃሪዎቹ ጥንድ ጥንድ የተለያዩ እሴቶች ላይ በመመርኮዝ ትንሽ የተለየ መለኪያን እንመለከታለን። ለሱስ X → Y በአመለካከት ላይ r እንደዚ ይቆጠራል።

ለተግባራዊ ጥገኛዎች መግቢያ

ስህተቱን እናሰላው ለ ዶክተር → ታካሚ ከላይ ካለው ምሳሌ. እሴታቸው በባህሪው ላይ የሚለያዩ ሁለት ቱፕልሎች አሉን። ታካሚ፣ ግን ይገጣጠማል ዶክተር: ለተግባራዊ ጥገኛዎች መግቢያ[ዶክተር, ታካሚ] = (ሮቢን, ኤሊስ) እና ለተግባራዊ ጥገኛዎች መግቢያ[ዶክተር, ታካሚ] = (ሮቢን ፣ ግሬም). የስህተት ፍቺን ተከትሎ ሁሉንም የሚጋጩ ጥንዶችን ግምት ውስጥ ማስገባት አለብን ይህም ማለት ሁለቱ ይሆናሉ፡ (ለተግባራዊ ጥገኛዎች መግቢያ, ለተግባራዊ ጥገኛዎች መግቢያ) እና ተቃራኒው (ለተግባራዊ ጥገኛዎች መግቢያ, ለተግባራዊ ጥገኛዎች መግቢያ). በቀመር ውስጥ እንተካውና የሚከተለውን እናገኛለን፡-

ለተግባራዊ ጥገኛዎች መግቢያ

አሁን ለጥያቄው መልስ ለመስጠት እንሞክር: "ለምን ነው ይህ ሁሉ የሆነው?" እንደ እውነቱ ከሆነ, የፌዴራል ሕጎች የተለያዩ ናቸው. የመጀመሪያው ዓይነት በዳታቤዝ ዲዛይን ደረጃ በአስተዳዳሪው የሚወሰኑ ጥገኞች ናቸው። ብዙውን ጊዜ በቁጥር ጥቂቶች ናቸው፣ ጥብቅ ናቸው፣ እና ዋናው አፕሊኬሽኑ የውሂብ መደበኛነት እና የግንኙነት ንድፍ ንድፍ ነው።

ሁለተኛው ዓይነት ጥገኝነቶች ናቸው, እሱም "የተደበቀ" ውሂብ እና ቀደም ሲል በባህሪያት መካከል የማይታወቁ ግንኙነቶችን ይወክላል. ያም ማለት, እንደዚህ ያሉ ጥገኞች በንድፍ ጊዜ ውስጥ አይታሰቡም እና ለነባር የውሂብ ስብስብ ተገኝተዋል, ስለዚህም በኋላ ላይ, በብዙ ተለይተው የታወቁ የፌደራል ህጎች ላይ በመመርኮዝ, የተከማቸ መረጃን በተመለከተ ማንኛውም መደምደሚያ ሊደረስበት ይችላል. በትክክል እኛ የምንሰራው እነዚህ ጥገኞች ናቸው. በተለያዩ የፍለጋ ቴክኒኮች እና በመሠረታቸው ላይ በተገነቡ ስልተ ቀመሮች በጠቅላላ የመረጃ ማዕድን መስክ ይስተናገዳሉ። በማንኛውም ውሂብ ውስጥ የሚገኙት ተግባራዊ ጥገኝነቶች (ትክክለኛ ወይም ግምታዊ) እንዴት ጠቃሚ ሊሆኑ እንደሚችሉ እንወቅ።

ለተግባራዊ ጥገኛዎች መግቢያ

ዛሬ, ከጥገኛዎች ዋና ዋና መተግበሪያዎች አንዱ የውሂብ ማጽዳት ነው. "ቆሻሻ መረጃን" ለመለየት ሂደቶችን ማዘጋጀት እና ከዚያም ማስተካከልን ያካትታል. የ"ቆሻሻ ውሂብ" ዋና ምሳሌዎች የተባዙ፣ የውሂብ ስህተቶች ወይም የፊደል ስህተቶች፣ የጎደሉ እሴቶች፣ ጊዜው ያለፈበት ውሂብ፣ ተጨማሪ ቦታዎች እና የመሳሰሉት ናቸው።

የውሂብ ስህተት ምሳሌ፡-

ለተግባራዊ ጥገኛዎች መግቢያ

በውሂብ ውስጥ የተባዙ ምሳሌ፡

ለተግባራዊ ጥገኛዎች መግቢያ

ለምሳሌ፣ መተግበር ያለባቸው የፌደራል ህጎች ጠረጴዛ እና ስብስብ አለን። በዚህ ጉዳይ ላይ የውሂብ ማጽዳት የፌደራል ህጎች ትክክለኛ እንዲሆኑ መረጃውን መለወጥ ያካትታል. በዚህ ሁኔታ, የማሻሻያዎቹ ብዛት አነስተኛ መሆን አለበት (ይህ አሰራር የራሱ ስልተ ቀመሮች አሉት, በዚህ ጽሑፍ ውስጥ አናተኩርም). ከታች እንደዚህ ያለ የውሂብ ለውጥ ምሳሌ ነው. በግራ በኩል ዋናው ግንኙነት ነው, እሱም በግልጽ አስፈላጊዎቹ ኤፍኤሎች አልተሟሉም (የአንዱን ኤፍኤል መጣስ ምሳሌ በቀይ ጎልቶ ይታያል). በቀኝ በኩል የተሻሻለው ግንኙነት አለ፣ ከአረንጓዴ ሴሎች ጋር የተቀየሩትን እሴቶች ያሳያሉ። ከዚህ አሰራር በኋላ አስፈላጊ የሆኑትን ጥገኞች መጠበቅ ጀመሩ.

ለተግባራዊ ጥገኛዎች መግቢያ

ሌላው ታዋቂ መተግበሪያ የውሂብ ጎታ ንድፍ ነው. እዚህ የተለመዱ ቅጾችን እና መደበኛነትን ማስታወስ ጠቃሚ ነው. ኖርማላይዜሽን ከተወሰኑ መስፈርቶች ጋር ግንኙነትን የማምጣት ሂደት ሲሆን እያንዳንዱም በራሱ መንገድ በተለመደው መልክ ይገለጻል። የተለያዩ የተለመዱ ቅጾችን መስፈርቶች አንገልጽም (ይህ ለጀማሪዎች የውሂብ ጎታ ኮርስ ላይ በማንኛውም መጽሐፍ ውስጥ ይከናወናል), ነገር ግን እያንዳንዳቸው የተግባር ጥገኝነቶችን ጽንሰ-ሐሳብ በራሳቸው መንገድ እንደሚጠቀሙ ብቻ እናስተውላለን. ከሁሉም በላይ, FLs በተፈጥሯቸው የንጹህነት ገደቦች ናቸው የውሂብ ጎታ ሲቀረጹ ግምት ውስጥ የሚገቡት (በዚህ ተግባር ውስጥ, FLs አንዳንድ ጊዜ ሱፐርኪዎች ይባላሉ).

ከታች በምስሉ ላይ ለአራቱ መደበኛ ቅጾች ማመልከቻቸውን እናስብ። ያስታውሱ የቦይስ-ኮድ መደበኛ ቅፅ ከሶስተኛው ቅጽ የበለጠ ጥብቅ ነው ፣ ግን ከአራተኛው ያነሰ ጥብቅ ነው። የኋለኛውን ለጊዜው አናስብም ፣ ምክንያቱም አጻጻፉ በዚህ ጽሑፍ ውስጥ ለእኛ የማይስቡትን ባለብዙ እሴት ጥገኝነቶችን መረዳትን ስለሚፈልግ ነው።

ለተግባራዊ ጥገኛዎች መግቢያ
ለተግባራዊ ጥገኛዎች መግቢያ
ለተግባራዊ ጥገኛዎች መግቢያ
ለተግባራዊ ጥገኛዎች መግቢያ

ጥገኞች አፕሊኬሽኑን ያገኙበት ሌላው አካባቢ እንደ ናቭ ቤይስ ክላሲፋየር መገንባት፣ ጉልህ የሆኑ ባህሪያትን መለየት እና የመመለሻ ሞዴልን ማስተካከል ባሉ ተግባራት ውስጥ የባህሪ ቦታን ስፋት መቀነስ ነው። በዋነኞቹ መጣጥፎች ውስጥ፣ ይህ ተግባር የተደጋገመ እና የባህሪ አግባብነት [5፣ 6]ን መወሰን ተብሎ ይጠራል፣ እና የውሂብ ጎታ ፅንሰ-ሀሳቦችን በንቃት በመጠቀም ተፈትቷል። እንደነዚህ ያሉ ሥራዎች ሲመጡ, ዛሬ የውሂብ ጎታውን, ትንታኔዎችን እና ከላይ የተጠቀሱትን የማመቻቸት ችግሮችን ወደ አንድ መሣሪያ ለማዋሃድ የሚያስችለን የመፍትሄ ፍላጎት አለ ማለት እንችላለን [7, 8, 9].

በመረጃ ስብስብ ውስጥ የፌዴራል ህጎችን ለመፈለግ ብዙ ስልተ ቀመሮች (ሁለቱም ዘመናዊ እና በጣም ዘመናዊ አይደሉም) አሉ ። እንደዚህ ያሉ ስልተ ቀመሮች በሦስት ቡድን ሊከፈሉ ይችላሉ-

  • አልጀብራዊ ጥልፍልፍ (Lattice traversalalgorithms) በመጠቀም አልጎሪዝም
  • የተስማሙ እሴቶችን ፍለጋ (ልዩነት እና የተስማሙ ስልተ ቀመሮች) ላይ የተመሰረቱ አልጎሪዝም
  • ስልተ ቀመር በጥንድ ንፅፅር ላይ የተመሰረተ (ጥገኛ ኢንዳክሽን ስልተ ቀመሮች)

የእያንዳንዱ ዓይነት ስልተ ቀመር አጭር መግለጫ ከዚህ በታች ባለው ሠንጠረዥ ውስጥ ቀርቧል።
ለተግባራዊ ጥገኛዎች መግቢያ

ስለዚህ ምደባ የበለጠ ማንበብ ይችላሉ [4]. ከዚህ በታች ለእያንዳንዱ ዓይነት ስልተ ቀመሮች ምሳሌዎች አሉ።

ለተግባራዊ ጥገኛዎች መግቢያ

ለተግባራዊ ጥገኛዎች መግቢያ

በአሁኑ ጊዜ ተግባራዊ ጥገኝነቶችን ለማግኘት በርካታ አቀራረቦችን የሚያጣምሩ አዳዲስ ስልተ ቀመሮች እየታዩ ነው። የእነዚህ ስልተ ቀመሮች ምሳሌዎች ፒሮ [2] እና ሃይኤፍዲ [3] ናቸው። በሚቀጥሉት የዚህ ተከታታይ መጣጥፎች ስለ ሥራቸው ትንተና ይጠበቃል። በዚህ ጽሑፍ ውስጥ የጥገኝነት መፈለጊያ ዘዴዎችን ለመረዳት አስፈላጊ የሆኑትን መሰረታዊ ፅንሰ-ሀሳቦችን እና ሌማዎችን ብቻ እንመረምራለን.

በሁለተኛው ዓይነት ስልተ ቀመሮች ውስጥ ጥቅም ላይ የዋለው በቀላል - ልዩነት - እና ስምምነት - ስብስብ እንጀምር። ልዩነት-ስብስብ ተመሳሳይ እሴቶች የሌላቸው የ tuples ስብስብ ነው, ተስማምተው-ስብስ, በተቃራኒው, ተመሳሳይ እሴቶች ያላቸው tuples ናቸው. በዚህ ጉዳይ ላይ ጥገኝነት በግራ በኩል ብቻ ግምት ውስጥ እንደገባን ልብ ሊባል የሚገባው ነው.

ከላይ ያጋጠመው ሌላው አስፈላጊ ጽንሰ-ሐሳብ የአልጀብራ ላቲስ ነው. ብዙ ዘመናዊ ስልተ ቀመሮች በዚህ ፅንሰ-ሀሳብ ላይ ስለሚሰሩ, ምን እንደሆነ ሀሳብ ሊኖረን ይገባል.

የላቲስ ጽንሰ-ሐሳብን ለማስተዋወቅ, በከፊል የታዘዘ ስብስብ (ወይም በከፊል የታዘዘ ስብስብ, እንደ ፖሴት ምህጻረ ቃል) መግለፅ አስፈላጊ ነው.

ፍቺ 2. አንድ ስብስብ S በከፊል በሁለትዮሽ ግንኙነት ታዝዟል ተብሏል።

  1. አንጸባራቂነት፣ ማለትም፣ a ⩽ ሀ
  2. አንቲሲሜትሪ፣ ማለትም፣ a ⩽ b እና b ⩽ a ከሆነ፣ ከዚያም a = b
  3. መሸጋገሪያ፣ ማለትም፣ ለ ⩽ b እና b ⩽ c የሚከተለው ሀ ⩽ c


እንዲህ ዓይነቱ ግንኙነት (ልቅ) ከፊል ቅደም ተከተል ግንኙነት ተብሎ ይጠራል, እና ስብስቡ ራሱ በከፊል የታዘዘ ስብስብ ይባላል. መደበኛ ማስታወሻ፡ ⟨S፣ ⩽⟩።

በከፊል የታዘዘ ስብስብ እንደ ቀላሉ ምሳሌ የሁሉንም የተፈጥሮ ቁጥሮች ስብስብ በተለመደው የትእዛዝ ግንኙነት ⩽ መውሰድ እንችላለን። ሁሉም አስፈላጊ axioms መሟላታቸውን ማረጋገጥ ቀላል ነው.

የበለጠ ትርጉም ያለው ምሳሌ። በማካተት ግንኙነት ⊆ የታዘዙትን የሁሉም ንዑስ ስብስቦች {1፣ 2፣ 3} አስቡባቸው። በእርግጥ ይህ ግንኙነት ሁሉንም ከፊል ቅደም ተከተል ሁኔታዎች ያሟላል፣ ስለዚህ ⟨P ({1፣ 2፣ 3})፣ ⊆⟩ በከፊል የታዘዘ ስብስብ ነው። ከታች ያለው ምስል የዚህን ስብስብ አወቃቀር ያሳያል-አንድ አካል በቀስቶች ወደ ሌላ አካል መድረስ ከቻሉ, እነሱ በሥርዓት ግንኙነት ውስጥ ናቸው.

ለተግባራዊ ጥገኛዎች መግቢያ

ከሂሳብ መስክ ሁለት ተጨማሪ ቀላል ትርጓሜዎች ያስፈልጉናል - ሱፐርሙም እና ኢንፊሙም።

ፍቺ 3. ⟨S፣ ⩽⟩ በከፊል የታዘዘ ስብስብ ይሁን፣ A ⊆ S. የ A የላይኛው ወሰን u ∈ S እንደ∀x∈ S፡ x ⩽ u ነው። U የሁሉም የላይኛው ድንበሮች ስብስብ እንሁን። በ U ውስጥ ትንሹ አካል ካለ፣ እሱ የበላይ ተብሎ ይጠራል እና sup A ይባላል።

የትክክለኛ ዝቅተኛ ወሰን ጽንሰ-ሀሳብ በተመሳሳይ መልኩ ቀርቧል።

ፍቺ 4. ⟨S፣ ⩽⟩ በከፊል የታዘዘ ስብስብ ይሁን፣ A ⊆ S. የ A የአካል ጉዳት የሌለው ንጥረ ነገር ነው l∈ S እንደዚህ ∀x∈ S፡ l⩽ x። L የሁሉም የታችኛው የኤስ ወሰኖች ስብስብ ይሁን። በኤል ውስጥ ትልቁ አካል ካለ ኢንፊሙም ይባላል እና inf A ተብሎ ይገለጻል።

እንደ ምሳሌ ከላይ ያለውን ከፊል የታዘዘውን ስብስብ ⟨P ({1፣ 2፣ 3})፣ ⊆⟩ን ተመልከት እና በእሱ ውስጥ የበላይ እና ደካማ የሆነውን አግኝ፡

ለተግባራዊ ጥገኛዎች መግቢያ

አሁን የአልጀብራ ጥልፍልፍ ፍቺን መቅረጽ እንችላለን።

ፍቺ 5. ⟨P፣⩽⟩ በከፊል የታዘዘ ስብስብ ይሁን እያንዳንዱ ባለ ሁለት አካል ንዑስ ስብስብ የላይኛው እና የታችኛው ወሰን አለው። ከዚያም ፒ አልጀብራ ላቲስ ይባላል. በዚህ ሁኔታ፣ sup{x፣ y} በ x ∨ y፣ እና inf {x፣ y} እንደ x ∧ y ተጽፏል።

የእኛ የስራ ምሳሌ ⟨P ({1, 2, 3})፣ ⊆⟩ ጥልፍልፍ መሆኑን እንፈትሽ። በእርግጥ፣ ለማንኛውም a፣ b ∈ P ({1፣ 2፣ 3})፣ a∨b = a∪b እና a∧b = a∩b። ለምሳሌ፣ ስብስቦችን {1፣2} እና {1፣ 3} አስቡ እና አቅመ ደካሞችን እና የበላይነታቸውን ያግኙ። ከተጠላለፍናቸው፣ ቅንብሩን {1} እናገኛለን፣ ይህም አቅመ ቢስ ይሆናል። እነሱን በማጣመር ከፍተኛውን እናገኛለን - {1፣ 2፣ 3}።

አካላዊ ችግሮችን ለመለየት ስልተ ቀመሮች ውስጥ የፍለጋ ቦታ ብዙውን ጊዜ በፍርግርጉ መልክ ይወከላል ፣ የአንድ ንጥረ ነገር ስብስቦች (የፍለጋ ጥልፍልፍ የመጀመሪያ ደረጃን ያንብቡ ፣ የጥገኛዎቹ በግራ በኩል አንድ ባህሪን ያቀፈ) እያንዳንዱን ባህሪ ይወክላል። ከመጀመሪያው ግንኙነት.
በመጀመሪያ፣ የቅጹ ∅ → ጥገኞችን እንመለከታለን ነጠላ ባህሪ። ይህ እርምጃ የትኞቹ ባህሪያት ዋና ቁልፎች እንደሆኑ ለመወሰን ያስችልዎታል (ለእንደዚህ አይነት ባህሪያት ምንም ቆራጮች የሉም, እና ስለዚህ በግራ በኩል ባዶ ነው). በተጨማሪም ፣ እንደዚህ ያሉ ስልተ ቀመሮች ከላጣው ጋር ወደ ላይ ይንቀሳቀሳሉ ። ሙሉውን ጥልፍልፍ ማለፍ እንደማይቻል ልብ ሊባል የሚገባው ነው, ማለትም የሚፈለገው ከፍተኛ መጠን በግራ በኩል ወደ ግብአት ከተላለፈ, አልጎሪዝም ከዚያ መጠን ጋር ካለው ደረጃ በላይ አይሄድም.

ከዚህ በታች ያለው ምስል FZ በማግኘት ችግር ውስጥ የአልጀብራ ላቲስ እንዴት መጠቀም እንደሚቻል ያሳያል። እዚህ እያንዳንዱ ጠርዝ (X፣ XY) ጥገኝነትን ይወክላል X → Y. ለምሳሌ, የመጀመሪያውን ደረጃ አልፈናል እና ሱሱ እንደተጠበቀ እናውቃለን ሀ → ቢ (ይህንን በጫፎቹ መካከል እንደ አረንጓዴ ግንኙነት እናሳያለን A и B). ይህ ማለት በተጨማሪ፣ ከላቲስ ጋር ወደ ላይ ስንንቀሳቀስ ጥገኝነቱን ላናረጋግጥ እንችላለን ኤ ፣ ሲ → ቢ, ምክንያቱም ከአሁን በኋላ ዝቅተኛ አይሆንም. በተመሳሳይ፣ ጥገኝነቱ የተያዘ ከሆነ አንፈትነውም። ሐ → ቢ.

ለተግባራዊ ጥገኛዎች መግቢያ
ለተግባራዊ ጥገኛዎች መግቢያ

በተጨማሪም ፣ እንደ አንድ ደንብ ፣ የፌዴራል ህጎችን ለመፈለግ ሁሉም ዘመናዊ ስልተ ቀመሮች እንደ ክፍልፍል (በመጀመሪያው ምንጭ - የተራቆተ ክፍልፋይ [1]) ያሉ የውሂብ መዋቅርን ይጠቀማሉ። የክፍፍል መደበኛ ትርጉም እንደሚከተለው ነው።

ፍቺ 6. X ⊆ R ለግንኙነት r የባህሪዎች ስብስብ ይሁን። ክላስተር በ r ውስጥ ያለው የ tuples ኢንዴክሶች ስብስብ ሲሆን ለ X ተመሳሳይ ዋጋ ያለው ማለትም c(t) = {i|ti[X] = t[X]} ነው። ክፋይ የንጥል ርዝመት ዘለላዎችን ሳያካትት የክላስተር ስብስብ ነው፡

ለተግባራዊ ጥገኛዎች መግቢያ

በቀላል ቃላት ፣ ለአንድ ባህሪ ክፍልፍል X የዝርዝሮች ስብስብ ነው ፣ እያንዳንዱ ዝርዝር ተመሳሳይ እሴቶች ያላቸው የመስመር ቁጥሮችን የያዘ X. በዘመናዊ ሥነ-ጽሑፍ ክፍልፋዮችን የሚወክለው መዋቅር የአቋም ዝርዝር መረጃ ጠቋሚ (PLI) ይባላል. አሃድ-ርዝመት ዘለላዎች ለ PLI መጭመቂያ ዓላማዎች የተገለሉ ናቸው ምክንያቱም ሁልጊዜ ለመለየት ቀላል የሚሆን ልዩ እሴት ያለው የመዝገብ ቁጥር ብቻ የያዙ ዘለላዎች ናቸው።

አንድ ምሳሌ እንመልከት። ከሕመምተኞች ጋር ወደ አንድ ጠረጴዛ እንመለስ እና ለአምዶች ክፍልፋዮች እንገንባ ታካሚ и ወሲብ (በግራ በኩል አዲስ አምድ ታይቷል ፣ የጠረጴዛው ረድፍ ቁጥሮች ምልክት የተደረገበት)

ለተግባራዊ ጥገኛዎች መግቢያ

ለተግባራዊ ጥገኛዎች መግቢያ

ከዚህም በላይ በትርጉሙ መሠረት ለዓምዱ ክፋይ ታካሚ ነጠላ ዘለላዎች ከክፍልፋይ ስለሚገለሉ በእውነቱ ባዶ ይሆናል።

ክፍልፋዮች በበርካታ ባህሪያት ሊገኙ ይችላሉ. እና ይህንን ለማድረግ ሁለት መንገዶች አሉ-በጠረጴዛው ውስጥ በማለፍ ሁሉንም አስፈላጊ ባህሪዎችን በአንድ ጊዜ አንድ ክፍል ይገንቡ ፣ ወይም የባህሪዎችን ንዑስ ክፍል በመጠቀም የክፍሎች መገናኛን አሠራር በመጠቀም ይገንቡ። የፌደራል ህግ ፍለጋ ስልተ ቀመሮች ሁለተኛውን አማራጭ ይጠቀማሉ.

በቀላል ቃላት፣ ለምሳሌ በአምዶች ክፋይ ለማግኘት ኤቢሲ, ለ ክፍልፋዮች መውሰድ ይችላሉ AC и B (ወይም ሌላ ማንኛውም የተከፋፈሉ ንዑስ ስብስቦች) እና እርስ በርስ ያቆራኙ. የሁለት ክፍልፋዮች የመስቀለኛ መንገድ አሠራር ለሁለቱም ክፍልፋዮች የተለመዱ ከፍተኛውን ርዝመት ያላቸውን ስብስቦች ይመርጣል።

አንድ ምሳሌ እንመልከት፡-

ለተግባራዊ ጥገኛዎች መግቢያ

ለተግባራዊ ጥገኛዎች መግቢያ

በመጀመሪያው ሁኔታ, ባዶ ክፋይ ተቀብለናል. ሠንጠረዡን በቅርበት ከተመለከቱ, በእርግጥ, ለሁለቱ ባህሪያት ምንም ተመሳሳይ እሴቶች የሉም. ጠረጴዛውን (በስተቀኝ ያለውን መያዣ) በትንሹ ካስተካከልን, ባዶ ያልሆነ መስቀለኛ መንገድ እናገኛለን. በተጨማሪም ፣ መስመር 1 እና 2 በእውነቱ ለባህሪያቱ ተመሳሳይ እሴቶችን ይይዛሉ ወሲብ и ዶክተር.

በመቀጠል, እንደ ክፋይ መጠን እንዲህ አይነት ጽንሰ-ሐሳብ ያስፈልገናል. በመደበኛነት፡-

ለተግባራዊ ጥገኛዎች መግቢያ

በቀላል አነጋገር የክፋዩ መጠን በክፋዩ ውስጥ የተካተቱት ስብስቦች ብዛት ነው (ነጠላ ዘለላዎች በክፋዩ ውስጥ እንዳልተካተቱ ያስታውሱ!)

ለተግባራዊ ጥገኛዎች መግቢያ

ለተግባራዊ ጥገኛዎች መግቢያ

አሁን ከተወሰኑት ክፍልፋዮች መካከል ጥገኝነት መያዙን ወይም አለመያዙን ለመወሰን የሚያስችለንን ከቁልፍ ሌማዎች ውስጥ አንዱን መግለፅ እንችላለን።

ለማ 1. ጥገኝነቱ A፣ B → C የሚይዘው ከሆነ እና ከሆነ ብቻ ነው።

ለተግባራዊ ጥገኛዎች መግቢያ

እንደለማው፣ ጥገኝነት መያዙን ለመወሰን አራት ደረጃዎች መከናወን አለባቸው፡-

  1. ለጥገኛው የግራ ጎን ክፍልፋዩን አስላ
  2. ለጥገኛው የቀኝ ጎን ክፍልፋዩን አስላ
  3. የመጀመሪያውን እና ሁለተኛ ደረጃውን ምርት አስሉ
  4. በመጀመሪያው እና በሦስተኛው ደረጃዎች የተገኙትን ክፍልፋዮች መጠኖች ያወዳድሩ

ከዚህ በታች ያለው ጥገኝነት በዚህ ሌማ መሰረት መያዙን የመፈተሽ ምሳሌ ነው።

ለተግባራዊ ጥገኛዎች መግቢያ
ለተግባራዊ ጥገኛዎች መግቢያ
ለተግባራዊ ጥገኛዎች መግቢያ
ለተግባራዊ ጥገኛዎች መግቢያ

በዚህ ጽሑፍ ውስጥ እንደ ተግባራዊ ጥገኝነት ፣ ግምታዊ ተግባራዊ ጥገኝነት ፣ የት ጥቅም ላይ እንደሚውሉ እንዲሁም የአካል ተግባራትን ለመፈለግ ስልተ ቀመሮች ያሉ ጽንሰ-ሀሳቦችን መርምረናል። እንዲሁም የፌዴራል ሕጎችን ለመፈለግ በዘመናዊ ስልተ ቀመሮች ውስጥ በንቃት ጥቅም ላይ የዋሉትን መሠረታዊ ነገር ግን አስፈላጊ ጽንሰ-ሐሳቦችን በዝርዝር መርምረናል.

ዋቢዎች፡-

  1. Huhtala Y. et al. ታኔ፡ ተግባራዊ እና ግምታዊ ጥገኝነቶችን ለማግኘት ቀልጣፋ ስልተ-ቀመር //የኮምፒዩተር ጆርናል። - 1999. - ቲ. 42. - አይ. 2. - ገጽ 100-111.
  2. Kruse S., Naumann F. ግምታዊ ጥገኞችን በብቃት ማግኘት // የVLDB ስጦታ ሂደቶች። - 2018. - ቲ. 11. - አይ. 7. - ገጽ 759-772.
  3. Papenbrock T., Naumann F. ለተግባራዊ ጥገኝነት ግኝት ድብልቅ አቀራረብ // የ 2016 ዓለም አቀፍ የውሂብ አስተዳደር ኮንፈረንስ ሂደቶች. - ኤሲኤም, 2016. - ገጽ 821-833.
  4. Papenbrock ቲ እና ሌሎች. ተግባራዊ ጥገኝነት ግኝት፡ የሰባት ስልተ ቀመሮች የሙከራ ግምገማ //የVLDB ስጦታ ሂደቶች። - 2015. - ቲ. 8. - አይ. 10. - ገጽ 1082-1093.
  5. ኩመር ኤ እና ሌሎች. ለመቀላቀል ወይም ላለመቀላቀል?፡ ከባህሪ ምርጫ በፊት ስለ መቀላቀል ሁለት ጊዜ ማሰብ //የ2016 አለም አቀፍ የውሂብ አስተዳደር ጉባኤ ሂደቶች። - ኤሲኤም, 2016. - ገጽ 19-34.
  6. አቦ ካሚስ መ. እና ሌሎች. በመረጃ ቋት ውስጥ መማር ከትንሽ ተንከሮች ጋር //የ37ኛው ACM የሲጂሞድ-SIGACT-SIGAI ሲምፖዚየም በመረጃ ቋት ሲስተምስ መርሆዎች። - ኤሲኤም, 2018. - ገጽ 325-340.
  7. Hellerstein J. M. እና ሌሎች. የ MADlib የትንታኔ ቤተ-መጽሐፍት፡ ወይም MAD ችሎታዎች፣ የSQL//የVLDB ስጦታ ሂደቶች። - 2012. - ቲ. 5. - አይ. 12. - ገጽ 1700-1711.
  8. Qin C.፣ Rusu F. ግምታዊ ግምቶች ለቴራስኬል የተከፋፈለ ቀስ በቀስ የዘር ማመቻቸት //የአራተኛው ወርክሾፕ በመረጃ ትንተና በደመና ውስጥ። - ኤሲኤም, 2015. - ፒ. 1.
  9. ሜንግ ኤክስ እና ሌሎች. ማሊብ፡ የማሽን መማር በ apache spark //ዘ ጆርናል ኦፍ የማሽን መማሪያ ምርምር። - 2016. - ቲ. 17. - አይ. 1. - ገጽ 1235-1241.

የጽሁፉ ደራሲዎች፡- አናስታሲያ ቢሪሎ፣ ተመራማሪ በ JetBrains ምርምር, የሲኤስ ማእከል ተማሪ и Nikita Bobrov፣ ተመራማሪ በ JetBrains ምርምር

ምንጭ: hab.com

አስተያየት ያክሉ