ቻርላታንን ከመረጃ ሳይንስ እንዴት ማወቅ ይቻላል?

ቻርላታንን ከመረጃ ሳይንስ እንዴት ማወቅ ይቻላል?
ስለ ተንታኞች፣ ስለ ማሽን መማሪያ እና ስለ አርቴፊሻል ኢንተለጀንስ ስፔሻሊስቶች ሰምተህ ይሆናል፣ ነገር ግን ፍትሃዊ ባልሆነ መልኩ ከመጠን በላይ ስለተከፈላቸው ሰምተሃል? መገናኘት ውሂብ charlatan! እነዚህ ሰርጎ ገቦች፣ ትርፋማ በሆኑ ስራዎች ተታለው፣ ለእውነተኛ የውሂብ ሳይንቲስቶች መጥፎ ስም ይሰጣሉ። በእቃው ውስጥ እንደነዚህ ያሉትን ሰዎች ወደ ንጹህ ውሃ እንዴት ማምጣት እንደሚቻል እንረዳለን.

የውሂብ ቻርላታኖች በሁሉም ቦታ አሉ።

ዳታ ቻርላታኖች በግልጽ እይታ ውስጥ መደበቅ በጣም ጥሩ ስለሆኑ ይችላሉ። ከነሱ አንዱ ሁንሳያውቁት. እንደ እድል ሆኖ፣ ድርጅትዎ እነዚህን ተንኮለኛ ወንዶች ለዓመታት ሲይዝ ቆይቷል፣ ነገር ግን መልካሙ ዜና ምን መፈለግ እንዳለቦት ካወቁ በቀላሉ መለየት ቀላል ነው።
የመጀመሪያው የማስጠንቀቂያ ምልክት ያንን አለመረዳት ነው። ትንታኔዎች እና ስታቲስቲክስ በጣም የተለያዩ ዘርፎች ናቸው።. ይህንን የበለጠ አብራራለሁ.

የተለያዩ ዘርፎች

የስታቲስቲክስ ባለሙያዎች ከመረጃዎቻቸው በላይ ምን መደምደሚያ ላይ እንዲደርሱ የሰለጠኑ ናቸው, ተንታኞች የውሂብ ስብስብ ይዘትን ለመመርመር የሰለጠኑ ናቸው. በሌላ አነጋገር ተንታኞች በመረጃቸው ውስጥ ስላለው ነገር መደምደሚያ ላይ ይደርሳሉ, እና የስታቲስቲክስ ባለሙያዎች በመረጃው ውስጥ በሌሉበት መደምደሚያ ላይ ይደርሳሉ. ተንታኞች ጥሩ ጥያቄዎችን እንዲጠይቁ ይረዱዎታል ( መላምቶችን ያዘጋጃሉ) እና የስታቲስቲክስ ባለሙያዎች ጥሩ መልሶችን እንዲያገኙ ያግዙዎታል (ግምቶችዎን ይፈትሹ)።

አንድ ሰው በሁለት ወንበሮች ላይ ለመቀመጥ የሚሞክርበት እንግዳ ድብልቅ ሚናዎች አሉ ... ለምን አይሆንም? የመረጃ ሳይንስ መሰረታዊ መርሆ፡ እርግጠኛ ካልሆኑ ሁኔታዎች ጋር እየተገናኙ ከሆነ መጠቀም አይችሉም ተመሳሳይ የውሂብ ነጥብ ለመላምቶች እና ለሙከራ. መረጃው ሲገደብ፣ እርግጠኛ አለመሆን በስታቲስቲክስ ወይም በመተንተን መካከል ምርጫን ያስገድዳል። ማብራሪያ እዚህ.

ያለ ስታቲስቲክስ፣ እርስዎ ይጣበቃሉ እና አሁን ያቀረብከው ፍርድ ይጸናል ወይ የሚለውን መረዳት አትችልም፣ እና ያለ ትንታኔ፣ በጭፍን እየተንቀሳቀስክ ነው፣ ያልታወቀን ነገር የመግራት እድሉ ትንሽ ነው። ይህ አስቸጋሪ ምርጫ ነው.

የቻርላታን ከዚህ ውጥንቅጥ መውጫ መንገድ ችላ ማለት እና በድንገት በተፈጠረው ነገር እንደተገረመ ማስመሰል ነው። የስታቲስቲካዊ መላምቶችን ከመሞከር በስተጀርባ ያለው አመክንዮ የሚመጣው መረጃው አስተሳሰባችንን ለመለወጥ በሚያስደንቅ ሁኔታ ያስደንቀናል ወይ ወደሚለው ጥያቄ ነው። አስቀድመን አይተነው ከሆነ በመረጃ እንዴት እንገረማለን?

ቻርላታኖች ስርዓተ-ጥለት ባገኙ ቁጥር ተመስጦ ይነሳሉ፣ ከዚያ ያረጋግጡ ተመሳሳይ ውሂብ ለ ተመሳሳይ ንድፍ, ውጤቱን በህጋዊ p-value ወይም ሁለት ለማተም, ከነሱ ጽንሰ-ሀሳብ ቀጥሎ. ስለዚህም እነሱ ለአንተ (እና ምናልባትም ለራሳቸውም) ይዋሻሉ። በአንተ መላምት ካልያዝክ ይህ p-value ምንም አይደለም። ወደ ውሂብዎን እንዴት እንደተመለከቱት። ቻርላታኖች ምክንያቶቹን ሳይረዱ የተንታኞችን እና የስታቲስቲክስ ባለሙያዎችን ድርጊት ይኮርጃሉ። በውጤቱም, አጠቃላይ የውሂብ ሳይንስ መስክ መጥፎ ስም አግኝቷል.

እውነተኛ የስታቲስቲክስ ባለሙያዎች ሁልጊዜ የራሳቸውን መደምደሚያ ይሰጣሉ

ለጠንካራ አስተሳሰባቸው የስታቲስቲክስ ሊቃውንት ሚስጥራዊ ዝና ምስጋና ይግባውና በመረጃ ሳይንስ ውስጥ ያለው የውሸት መረጃ መጠን ከምንጊዜውም በላይ ከፍተኛ ነው። በተለይም ያልጠረጠረው ተጎጂ ሁሉም ስለ እኩልታዎች እና መረጃዎች ነው ብሎ ካሰበ ለማታለል እና ላለመያዝ ቀላል ነው። የውሂብ ስብስብ የውሂብ ስብስብ ነው, አይደል? አይ. እርስዎ እንዴት እንደሚጠቀሙበት አስፈላጊ ነው.

እንደ እድል ሆኖ፣ ቻርላታንን ለመያዝ አንድ ፍንጭ ብቻ ነው የሚያስፈልግህ፡ “አሜሪካን መልሰህ እያገኘች ነው። በመረጃው ውስጥ እንዳሉ የሚያውቁትን ክስተቶች እንደገና በማግኘት።

ከቻርላታኖች በተለየ፣ ጥሩ ተንታኞች ክፍት አእምሮ ያላቸው እና አነሳሽ ሀሳቦች ብዙ የተለያዩ ማብራሪያዎች ሊኖራቸው እንደሚችል ይገነዘባሉ። በተመሳሳይ ጊዜ ጥሩ የስታቲስቲክስ ባለሙያዎች መደምደሚያቸውን ከማድረጋቸው በፊት በጥንቃቄ ይገልጻሉ.

ተንታኞች ከተጠያቂነት ነፃ ናቸው... በመረጃቸው ወሰን ውስጥ እስካልቆዩ ድረስ። ያላዩትን ነገር ለመጠየቅ ከተፈተኑ ይህ ሌላ ስራ ነው። የተንታኙን ጫማ አውልቀው የስታስቲክስ ባለሙያውን ጫማ ማድረግ አለባቸው። ደግሞም ኦፊሴላዊው የሥራ ማዕረግ ምንም ይሁን ምን, ከፈለጉ ሁለቱንም ሙያዎች ማጥናት አይችሉም የሚል ህግ የለም. ዝም ብለህ አታደናግር።

በስታቲስቲክስ ጎበዝ ስለሆንክ ብቻ በትንታኔ ጎበዝ ነህ ማለት አይደለም እና በተቃራኒው። ሌላ ሰው ሊነግርዎት ቢሞክር መጠንቀቅ አለብዎት። ይህ ሰው ቀደም ሲል ካጠኑት መረጃ ላይ ስታቲስቲካዊ መደምደሚያዎችን ማድረግ እንደሚፈቀድ ከነገረዎት, ይህ በእጥፍ መጠንቀቅ ያለብዎት ምክንያት ነው.

አስገራሚ ማብራሪያዎች

በዱር ውስጥ ያሉ ዳታ ቻርላታንን ሲመለከቱ የሚመለከቱትን ውሂብ "ለማብራራት" ድንቅ ታሪኮችን መስራት እንደሚወዱ ያስተውላሉ። ብዙ ትምህርታዊ, የተሻለ ይሆናል. እነዚህ ታሪኮች በቅድመ እይታ ቢስተካከሉ ምንም ችግር የለውም።

ቻርላታኖች ይህን ሲያደርጉ - ግልጽ ልበል - ይዋሻሉ። ምንም ያህል እኩልታዎች ወይም ድንቅ ፅንሰ-ሀሳቦች የእነሱን ጽንሰ-ሀሳቦች ዜሮ ማረጋገጫ ማቅረባቸውን ማረጋገጥ አይችሉም። የእነሱ ማብራሪያ ምን ያህል ያልተለመደ እንደሆነ አትደነቁ።

ይህ በመጀመሪያ በእጃችሁ ያሉትን ካርዶች በመመልከት እና ምን እንደያዙ በመተንበይ "ሳይኪክ" ችሎታዎችዎን ከማሳየት ጋር ተመሳሳይ ነው. ይህ የኋላ እይታ አድልዎ ነው, እና የውሂብ ሳይንስ ሙያው በእሱ ላይ ተሞልቷል.

ቻርላታንን ከመረጃ ሳይንስ እንዴት ማወቅ ይቻላል?

ተንታኞች “ከአልማዝ ንግሥት ጋር ሄድክ” ይላሉ። የስታቲስቲክስ ሊቃውንት “ከመጀመራችን በፊት መላምቶቼን በዚህ ወረቀት ላይ ጻፍኩ። እንጫወት እና አንዳንድ መረጃዎችን እንይ እና ልክ እንደሆንኩ እንይ።" ቻርላታንስ “ይህች የአልማዝ ንግስት እንደምትሆን አውቅ ነበር ምክንያቱም…”

የውሂብ መጋራት ሁሉም ሰው የሚያስፈልገው ፈጣን መፍትሄ ነው።

ብዙ ውሂብ በማይኖርበት ጊዜ በስታቲስቲክስ እና በመተንተን መካከል መምረጥ አለብዎት, ነገር ግን ከበቂ በላይ መረጃ ሲኖር, ያለማታለል ትንታኔዎችን ለመጠቀም ትልቅ እድል አለ. и ስታቲስቲክስ. ከቻርላታን ጋር ፍጹም መከላከያ አለዎት - የውሂብ መለያየት እና በእኔ አስተያየት ይህ በዳታ ሳይንስ ውስጥ በጣም ኃይለኛ ሀሳብ ነው።

እራስህን ከቻርላታኖች ለመጠበቅ የሚያስፈልግህ ነገር አንዳንድ የፍተሻ ውሂቦችን ዓይኖቻቸው በማይደርሱበት ቦታ ማስቀመጥህን ማረጋገጥ እና የቀረውን እንደ ትንታኔ መውሰድ ነው። የመቀበል ስጋት አለብህ የሚል ንድፈ ሃሳብ ሲያጋጥሙህ ሁኔታውን ለመገምገም ተጠቀምበት እና ከዛም ንድፈ ሃሳቡ ከንቱነት እንዳልሆነ ለማረጋገጥ ሚስጥራዊ የፈተና መረጃህን ግለጽ። በጣም ቀላል ነው!

ቻርላታንን ከመረጃ ሳይንስ እንዴት ማወቅ ይቻላል?
በምርመራው ሂደት ማንም ሰው የሙከራ መረጃውን እንዲያይ እንደማይፈቀድ ያረጋግጡ። ይህንን ለማድረግ በምርምር መረጃ ላይ ይቆዩ. የሙከራ ውሂብ ለመተንተን ጥቅም ላይ መዋል የለበትም.

ይህ በ"ትንንሽ ዳታ" ዘመን ሰዎች ከለመዱት ትልቅ እርምጃ ሲሆን በመጨረሻም አንድ ነገር እንዳወቁ ሰዎችን ለማሳመን የምታውቁትን እንዴት እንደምታውቁ ማስረዳት አለባችሁ።

ተመሳሳይ ደንቦችን ወደ ML/AI ተግብር

እንደ ML/AI ባለሙያዎች የሚመስሉ አንዳንድ ቻርላታኖች እንዲሁ በቀላሉ ይገኛሉ። ማንኛውንም መጥፎ መሐንዲስ በሚይዙበት መንገድ ይይዟቸዋል፡ ለመገንባት የሚሞክሩት "መፍትሄዎች" ያለማቋረጥ ይወድቃሉ። የቅድመ ማስጠንቀቂያ ምልክት በኢንዱስትሪ ደረጃ የፕሮግራም አወጣጥ ቋንቋዎች እና ቤተመጻሕፍት ልምድ ማነስ ነው።

ግን የሚሰሩ የሚመስሉ ስርዓቶችን ስለሚፈጥሩ ሰዎችስ? አጠራጣሪ ነገር እየተከሰተ መሆኑን እንዴት ያውቃሉ? ተመሳሳይ ህግ ነው የሚሰራው! ቻርላታን ሞዴሉ ምን ያህል በጥሩ ሁኔታ እንደሰራ የሚያሳየዎት መጥፎ ገጸ ባህሪ ነው ... ሞዴሉን ለመፍጠር በተጠቀሙበት ተመሳሳይ መረጃ ላይ።

በጣም ውስብስብ የሆነ የማሽን መማሪያ ስርዓት ከገነቡ ምን ያህል ጥሩ እንደሆነ እንዴት ያውቃሉ? ከዚህ ቀደም በማታውቀው አዲስ ዳታ ስትሰራ እስክታሳያት ድረስ አታውቅም።

ከመተንበይዎ በፊት ውሂቡን ሲያዩ - የማይመስል ነገር ነው። ከዚህ በፊትመናገር

ለመለያየት በቂ መረጃ ሲኖርዎት ፕሮጀክቱን ለማስረዳት የቀመሮችዎን ውበት መጥቀስ አያስፈልግም (በሳይንስ ውስጥ ብቻ ሳይሆን በሁሉም ቦታ የማየው የቆየ ፋሽን ልማድ)። እንዲህ ማለት ትችላለህ፡- "እንደሚሰራ አውቃለሁ ምክንያቱም ከዚህ በፊት ያላየሁትን የውሂብ ስብስብ ወስጄ እዚያ ምን እንደሚሆን በትክክል መተንበይ ስለምችል ነው ... እና ትክክል እሆናለሁ. እንደገና".

የእርስዎን ሞዴል/ንድፈ ሃሳብ ከአዲስ መረጃ ጋር መሞከር ለትምክህት ምርጡ መሰረት ነው።

ዳታ ቻርላታንን አልታገስም። አስተያየትህ በተለያዩ ዘዴዎች ላይ የተመሰረተ ቢሆን ግድ የለኝም። የማብራሪያዎቹ ውበት አልደነቀኝም። የእርስዎ ቲዎሪ/ሞዴል ከዚህ በፊት አይተህ የማታውቀው በአጠቃላይ አዲስ ውሂብ ላይ እንደሚሰራ (እና መስራቱን እንደቀጠለ) አሳየኝ። ይህ የአመለካከትዎ ጥንካሬ እውነተኛ ፈተና ነው።

የውሂብ ሳይንስ ባለሙያዎችን ማነጋገር

ይህን ቀልድ በሚረዱ ሰዎች ሁሉ በቁም ነገር እንዲወሰዱዎት ከፈለጉ፣ የግል አድልዎ ለመደገፍ በሚያስደንቅ እኩልታዎች ጀርባ መደበቅዎን ያቁሙ። ያላችሁን አሳዩኝ። "የሚያገኙት" የአንተን ንድፈ ሃሳብ/ሞዴል እንደ አነቃቂ ግጥም ብቻ እንዲመለከቱት ከፈለግክ፣ ሙሉ በሙሉ አዲስ በሆነ የውሂብ ስብስብ ላይ ምን ያህል በጥሩ ሁኔታ እንደሚሰራ የሚያሳይ ታላቅ ትርኢት ለማሳየት አይዞህ... በምስክሮች ፊት !

ለመሪዎች ይግባኝ

ስለ ውሂቡ ምንም አይነት "ሀሳቦች" እስኪሞከሩ ድረስ በቁም ነገር ከመውሰድ ይቆጠቡ አዲስ ውሂብ. ጥረት ማድረግ አይፈልጉም? ከትንታኔዎቹ ጋር ይጣበቁ፣ ነገር ግን በእነዚህ ሃሳቦች ላይ አትመኑ - እነሱ የማይታመኑ እና ለታማኝነት ያልተሞከሩ ናቸው። ከዚህም በላይ አንድ ድርጅት ብዙ መረጃዎች ሲኖሩት መለያየትን በሳይንስ መሠረታዊ ማድረግ እና በመሠረተ ልማት ደረጃ እንዲቆይ በማድረግ ለስታስቲክስ መረጃን የመፈተሽ ዕድልን በመቆጣጠር ጉዳቱ የለም። ይህ ሰዎች እርስዎን ለማታለል የሚሞክሩትን ለማስቆም ጥሩ መንገድ ነው!

ብዙ የቻርላታን ምሳሌዎችን ማየት ከፈለጉ እስከ ምንም ጥሩ - በTwitter ላይ አንድ አስደናቂ ክር እነሆ.

ውጤቶች

ለመለያየት በጣም ትንሽ ውሂብ ሲኖር፣ አሜሪካን ወደ ኋላ መለስ ብሎ በማግኘት፣ በሂሳብ ቀድሞ በመረጃው ውስጥ እንዳሉ የሚታወቁትን ክስተቶች በማግኘት እና ድንቁን በስታቲስቲካዊ ጠቀሜታ በመጥራት መነሳሳትን በጥብቅ ለመከተል የሚሞክር ቻርላታን ብቻ ነው። ይህ ከክፍት አእምሮ ተንታኝ፣ ተመስጦን ከሚሠራው እና ትንበያዎችን በሚያደርጉበት ጊዜ ማስረጃዎችን ከሚሰጥ የስታቲስቲክስ ባለሙያ ይለያቸዋል።

ብዙ ውሂብ ሲኖር ከሁለቱም አለም ምርጡን ማግኘት እንዲችሉ ውሂቡን የመለየት ልማድ ይኑርዎት! ለዋናው የውሂብ ክምር ንኡስ ስብስቦች በተናጠል ትንታኔዎችን እና ስታቲስቲክስን ማድረግዎን ያረጋግጡ።

  • ተንታኞች መነሳሳትን እና ክፍት አእምሮን ይሰጥዎታል።
  • ስታትስቲክስ ጥብቅ ፈተና ይሰጥዎታል።
  • ቻርላታንስ ትንታኔ እና ስታቲስቲክስ መስሎ የሚያሳይ ጠማማ የኋላ እይታን እናቀርብላችኋለን።

ምናልባት፣ ጽሑፉን ካነበብክ በኋላ “እኔ ቻርላታን ነኝ” ብለህ ታስብ ይሆናል። ይህ ጥሩ ነው። ይህንን ሃሳብ ለማስወገድ ሁለት መንገዶች አሉ፡ በመጀመሪያ ወደ ኋላ ተመልከቱ፣ ያደረጋችሁትን ስራ ይመልከቱ፣ ከውሂብ ጋር ያደረጋችሁት ስራ ተግባራዊ ጥቅም አስገኝቶ እንደሆነ ይመልከቱ። እና በሁለተኛ ደረጃ፣ አሁንም በእርስዎ መመዘኛዎች ላይ መስራት ይችላሉ (በእርግጠኝነት ከመጠን በላይ አይሆንም)፣ በተለይ ለተማሪዎቻችን እውነተኛ የውሂብ ሳይንቲስቶች እንዲሆኑ የሚያስችል ተግባራዊ ክህሎቶችን እና እውቀትን ስለምንሰጥ።

ቻርላታንን ከመረጃ ሳይንስ እንዴት ማወቅ ይቻላል?

ተጨማሪ ኮርሶች

ተጨማሪ ያንብቡ

ምንጭ: hab.com

አስተያየት ያክሉ