በዳታ ሳይንስ ምን ችግር ሊፈጠር ይችላል? የውሂብ መሰብሰብ

በዳታ ሳይንስ ምን ችግር ሊፈጠር ይችላል? የውሂብ መሰብሰብ
ዛሬ 100500 የዳታ ሳይንስ ኮርሶች አሉ እና በዳታ ሳይንስ ውስጥ ከፍተኛው ገንዘብ በዳታ ሳይንስ ኮርሶች ሊገኝ እንደሚችል ሲታወቅ ቆይቷል (አካፋ ሲሸጡ ለምን ይቆፍራሉ?) የእነዚህ ኮርሶች ዋነኛው ኪሳራ ከእውነተኛ ስራ ጋር ምንም ግንኙነት ስለሌላቸው ማንም ሰው ንፁህ እና የተቀነባበረ መረጃ በሚፈለገው ቅርጸት አይሰጥዎትም. እና ኮርሱን ለቀው ሲወጡ እና እውነተኛ ችግርን መፍታት ሲጀምሩ, ብዙ ልዩነቶች ይታያሉ.

ስለዚህ፣ በእኔ፣ በጓዶቼ እና በባልደረባዎቼ ላይ በተከሰቱት እውነተኛ ክስተቶች ላይ በመመርኮዝ ተከታታይ ማስታወሻዎችን "በመረጃ ሳይንስ ምን ሊሳሳት ይችላል" እንጀምራለን ። እውነተኛ ምሳሌዎችን በመጠቀም የተለመዱ የውሂብ ሳይንስ ስራዎችን እንመረምራለን-ይህ እንዴት በትክክል እንደሚከሰት። ዛሬ በመረጃ አሰባሰብ ተግባር እንጀምር።

እና ሰዎች በእውነተኛ መረጃ መስራት ሲጀምሩ የሚሰናከሉበት የመጀመሪያው ነገር በእውነቱ ለእኛ በጣም አስፈላጊ የሆነውን ይህንን ውሂብ መሰብሰብ ነው። የዚህ ጽሑፍ ቁልፍ መልእክት፡-

መረጃን ለመሰብሰብ፣ ለማፅዳት እና ለማዘጋጀት የሚያስፈልገውን ጊዜ፣ ግብዓቶች እና ጥረቶች ስልታዊ በሆነ መንገድ እንገምታለን።

እና ከሁሉም በላይ, ይህንን ለመከላከል ምን ማድረግ እንዳለብን እንነጋገራለን.

በተለያዩ ግምቶች መሰረት ጽዳት፣ ትራንስፎርሜሽን፣ መረጃን ማቀናበር፣ ባህሪ ኢንጂነሪንግ ወዘተ ከ80-90%፣ እና ትንተና ከ10-20% ይወስዳሉ፣ ከሞላ ጎደል ሁሉም ትምህርታዊ ነገሮች በመተንተን ላይ ብቻ ያተኩራሉ።

ቀላል የትንታኔ ችግርን በሶስት ስሪቶች እንደ ዓይነተኛ ምሳሌ እንይ እና “የሚያባብሱ ሁኔታዎች” ምን እንደሆኑ እንይ።

እና እንደ ምሳሌ፣ በድጋሚ፣ መረጃን የመሰብሰብ እና ማህበረሰቦችን የማወዳደር ተግባር ተመሳሳይ ልዩነቶችን እንመለከታለን፡-

  1. ሁለት Reddit subreddits
  2. የሀብር ሁለት ክፍሎች
  3. ሁለት የ Odnoklassniki ቡድኖች

በንድፈ ሀሳብ ውስጥ ሁኔታዊ አቀራረብ

ጣቢያውን ይክፈቱ እና ምሳሌዎችን ያንብቡ, ግልጽ ከሆነ, ለንባብ ጥቂት ሰዓቶችን ይመድቡ, ምሳሌዎችን እና ማረም በመጠቀም ለኮዱ ጥቂት ሰዓቶችን ያስቀምጡ. ለመሰብሰብ ጥቂት ሰዓቶችን ይጨምሩ. በመጠባበቂያ ውስጥ ጥቂት ሰዓታት ውስጥ ይጣሉ (በሁለት ማባዛ እና N ሰዓቶችን ይጨምሩ)።

ቁልፍ ነጥብ፡ የጊዜ ግምቶች ምን ያህል ጊዜ እንደሚፈጅ ግምቶች እና ግምቶች ላይ የተመሰረቱ ናቸው።

ከዚህ በላይ ለተገለጸው ሁኔታዊ ችግር የሚከተሉትን መለኪያዎች በመገመት የጊዜ ትንታኔውን መጀመር አስፈላጊ ነው.

  • የመረጃው መጠን ምን ያህል ነው እና ምን ያህል በአካል መሰብሰብ እንዳለበት (* ከዚህ በታች ይመልከቱ*).
  • ለአንድ መዝገብ የመሰብሰቢያ ጊዜ ስንት ነው እና ሁለተኛውን ከመሰብሰብዎ በፊት ምን ያህል ጊዜ መጠበቅ አለብዎት?
  • ግዛትን የሚያድን ኮድ መጻፍ ያስቡበት እና ሁሉም ነገር ሳይሳካ ሲቀር (ካልሆነ) እንደገና መጀመር ይጀምራል።
  • ፈቃድ ያስፈልገን እንደሆነ ይወቁ እና በኤፒአይ በኩል መዳረሻ ለማግኘት ጊዜ ያዘጋጁ።
  • የስህተቶችን ብዛት እንደ የውሂብ ውስብስብነት ያቀናብሩ - ለአንድ የተወሰነ ተግባር ይገምግሙ: መዋቅር, ምን ያህል ለውጦች, ምን እና እንዴት ማውጣት እንደሚቻል.
  • የአውታረ መረብ ስህተቶችን እና ችግሮችን ከመደበኛ ያልሆነ የፕሮጀክት ባህሪ ጋር ያስተካክሉ።
  • አስፈላጊዎቹ ተግባራት በሰነዱ ውስጥ እንዳሉ እና ካልሆነ, ለጥገና ምን ያህል እና ምን ያህል እንደሚያስፈልግ ይገምግሙ.

በጣም አስፈላጊው ነገር ጊዜን ለመገመት - በእውነቱ "በኃይል ማጣራት" ላይ ጊዜ እና ጥረት ማጥፋት ያስፈልግዎታል - ከዚያ በኋላ ብቻ እቅድዎ በቂ ይሆናል. ስለዚህ፣ “መረጃ ለመሰብሰብ ምን ያህል ጊዜ ይፈጅበታል” ለማለት ምንም ያህል ቢገፋችሁ - ለቅድመ-ትንተና እራሳችሁን የተወሰነ ጊዜ ግዙ እና እንደ ችግሩ ትክክለኛ መለኪያዎች ሰዓቱ ምን ያህል እንደሚለያይ ተከራከሩ።

እና አሁን እንደነዚህ ያሉ መለኪያዎች የሚለወጡባቸውን የተወሰኑ ምሳሌዎችን እናሳያለን.

ቁልፍ ነጥብ፡ ግምቱ በስራው ወሰን እና ውስብስብነት ላይ ተጽዕኖ በሚያሳድሩ ቁልፍ ነገሮች ላይ በመተንተን ላይ የተመሰረተ ነው.

በግምት ላይ የተመሰረተ ግምት የተግባር አካላት በበቂ ሁኔታ ትንሽ ሲሆኑ እና የችግሩን ንድፍ ላይ ከፍተኛ ተጽዕኖ ሊያሳድሩ የሚችሉ ብዙ ምክንያቶች ከሌሉ ጥሩ አቀራረብ ነው. ነገር ግን በበርካታ የውሂብ ሳይንስ ችግሮች ውስጥ እንደዚህ ያሉ ምክንያቶች እጅግ በጣም ብዙ ስለሚሆኑ እንዲህ ዓይነቱ አቀራረብ በቂ አይሆንም.

የ Reddit ማህበረሰቦችን ማወዳደር

በጣም ቀላል በሆነው ጉዳይ እንጀምር (በኋላ ላይ እንደሚታየው)። በአጠቃላይ፣ ሙሉ በሙሉ እውነት ለመናገር፣ በጣም ጥሩ የሆነ ጉዳይ አለን፣ እስቲ ውስብስብነት ማረጋገጫ ዝርዝራችንን እንመርምር፡-

  • ንጹህ፣ ግልጽ እና የሰነድ ኤፒአይ አለ።
  • እጅግ በጣም ቀላል እና ከሁሉም በላይ አስፈላጊ የሆነው ቶከን በራስ-ሰር የተገኘ ነው.
  • አሉ የፓይቶን መጠቅለያ - ከብዙ ምሳሌዎች ጋር።
  • በሬዲት ላይ መረጃን የሚመረምር እና የሚሰበስብ ማህበረሰብ (የፓይቶን መጠቅለያ እንዴት እንደሚጠቀሙ የሚገልጹ የዩቲዩብ ቪዲዮዎችም ቢሆን) ለምሳሌ.
  • የምንፈልጋቸው ዘዴዎች በኤፒአይ ውስጥ ሊኖሩ ይችላሉ። በተጨማሪም ፣ ኮዱ የታመቀ እና ንጹህ ይመስላል ፣ ከዚህ በታች በልጥፍ ላይ አስተያየቶችን የሚሰበስብ ተግባር ምሳሌ ነው።

def get_comments(submission_id):
    reddit = Reddit(check_for_updates=False, user_agent=AGENT)
    submission = reddit.submission(id=submission_id)
    more_comments = submission.comments.replace_more()
    if more_comments:
        skipped_comments = sum(x.count for x in more_comments)
        logger.debug('Skipped %d MoreComments (%d comments)',
                     len(more_comments), skipped_comments)
    return submission.comments.list()

ከ የተወሰደ ይሄ ለመጠቅለል ምቹ የሆኑ መገልገያዎች ምርጫ.

ምንም እንኳን ይህ በጣም ጥሩው ጉዳይ ቢሆንም ፣ አሁንም ከእውነተኛ ህይወት በርካታ አስፈላጊ ነገሮችን ግምት ውስጥ ማስገባት ጠቃሚ ነው-

  • የኤፒአይ ገደቦች - ውሂብን በቡድን እንድንወስድ እንገደዳለን (በጥያቄዎች መካከል መተኛት ፣ ወዘተ)።
  • የመሰብሰቢያ ጊዜ - ለተሟላ ትንተና እና ንፅፅር, ሸረሪቷ በንዑስ ሬድዲት ውስጥ እንድትሄድ ብቻ ጉልህ የሆነ ጊዜ መመደብ አለብህ.
  • ቦት በአገልጋይ ላይ መሮጥ አለበት - በላፕቶፕዎ ላይ ብቻ ማስኬድ ፣ በቦርሳዎ ውስጥ ማስገባት እና ወደ ንግድዎ መሄድ አይችሉም። ስለዚህ ሁሉንም ነገር በ VPS ላይ ሮጥኩ. የማስተዋወቂያ ኮድ habrahabr10 በመጠቀም ሌላ 10% ወጪን መቆጠብ ይችላሉ።
  • የአንዳንድ መረጃዎች አካላዊ ተደራሽ አለመሆን (ለአስተዳዳሪዎች የሚታዩ ወይም ለመሰብሰብ በጣም አስቸጋሪ ናቸው) - ይህ ግምት ውስጥ መግባት አለበት ፣ በመርህ ደረጃ ሁሉም መረጃዎች በበቂ ጊዜ ሊሰበሰቡ አይችሉም።
  • የአውታረ መረብ ስህተቶች፡ ኔትዎርክ ማድረግ ህመም ነው።
  • ይህ ሕያው እውነተኛ መረጃ ነው - በጭራሽ ንጹህ አይደለም።

እርግጥ ነው, በእድገቱ ውስጥ እነዚህን ጥቃቅን ነገሮች ማካተት አስፈላጊ ነው. የተወሰኑ ሰዓቶች/ቀናቶች በእድገት ልምድ ወይም ተመሳሳይ ስራዎች ላይ በመስራት ልምድ ላይ ይመሰረታሉ, ሆኖም ግን, እዚህ ስራው ምህንድስና ብቻ እንደሆነ እና ለመፍታት ተጨማሪ የሰውነት እንቅስቃሴዎችን እንደማያስፈልግ እናያለን - ሁሉም ነገር በደንብ ሊገመገም, ሊታቀድ እና ሊሰራ ይችላል.

የሃብር ክፍሎችን ማነፃፀር

የሐብርን ክሮች እና/ወይም ክፍሎች ወደ ማወዳደር ወደሚስብ እና ቀላል ወደሌለው ጉዳይ እንሂድ።

የኛን ውስብስብነት ዝርዝር እንፈትሽ - እዚህ እያንዳንዱን ነጥብ ለመረዳት ወደ ስራው ትንሽ ቆፍሮ መሞከር አለቦት።

  • መጀመሪያ ላይ ኤፒአይ አለ ብለው ያስባሉ፣ ግን የለም። አዎ፣ አዎ፣ ሃብር ኤፒአይ አለው፣ ግን ለተጠቃሚዎች ተደራሽ አይደለም (ወይም ምናልባት ጨርሶ ላይሰራ ይችላል።)
  • ከዚያ ኤችቲኤምኤልን መተንተን ትጀምራለህ - “ጥያቄዎችን አስመጣ”፣ ምን ችግር ሊፈጠር ይችላል?
  • ለማንኛውም እንዴት መተንተን ይቻላል? በጣም ቀላሉ እና በጣም ብዙ ጊዜ ጥቅም ላይ የሚውለው አካሄድ መታወቂያዎችን መድገም ነው ፣ እሱ በጣም ቀልጣፋ አለመሆኑን እና የተለያዩ ጉዳዮችን ማስተናገድ እንዳለበት ልብ ይበሉ - በሁሉም ነባር መካከል የእውነተኛ መታወቂያዎች ጥንካሬ ምሳሌ እዚህ አለ።

    በዳታ ሳይንስ ምን ችግር ሊፈጠር ይችላል? የውሂብ መሰብሰብ
    ከ የተወሰደ ይሄ መጣጥፎች

  • በድሩ አናት ላይ በኤችቲኤምኤል የተጠቀለለ ጥሬ መረጃ ህመም ነው። ለምሳሌ የአንድን መጣጥፍ ደረጃ መሰብሰብ እና ማስቀመጥ ይፈልጋሉ፡ ውጤቱን ከኤችቲኤምኤል አውጥተህ ለቀጣይ ሂደት እንደ ቁጥር ለማስቀመጥ ወስነሃል፡ 

    1) int (ነጥብ) ስህተትን ይጥላል-በሀበሬ ላይ ተቀንሷል ፣ ለምሳሌ ፣ በመስመር “–5” ውስጥ - ይህ የ en ሰረዝ ነው ፣ የመቀነስ ምልክት አይደለም (ሳይታሰብ ፣ ትክክል?) ፣ ወዘተ. በተወሰነ ደረጃ ተንታኙን በእንደዚህ ዓይነት አስከፊ ጥገና ወደ ሕይወት ማሳደግ ነበረብኝ።

    try:
          score_txt = post.find(class_="score").text.replace(u"–","-").replace(u"+","+")
          score = int(score_txt)
          if check_date(date):
            post_score += score
    

    ምንም ቀን፣ ፕላስ እና ተቀናሾች ላይኖር ይችላል (ከላይ በቼክ_ቀን ተግባር ላይ እንደምናየው ይህ ተከሰተ)።

    2) የማይታለፉ ልዩ ቁምፊዎች - ይመጣሉ, ዝግጁ መሆን አለብዎት.

    3) መዋቅሩ እንደ ልጥፍ ዓይነት ይለወጣል.

    4) የድሮ ልጥፎች ** እንግዳ መዋቅር** ሊኖራቸው ይችላል።

  • በመሰረቱ የስህተት አያያዝ እና ሊከሰት ወይም ላይሆን የሚችለውን ነገር በአግባቡ መያዝ አለበት እና ምን እንደሚሳሳት እና መዋቅሩ እንዴት እንደሚሆን እና ምን እንደሚወድቅ በእርግጠኝነት መገመት አይችሉም - መሞከር እና ግምት ውስጥ ማስገባት ብቻ ያስፈልግዎታል። ተንታኙ የሚጥላቸው ስህተቶች.
  • ከዚያም በበርካታ ክሮች ውስጥ መተንተን እንደሚያስፈልግዎ ይገነዘባሉ, አለበለዚያ በአንዱ ውስጥ መተንተን 30+ ሰአታት ይወስዳል (ይህ ቀድሞውኑ የሚሰራ ነጠላ-ክር ያለው ተንታኝ የማስፈጸሚያ ጊዜ ነው, እሱም ይተኛል እና በማንኛውም እገዳ ሾር አይወድቅም). ውስጥ ይሄ ጽሑፉ ፣ ይህ በተወሰነ ጊዜ ወደ ተመሳሳይ እቅድ አመራ።

በዳታ ሳይንስ ምን ችግር ሊፈጠር ይችላል? የውሂብ መሰብሰብ

አጠቃላይ የማረጋገጫ ዝርዝር በውስብስብነት፡-

  • ከአውታረ መረቡ ጋር በመስራት እና በኤችቲኤምኤል መተንተን በመድገም እና በመታወቂያ መፈለግ።
  • የተለያየ መዋቅር ሰነዶች.
  • ኮዱ በቀላሉ የሚወድቅባቸው ብዙ ቦታዎች አሉ።
  • መፃፍ ያስፈልጋል || ኮድ
  • አስፈላጊዎቹ ሰነዶች፣ የኮድ ምሳሌዎች እና/ወይም ማህበረሰብ ጠፍተዋል።

የዚህ ተግባር የተገመተው ጊዜ ከሬዲት መረጃን ለመሰብሰብ ከ 3-5 እጥፍ ይበልጣል.

የ Odnoklassniki ቡድኖች ንጽጽር

ወደ ተገለጸው በጣም ቴክኒካዊ አጓጊ ጉዳይ እንሂድ። ለእኔ ፣ በትክክል አስደሳች ነበር ፣ ምክንያቱም በመጀመሪያ እይታ ፣ በጣም ቀላል ይመስላል ፣ ግን እንደዚያ አልሆነም - ልክ ዱላ እንደ ነቀዙት።

በችግር ማመሳከሪያ ዝርዝራችን እንጀምር እና ብዙዎቹ መጀመሪያ ላይ ከሚመለከቱት የበለጠ በጣም አስቸጋሪ እንደሚሆኑ እናስተውል፡-

  • ኤፒአይ አለ ነገር ግን ሙሉ ለሙሉ አስፈላጊ ተግባራትን ይጎድለዋል.
  • ለተወሰኑ ተግባራት በደብዳቤ መድረስን መጠየቅ ያስፈልግዎታል ፣ ማለትም ፣ የመዳረሻ መስጠቱ ወዲያውኑ አይደለም።
  • እሱ በጣም በሰነድ ነው (በመጀመር ፣ ሩሲያኛ እና እንግሊዝኛ ቃላት በሁሉም ቦታ ይደባለቃሉ ፣ እና ሙሉ በሙሉ የማይጣጣሙ - አንዳንድ ጊዜ እርስዎ የሆነ ቦታ ከእርስዎ የሚፈልጉትን መገመት ብቻ ያስፈልግዎታል) እና በተጨማሪ ፣ ዲዛይኑ መረጃን ለማግኘት ተስማሚ አይደለም ፣ ለምሳሌ , የሚያስፈልገንን ተግባር.
  • በሰነዱ ውስጥ ክፍለ ጊዜ ይፈልጋል፣ ግን በትክክል አይጠቀምበትም - እና ሁሉንም የኤፒአይ ሁነታዎች ውስብስብ ነገሮች ለመረዳት እና የሆነ ነገር እንደሚሰራ ተስፋ ከማድረግ ውጭ ለመረዳት ምንም መንገድ የለም።
  • ምንም ምሳሌዎች እና ማህበረሰብ የለም፤ ​​መረጃን ለመሰብሰብ ብቸኛው የድጋፍ ነጥብ ትንሽ ነው። መጠቅለያ በ Python (ያለ ብዙ የአጠቃቀም ምሳሌዎች)።
  • ብዙ አስፈላጊ መረጃዎች የተቆለፉ ስለሆኑ ሴሊኒየም በጣም ሊሠራ የሚችል አማራጭ ይመስላል።
    1) ያም ማለት፣ ፈቃድ የሚከናወነው በልብ ወለድ ተጠቃሚ (እና በእጅ ምዝገባ) ነው።

    2) ሆኖም በሴሊኒየም ለትክክለኛ እና ሊደገም የሚችል ሥራ ምንም ዋስትናዎች የሉም (ቢያንስ በ ok.ru ጉዳይ ላይ በእርግጠኝነት)።

    3) የ Ok.ru ድህረ ገጽ የጃቫ ስክሪፕት ስህተቶችን ይዟል እና አንዳንድ ጊዜ እንግዳ እና ወጥነት የሌለው ባህሪ ይኖረዋል።

    4) ፔጃኒሽን, የመጫኛ ክፍሎችን, ወዘተ ... ማድረግ ያስፈልግዎታል.

    5) መጠቅለያው የሚሰጣቸው የኤፒአይ ስህተቶች በማይመች ሁኔታ መስተናገድ አለባቸው፣ ለምሳሌ እንደዚህ (የሙከራ ኮድ ቁራጭ)፡

    def get_comments(args, context, discussions):
        pause = 1
        if args.extract_comments:
            all_comments = set()
    #makes sense to keep track of already processed discussions
            for discussion in tqdm(discussions): 
                try:
                    comments = get_comments_from_discussion_via_api(context, discussion)
                except odnoklassniki.api.OdnoklassnikiError as e:
                    if "NOT_FOUND" in str(e):
                        comments = set()
                    else:
                        print(e)
                        bp()
                        pass
                all_comments |= comments
                time.sleep(pause)
            return all_comments
    

    በጣም የምወደው ስህተት፡-

    OdnoklassnikiError("Error(code: 'None', description: 'HTTP error', method: 'discussions.getComments', params: …)”)

    6) በመጨረሻም ሴሊኒየም + ኤፒአይ በጣም ምክንያታዊ አማራጭ ይመስላል።

  • ሁኔታውን ማዳን እና ስርዓቱን እንደገና ማስጀመር ፣ ብዙ ስህተቶችን ማስተናገድ ፣ የጣቢያው የማይጣጣም ባህሪን ጨምሮ - እና እነዚህ ስህተቶች ለማሰብ በጣም ከባድ ናቸው (በእርግጥ ተንታኞችን ካልጻፉ በስተቀር)።

የዚህ ተግባር ሁኔታዊ የጊዜ ግምት ከሀብር መረጃን ለመሰብሰብ ከ 3-5 እጥፍ ይበልጣል. ምንም እንኳን በሀብር ጉዳይ ላይ የፊት ለፊት አቀራረብን በኤችቲኤምኤል ትንተና እንጠቀማለን ፣ እና እሺን በተመለከተ ከኤፒአይ ጋር በወሳኝ ቦታዎች ልንሰራ እንችላለን።

ግኝቶች

የቱንም ያህል የቱንም ያህል ጊዜ ገደብ ማበጀት ቢጠበቅብዎት (እኛ ዛሬ እቅድ አውጥተናል!) እጅግ በጣም ብዙ የውሂብ ማቀነባበሪያ የቧንቧ መስመር ሞጁል፣ የተግባር መለኪያዎችን ሳይመረምሩ በጥራት እንኳን ለመገመት የአፈፃፀም ጊዜ በጭራሽ አይቻልም።

በጥቂቱ ፍልስፍናዊ ማስታወሻ ላይ፣ ቀልጣፋ የግምት ስልቶች ለኢንጂነሪንግ ስራዎች ጥሩ ይሰራሉ፣ ነገር ግን የበለጠ ሙከራ እና፣ በአንፃሩ፣ “ፈጠራ” እና ገላጭ የሆኑ ችግሮች፣ ማለትም ብዙም የማይገመቱ ችግሮች አሉባቸው፣ እንደ ተመሳሳይ አርእስቶች ምሳሌዎች። እዚህ ጋር የተነጋገርነው.

በእርግጥ የመረጃ አሰባሰብ ዋና ምሳሌ ነው - ብዙውን ጊዜ በማይታመን ሁኔታ ቀላል እና ቴክኒካል ያልተወሳሰበ ስራ ነው, እና ዲያቢሎስ ብዙውን ጊዜ በዝርዝሮች ውስጥ ነው. እና በትክክል በዚህ ተግባር ላይ ስህተት ሊፈጠር ለሚችለው እና በትክክል ስራው ለምን ያህል ጊዜ እንደሚወስድ ሁሉንም ሊሆኑ የሚችሉ አማራጮችን ማሳየት እንችላለን.

ያለ ተጨማሪ ሙከራዎች የተግባሩን ባህሪያት ከተመለከቱ ፣ ከዚያ Reddit እና እሺ ተመሳሳይ ናቸው-ኤፒአይ ፣ የፓይቶን መጠቅለያ አለ ፣ ግን በመሠረቱ ፣ ልዩነቱ ትልቅ ነው። በእነዚህ መመዘኛዎች በመመዘን የሀብር ፓርስ ከOK የበለጠ የተወሳሰበ ይመስላል - በተግባር ግን ተቃራኒ ነው፣ እና የችግሩን መለኪያዎች ለመተንተን ቀላል ሙከራዎችን በማካሄድ በትክክል ሊታወቅ የሚችለው ይህ ነው።

በእኔ ልምድ ፣ በጣም ውጤታማው አቀራረብ ለቅድመ ትንተና እራሱ እና ለቀላል የመጀመሪያ ሙከራዎች የሚያስፈልግዎትን ጊዜ በግምት መገመት ነው ፣ ሰነዶቹን በማንበብ - እነዚህ ለጠቅላላው ስራ ትክክለኛ ግምት እንዲሰጡ ያስችልዎታል። ከታዋቂው ቀልጣፋ ዘዴ አንፃር ፣ ለ “የተግባር መለኪያዎችን ለመገመት” ትኬት እንዲፈጥሩ እጠይቃለሁ ፣ በዚህ መሠረት በ “sprint” ውስጥ ምን ሊከናወን እንደሚችል መገምገም እና ለእያንዳንዱ የበለጠ ትክክለኛ ግምት መስጠት እችላለሁ ። ተግባር.

ስለዚህ, በጣም ውጤታማው ክርክር "ቴክኒካዊ ያልሆነ" ልዩ ባለሙያተኛ ምን ያህል ጊዜ እና ሀብቶች ገና ያልተገመገሙ መለኪያዎች እንደሚለያዩ የሚያሳይ ይመስላል.

በዳታ ሳይንስ ምን ችግር ሊፈጠር ይችላል? የውሂብ መሰብሰብ

ምንጭ: hab.com

አስተያየት ያክሉ