ይህ ጽሑፍ በ KDPV ላይ ስለሚያዩት ቀላሉ እና ፈጣኑ የውሂብ ማግኛ መሣሪያ ይናገራል። የሚገርመው፣ ዌል በሩቅ git አገልጋይ ላይ እንዲስተናገድ ተደርጎ የተሰራ ነው። በቆርጡ ስር ዝርዝሮች.
የኤርቢንብ ዳታ ማግኛ መሣሪያ እንዴት ሕይወቴን እንደለወጠው
በሙያዬ፣ በአንዳንድ አዝናኝ ችግሮች ላይ ለመስራት እድለኛ ነኝ፡ በ MIT ዲግሪዬን ስሰራ የፍሰት ሂሳብን አጠናሁ፣ በተጨመሩ ሞዴሎች ላይ እና በክፍት ምንጭ ፕሮጀክት ሰራሁ።
{{data}}ን የት ማግኘት እችላለሁ? ዳታፖርታል.
ይህ አምድ ምን ማለት ነው? ዳታፖርታል.
{{metric}} ዛሬ እንዴት እየሰራ ነው? ዳታፖርታል.
የሕይወት ስሜት ምንድን ነው? ውስጥ ዳታፖርታል, ምናልባት.
እሺ፣ ምስሉን አቅርበሃል። መረጃን መፈለግ እና ምን ማለት እንደሆነ መረዳት፣እንዴት እንደተፈጠረ እና እንዴት እንደሚጠቀሙበት መረዳት ጥቂት ደቂቃዎችን እንጂ ሰአታትን አይወስድም። ማስታወሻዎችን ከመቆፈር፣ ተደጋጋሚ የSQL መጠይቆችን ከመፃፍ እና ባልደረባዎችን በSlack ላይ ከመጥቀስ ይልቅ ቀላል መደምደሚያዎችን ወይም አዲስ ስልተ ቀመሮችን (… ወይም ስለ ውሂቡ የዘፈቀደ ጥያቄዎችን በመመለስ) ጊዜዬን ማሳለፍ እችል ነበር። ነበረው።
ምንድነው ችግሩ?
አብዛኞቹ ጓደኞቼ እንደዚህ አይነት መሳሪያ እንደሌላቸው ተረዳሁ። እንደ ዳታፖርታል ያለ የመድረክ መሳሪያን ለመገንባት እና ለማቆየት ብዙ ሀብቶችን ለማዋል ጥቂት ኩባንያዎች ፈቃደኞች ናቸው። እና ጥቂት ክፍት ምንጭ መፍትሄዎች ቢኖሩም፣ እነሱ ለመመዘን የተነደፉ ናቸው፣ ያለ ቁርጠኛ ዴቭኦፕስ መሐንዲስ ማዋቀር እና ማቆየት አስቸጋሪ ያደርገዋል። ስለዚህ አዲስ ነገር ለመፍጠር ወሰንኩ.
ዌል፡ ደደብ ቀላል የመረጃ ማግኛ መሳሪያ
እና አዎ፣ በሞኝነት ቀላል ማለቴ ሞኝነት ቀላል ነው። ዓሣ ነባሪው ሁለት አካላት ብቻ ነው ያለው።
- ሜታዳታ የሚሰበስብ እና በማርክ ዳውን ውስጥ የሚቀርፀው የፓይዘን ቤተ-መጽሐፍት።
- በዚህ ውሂብ ውስጥ ለመፈለግ ዝገት የትእዛዝ መስመር በይነገጽ።
ለጥገና ከውስጥ መሠረተ ልማት አንጻር ብዙ የጽሑፍ ፋይሎች እና ጽሑፉን የሚያዘምኑ ፕሮግራሞች ብቻ አሉ። ያ ነው፣ ስለዚህ እንደ Github ባሉ git አገልጋይ ላይ ማስተናገድ ተራ ነገር ነው። ለመማር አዲስ የመጠይቅ ቋንቋ የለም፣ ምንም የአስተዳደር መሠረተ ልማት የለም፣ ምንም ምትኬ የለም። Gitን ሁሉም ሰው ያውቃል፣ ስለዚህ ማመሳሰል እና ትብብር ነጻ ነው። ተግባራዊነቱን ጠለቅ ብለን እንመርምር
ሙሉ ተለይቶ የቀረበ git-based GUI
ዌል የተነደፈው በርቀት የጂት አገልጋይ ውቅያኖስ ውስጥ ለመዋኘት ነው። እሱ
Github Actions ን በመጠቀም የመነጨ የስታስቲክ ሠንጠረዥ ምሳሌ። ሙሉ የስራ ማሳያ
መብረቅ ፈጣን CLI ማከማቻዎን ይፈልጉ
ዌል በትእዛዝ መስመር ላይ ይኖራል እና ይተነፍሳል፣ ይህም በጠረጴዛዎችዎ ላይ ኃይለኛ እና ሚሊሰከንድ ፍለጋዎችን ያቀርባል። በሚሊዮኖች የሚቆጠሩ ጠረጴዛዎች ቢኖሩም፣ አንዳንድ ብልህ የሆኑ የመሸጎጫ ዘዴዎችን በመጠቀም እና እንዲሁም በሩስት ውስጥ ያለውን የኋላ ክፍል በመገንባት ዌልን በሚያስደንቅ ሁኔታ አፈፃፀም ችለናል። ምንም የፍለጋ መዘግየት አያስተውሉም [ሄሎ Google DS]።
የዌል ማሳያ፣ ሚሊዮን የጠረጴዛ ፍለጋ።
የመለኪያዎች ራስ-ሰር ስሌት [በቤታ]
እንደ ዳታ ሳይንቲስት በጣም ከምወዳቸው ነገሮች አንዱ ጥቅም ላይ የዋለውን የውሂብ ጥራት ለመፈተሽ ብቻ ተመሳሳይ ጥያቄዎችን ደጋግሞ እየሮጠ ነው። ዌል ከእርስዎ ሜታዳታ ማጽጃ ቧንቧዎች ጋር አብሮ እንዲሄድ የታቀደውን በSQL ውስጥ መለኪያዎችን የመግለጽ ችሎታን ይደግፋል። የ YAML ሜትሪክስ ቋት ውስጥ ያለውን ክፍል ይግለጹ እና ዌል በራስ-ሰር በጊዜ መርሐግብር ይሠራል እና በመለኪያዎች ውስጥ የተቀመጡ ጥያቄዎችን ያሂዳል።
```metrics
metric-name:
sql: |
select count(*) from table
```
ከ Github ጋር ተደምሮ፣ ይህ አካሄድ ዓሣ ነባሪ ለሜትሪክ ፍቺዎች ቀላል ማዕከላዊ የእውነት ምንጭ ሆኖ ሊያገለግል ይችላል። ዌል በ "~/" ውስጥ ካለው የጊዜ ማህተም ጋር እሴቶቹን እንኳን ይቆጥባል። whale/metrics" አንዳንድ ቻርቲንግ ወይም የበለጠ ጥልቅ ምርምር ማድረግ ከፈለጉ።
የወደፊቱን
የቅድመ-መለቀቅ የዓሣ ነባሪ ሥሪታችንን ተጠቃሚዎችን ካነጋገርን በኋላ፣ ሰዎች ተጨማሪ ተግባር እንደሚያስፈልጋቸው ተገነዘብን። ለምን የጠረጴዛ ፍለጋ መሳሪያ? ለምን ሜትሪክስ መፈለጊያ መሳሪያ አይሆንም? ለምን አይከታተልም? ለምን የ SQL መጠይቅ ማስፈጸሚያ መሳሪያ አይሆንም? ዌል v1 በመጀመሪያ የተፀነሰው እንደ ቀላል የ CLI ተጓዳኝ መሣሪያ ነው። Dataportal/Amundsen
, እሱ ቀድሞውኑ ወደ ሙሉ-ተለይቶ ራሱን የቻለ መድረክ ተሻሽሏል, እና የውሂብ ሳይንቲስት መሣሪያ ስብስብ ዋና አካል እንደሚሆን ተስፋ እናደርጋለን.
በልማት ሂደት ውስጥ ማየት የሚፈልጉት ነገር ካለ የእኛን ይቀላቀሉ
መደምደሚያ
ዌል የተገነባው እና የሚንከባከበው በዳታ ፍሬም ነው፣ ይህ ጅምር ከሌሎች ሰዎች ጋር በቅርቡ በመመሥረት ደስ ብሎኛል። ዌል የተሰራው ለመረጃ ሳይንቲስቶች ሲሆን ዳታ ፍሬም የተሰራው ለመረጃ ሳይንቲስቶች ነው። የበለጠ በቅርበት መተባበር ለምትፈልጉ፣ ነፃነት ይሰማዎ
እና በማስተዋወቂያ ኮድ HABR, በባነር ላይ ለተጠቀሰው ቅናሽ ተጨማሪ 10% ማግኘት ይችላሉ.
የውሂብ ሳይንስ የመስመር ላይ ቡት ካምፕ የዳታ ተንታኝ ሙያን ከባዶ ማሰልጠን የውሂብ ትንታኔ የመስመር ላይ ቡት ካምፕ የዳታ ሳይንስን ሙያ ከባዶ ማስተማር Python ለድር ልማት ኮርስ
ተጨማሪ ኮርሶች
የውሂብ ትንታኔ ኮርስ DevOps ኮርስ የሙያ ድር ገንቢ ሥራ የ iOS ገንቢ ከባዶ ፕሮፌሽናል አንድሮይድ ገንቢ ከባዶ ሙያ ጃቫ ገንቢ ከባዶ የጃቫ ስክሪፕት ኮርስ የማሽን ትምህርት ኮርስ ኮርስ "የሂሳብ እና የማሽን መማር ለዳታ ሳይንስ" የላቀ ኮርስ "Machine Learning Pro + Deep Learning"
ተለይተው የቀረቡ ጽሑፎች
ያለ የመስመር ላይ ኮርሶች የውሂብ ሳይንቲስት እንዴት መሆን እንደሚቻል 450 ነጻ አይቪ ሊግ ኮርሶች የማሽን መማርን በሳምንት 5 ቀናት ለ9 ወራት በተከታታይ እንዴት እንደሚያጠና አንድ የውሂብ ተንታኝ ምን ያህል ያገኛል-በ 2020 በሩሲያ እና በውጭ አገር የደመወዝ እና ክፍት የሥራ ቦታዎች አጠቃላይ እይታ በማዕድን ኢንዱስትሪ ውስጥ የማሽን መማር እና የኮምፒተር እይታ
ምንጭ: hab.com