Qoraalada Saynisyahanka Xogta: Dib-u-eegis Shakhsiyeed ee Luqadaha Weydiinta Xogta
Waxaan khibrad shakhsi ah kuu sheegayaa waxa faa'iido u lahaa meesha iyo goorta. Waa dulmar iyo dulmar, si ay u caddaato waxa iyo meesha aad ka sii qodan karto - laakiin halkan waxaan ku leeyahay waayo-aragnimo shakhsi ahaaneed oo gaar ah, laga yaabee in wax walba adiga kugu duwan yihiin.
Maxay muhiim u tahay in la ogaado oo la awoodo isticmaalka luqadaha weydiinta? Asal ahaan, Sayniska Xogta wuxuu leeyahay dhowr marxaladood oo muhiim ah oo shaqada ah, iyo tan ugu horreysa iyo tan ugu muhiimsan (la'aanteed, hubaal waxba ma shaqeyn doono!) waa helitaanka ama soo saarista xogta. Inta badan, xogtu meel bay u fadhidaa qaab ahaan waxayna u baahan tahay in "laga soo saaro" halkaas.
Luqadaha weydiinta waxay kuu oggolaanayaan inaad soo saarto xogtan! Maantana waxaan kuu sheegi doonaa luqadahaas weydiimaha ah ee waxtarka ii lahaa, waxaanan kuu sheegi doonaa oo ku tusi doonaa meesha iyo sida saxda ah - sababta loogu baahan yahay in la barto.
Wax kasta oo halkan ku qoran waa uun waayo-aragnimo shakhsi ah, waxa faa'iido leh, oo leh sharraxaad ku saabsan xaaladaha iyo "sababta loo baahan yahay" - qof kastaa wuxuu isku dayi karaa sida xaaladaha la midka ah ay kuugu iman karaan oo isku day inaad hore ugu sii diyaargarowdo fahamka luqadahan ka hor inta aanad (si degdeg ah) u codsan mashruuc ama xitaa aadin mashruuc meesha looga baahan yahay.
"Standard" luqadaha weydiinta
Luqadaha su'aalaha caadiga ah waxay si sax ah ula jeedaan in aan inta badan ka fikirno iyaga marka aan ka hadlayno su'aalaha.
Aljabrada xidhiidhka
Waa maxay sababta aljabrada xidhiidhka loogu baahan yahay maanta? Si aad si fiican u fahamto sababta luqadaha weydiintu ay si gaar ah u qaabaysan yihiin oo si miyir leh loogu isticmaalo, waxaad u baahan tahay inaad fahamto xudunta u ah iyaga.
Waa maxay aljebrada xidhiidhsan?
Qeexida rasmiga ah waa sida soo socota: aljabra xiriirka waa nidaam xiran oo ku saabsan xiriirka ee qaabka xogta xiriirka. Si aad u yara dhigto bini'aadamka, tani waa nidaamka hawlgalka ee miisaska sida natiijada had iyo jeer waa miis.
Eeg dhammaan hawlgallada la xidhiidha gudaha tan Maqaalka Habr - halkan waxaan ku sifeyneynaa sababta aad ugu baahan tahay inaad ogaato iyo halka ay ku habboon tahay.
Waa maxay sababta?
Bilawga in la fahmo waxa luuqadaha waydiinta ay ku saabsan yihiin iyo hawlgallada ka dambeeya tibaaxaha luqadaha waydiinta gaarka ah waxay inta badan siinayaa faham qoto dheer oo ku saabsan waxa ka shaqeeya luqadaha waydiinta iyo sida.
Laga soo qaatay tan maqaallo. Tusaalaha qalliinka: ku biir, kaas oo ku biiraya miisaska.
Qalabka wax lagu barto:
Koorso hordhac ah oo wanaagsan oo ka socota Stanford. Guud ahaan, waxaa jira waxyaabo badan oo ku saabsan aljabrada xiriirka iyo aragtida - Coursera, Udacity. Waxa kale oo jira waxyaabo badan oo online ah, oo ay ku jiraan kuwa wanaagsan koorsooyin waxbarasho. Taladayda shakhsi ahaaneed: waxaad u baahan tahay inaad si fiican u fahamto aljabrada xidhiidhka - tani waa aasaaska aasaasiga ah.
Xidhiidhka DBMS-yada: Oracle, Postgres, SQL Server, iwm ayaa wali ah meel walba waxaana jirta fursad aad u sareysa oo aad la falgali karto iyaga, taas oo macnaheedu yahay inaad akhrido SQL (oo aad u badan) ama qor ( midna lagama yaabo).
Waxa la akhriyo oo la barto
Sida laga soo xigtay isla xiriiriyeyaasha kore (ku saabsan aljabrada xiriirka), waxaa jira cadad cajiib ah oo walxo ah, tusaale ahaan, tan.
By habka, waa maxay NoSQL?
"Waxaa mudan in la xoojiyo mar kale in ereyga "NoSQL" uu leeyahay asal asal ah oo aan lahayn qeexitaan guud oo la aqbali karo ama machad cilmiyeed oo ka dambeeya." U dhiganta maqaal ee Habr.
Dhab ahaantii, dadku waxay ogaadeen in qaab buuxa oo xiriir ah aan loo baahnayn si loo xalliyo dhibaatooyin badan, gaar ahaan kuwa, tusaale ahaan, waxqabadku muhiim yahay iyo qaar ka mid ah weydiimaha fudud ee isku-darka ah - halkaas oo ay muhiim tahay in si degdeg ah loo xisaabiyo mitirka loona qoro database, iyo sifooyinka intooda badan waa xidhiidh soo baxay ma aha oo kaliya loo baahnayn, laakiin sidoo kale waxyeello - sababta caadi wax haddii ay kharribi doonto waxa ugu muhiimsan noo (hawlaha qaar ka mid ah) - wax soo saarka?
Sidoo kale, schemas dabacsan ayaa inta badan loo baahan yahay halkii laga heli lahaa jaantusyada xisaabeed go'an ee moodeelka xiriirka caadiga ah - tanina waxay si cajiib ah u fududaynaysaa horumarinta codsiga marka ay muhiim tahay in la geeyo nidaamka oo si degdeg ah loo bilaabo shaqada, habaynta natiijooyinka - ama qaabka iyo noocyada xogta la kaydiyay. aad muhiim uma aha.
Tusaale ahaan, waxaan abuureynaa nidaam khabiir ah waxaana rabnaa inaan ku keydinno macluumaadka domain gaar ah oo ay la socoto macluumaadka meta - waxaa laga yaabaa inaanan garanayn dhammaan beeraha oo si fudud u kaydinno JSON diiwaan kasta - tani waxay na siinaysaa jawi aad u dabacsan si loo ballaariyo xogta model oo si degdeg ah u soo noqnoqonaya - sidaas darteed kiiskan, NoSQL waxay noqon doontaa xitaa la doorbido oo aad loo akhriyo. Tusaalaha gelitaanka (laga bilaabo mid ka mid ah mashaariicdayda halkaasoo NoSQL ay ku saxnayd meeshii looga baahnaa).
Wax badan ayaad akhrin kartaa halkan ku saabsan NoSQL.
Maxaa la baranayaa?
Halkan, halkii, kaliya waxaad u baahan tahay inaad si fiican u falanqeyso hawshaada, waxa guryaha ay leedahay iyo nidaamyada NoSQL ee la heli karo ee ku habboon sharaxaaddan - ka dibna bilow inaad barato nidaamkan.
Luqadaha weydiimaha qoraalka
Marka hore, waxay u muuqataa, maxay Python ku leedahay guud ahaan - waa luqad barnaamij, oo aan ku saabsanayn su'aalaha gabi ahaanba.
Pandas dhab ahaantii waa mindi Ciidanka Swiss ee Sayniska Xogta; xaddi aad u badan oo isbeddel xog ah, isku-dar, iwm ayaa ku dhex dhaca.
Numpy - xisaabinta vector, matrices iyo aljabrada toosan ee halkaas.
Scipy - waxaa ku jira xirmo badan oo xisaab ah, gaar ahaan xisaabaadka.
Shaybaadhka Jupyter - badan oo ah falanqaynta xogta sahaminta ayaa si fiican ugu habboon laptops - faa'iido leh in la ogaado.
Codsiyada - la shaqaynta shabakada
Pyspark aad ayey caan ugu yihiin injineerada xogta, waxay u badan tahay inaad la falgasho tan ama Spark, si fudud caannimadooda awgeed.
* Selenium - aad bay faa'iido ugu leedahay ururinta xogta goobaha iyo ilaha, mararka qaarkood si fudud ma jirto hab kale oo lagu helo xogta.
Wadar ahaan, dhuumo adag oo ku shaqeeya habka socodka xogta weyn (0.5TB), iyada oo aan lahayn kheyraad la taaban karo oo laga sameeyay dhuumo fudud iyo laba qalab.
Talo kale oo muhiim ah: awood u yeelatid inaad si fiican oo waxtar leh ugu shaqeyso terminalka oo aad qorto bash/zsh/iwm.
Halkee laga faa'iidaysan doonaa? Haa, ku dhawaad meel kasta - mar labaad, waxaa jira waxyaabo badan oo lagu barto internetka. Gaar ahaan, halkan tan maqaalkeygii hore.
R qorista
Mar labaad, akhristuhu wuxuu ku dhawaaqi karaa - si fiican, kani waa luqad barnaamij oo dhan! Dabcan, wuu saxnaan doonaa. Si kastaba ha ahaatee, waxaan inta badan la kulmaa R macnaha guud oo, dhab ahaantii, ay aad ula mid tahay luqadda weydiinta.
R waa jawi xisaabin xisaabeed iyo luuqad loogu talagalay xisaabinta joogtada ah iyo muuqaalaynta (sida ku cad tan).
qaaday halkan. By habka, waxaan ku talinayaa, qalab wanaagsan.
Muxuu saynisyahanka xogta u baahan yahay inuu ogaado R? Ugu yaraan, sababtoo ah waxaa jira lakab aad u weyn oo aan IT ahayn oo falanqeeya xogta R. Waxaan kula kulmay meelaha soo socda:
Noocyada gaarka ah ee tirakoobka iyo moodooyinka barashada mashiinka (kuwaas oo badanaa laga heli karo nooca qoraaga sida xirmo R).
Waa maxay sababta ay dhab ahaantii u tahay luqad su'aal? Foomka kaas oo inta badan laga helo, dhab ahaantii waa codsi ah in la abuuro moodal, oo ay ku jiraan xogta akhrinta iyo hagaajinta cabbirka weydiinta (qaabka), iyo sidoo kale muuqaalka xogta ee xirmooyinka sida ggplot2 - tani sidoo kale waa qaab qoraal ah oo su'aalo ah. .
Tusaalaha weydiimaha aragga
ggplot(data = beav,
aes(x = id, y = temp,
group = activ, color = activ)) +
geom_line() +
geom_point() +
scale_color_manual(values = c("red", "blue"))
Guud ahaan, fikrado badan oo ka yimid R ayaa u haajiray xirmooyinka Python sida pandas, nupy ama scipy, sida dataframes iyo vectorization xogta - marka guud ahaan waxyaabo badan oo R ah ayaa kuugu ekaan doona kuwo aad taqaan oo kugu habboon.
Waxaa jira ilo badan oo wax lagu barto, tusaale ahaan, tan.
Garaafyada aqoonta
Halkan waxaan ku leeyahay waayo-aragnimo yar oo aan caadi ahayn, sababtoo ah inta badan waa inaan la shaqeeyaa garaafyada aqoonta iyo luqadaha weydiinta garaafyada. Sidaa darteed, waxaan si kooban u dul mari doonaa aasaaska, maadaama qaybtani ay tahay mid aad u qalaad.
Xog-ururinta qadiimiga ah waxaan ku haynaa qorshe go'an, laakiin halkan naqshaduhu waa dabacsan yahay, saadaal kastaa dhab ahaantii waa "column" iyo xitaa in ka badan.
Ka soo qaad inaad qof qaabaynaysay oo aad rabtay inaad sharaxdo waxyaabaha muhiimka ah, tusaale ahaan, aynu soo qaadano qof gaar ah, Douglas Adams, oo u isticmaal tilmaantan sal.
Haddii aan isticmaalno xog-ururin, waa in aan abuurno miis ama miis aad u weyn oo leh tiro aad u badan oo tiirar ah, kuwaas oo intooda badani ay yihiin NULL ama ay ka buuxsamaan waxoogaa qiimo been ah, tusaale ahaan, uma badna in qaar badan oo naga mid ah ay leeyihiin gelitaanka maktabadda qaranka Kuuriya - dabcan, waxaan ku dhejin karnaa miisas kala duwan, laakiin tani waxay ugu dambeyntii noqon doontaa isku day lagu qaabeynayo wareegga macquulka ah ee dabacsan oo leh saadaaliyayaal iyadoo la adeegsanayo mid go'an oo xiriir ah.
Haddaba qiyaas in dhammaan xogta ay u kaydsan tahay garaaf ahaan ama sida tibaaxaha boolean ee binary iyo unary.
Xagee xitaa tan la kulmi kartaa? Marka hore, la shaqeynta xogta wiki, iyo xog kasta oo garaaf ah ama xogta ku xidhan.
Kuwa soo socda waa luqadaha weydiinta ugu weyn ee aan isticmaalay oo aan la shaqeeyay.
Dhab ahaantii, waxaan rabnaa inaan helno qiimaha doorsoomiyaha dalka oo kale oo loogu talagalay saadaasha
xubin_ka mid ah, waa run in xubin_(? Country,q458) iyo q458 ay tahay aqoonsiga Midowga Yurub.
Tusaale ahaan weydiinta dhabta ah ee SPARQL gudaha mishiinka Python:
Caadi ahaan, waa inaan akhriyo SPARQL intii aan qori lahaa - xaaladdaas, waxay u badan tahay inay noqoto xirfad waxtar leh si loo fahmo luqadda ugu yaraan heer aasaasi ah si loo fahmo sida saxda ah ee xogta loo soo saaro.
Waxaa jira waxyaabo badan oo lagu barto khadka: tusaale, halkan tan и tan. Caadi ahaan waxaan google-ka sameeyaa naqshado gaar ah iyo tusaaleyaal taasna waa igu filan hadda.
Luuqadaha weydiinta macquulka ah
Waxaad wax badan oo mawduuca ku saabsan ka akhriyi kartaa maqaalkayga halkan. Oo halkan, waxaan si kooban u baari doonaa sababta luqadaha macquulka ah ay ugu habboon yihiin qorista weydiimaha. Asal ahaan, RDF waa uun weedho macquul ah oo ah qaabka p(X) iyo h(X,Y), waydiina macquul ahi waxay leedahay qaabkan:
output(X) :- country(X), member_of(X,“EU”).
Halkan waxaan kaga hadlaynaa abuurista wax-soo-saar cusub/1 (/1 macnaheedu waa unary), waase haddii X ay run tahay in waddankaas (X) - tusaale ahaan, X uu yahay waddan iyo sidoo kale xubin (X,"EU").
Taasi waa, kiiskan, labadaba xogta iyo xeerarka ayaa loo soo bandhigay si isku mid ah, taas oo noo ogolaanaysa inaan ku daydo dhibaatooyinka si fudud oo wanaagsan.
Halkee kula kulantay warshadaha?Mashruuc weyn oo dhan oo leh shirkad ku qorta su'aalaha luqadda noocan oo kale ah, iyo sidoo kale mashruuca hadda jira ee xudunta u ah nidaamka - waxay u muuqan kartaa in tani ay tahay wax qalaad, laakiin waxay dhacdaa mararka qaarkood.
Tusaale jajab kood ku jira habaynta luqadda macquulka ah wikidata:
Qalabka: Waxaan halkan ku siin doonaa dhawr xiriiriye oo ku saabsan luuqada casriga ah ee barnaamijka macquulka ah ee Jawaabta Dejinta Programming - Waxaan ku talinayaa in aad barato: