Dabeşa Daneyê. sala 2013. Paşverû

Di sala 2013 de IBS, ku paşê xuya bû ku diafirîne Dabeşa Daneyê, ji min xwest ku di derheqê qada pirsgirêkê ya Daneyên Mezin, û Daneyên bi gelemperî de mejîyek wusa çêkim (bi taybetî li ser bingeha ezmûna danûstendina bi xerîdarên neft û gazê yên pargîdanî re). Ji ber vê yekê ez 7 sal şûnda rastî wê hatim û min fikir kir ku ew qeşeng e. Hin tişt diyar in. Hinek derket holê ku bi tevahî ne rast in, lê... 7 sal derbas bûn.

Min bi îngilîzî nivîsî û niha ez fikirîm ku wergerînim rûsî. Ger tiştek niha hîn jî têkildar be çi? (Ez ê bultenan wergerînim, lê ji tembeliyê îşaretên bi Îngilîzî bihêlin. Kesk baş e, sor xeternak e, şîn xewn e).

Ez ê ji "îro" şîroveyên hindiktirîn fermî bikim Îtalîda ku ew eşkere û diyar e.

Ji ber vê yekê, DATA! Daneyên ji bo me ...

Dabeşa Daneyan Beşa Xwînê ye, ji ber ku dane dikare were berhev kirin, mînakî, bi xwîna ku di nav damar û damarên laşek karsaziyek de diherike. Lêbelê, her çend xwîn yek e, organîzmayên cûda cûda ne û ji ber vê yekê hilberandin pir dijwar e, lê di heman demê de derfetek ji bo pêşkeftinê jî nîşan dide.

Mirov hene ku daneya rast di çavên wan de diherike - ev in Em in.
Û mirov hene ku, mixabin, xala daneyê vala nabînin. Ev, dîsa, mixabin, ya me ye Mişterî!

Dabeşa Daneyê. sala 2013. Paşverû

Û vî awayî, prensîbên karsaziyê ...

  1. Em difiroşin dikanû ne ИТ (dibe ku hemî pisporên IT-ê bi yekcarî min bibaxşînin) ji ber ku em pirsgirêkên cîhanê çareser dikin, û, baş, bêtir dravê.
  2. Hemî pirsgirêkên karsaziyê li dora vertîkalên pîşesaziya tematîk têne berhev kirin û dê têra xwe hewce bike pisporî.
  3. Hewldanên îsbatkirinê nirxa "dane" an, hîn dijwartir, nirxa "rêveberiya daneyê" ji karsaziyek re êş û êşa herheyî ye. Di eslê xwe de, ew mîna ku were ba mirovekî ku xwe baş hîs dike û bêje: "Kalo, em ê niha xwîna te derman bikin û yarê, ew biha ye!"
  4. "Xewna şil" min ew e ku "derxistina daneyan" û "analîtîk" di nav modela SaaS de bifroşe. karsaziyên piçûk û navînyê ku bi navbeynkên xweşik ve hilkişiya nav 123 karûbarên cloudê: rêveberiya projeyê, desteya alîkariyê, hesabkirin, CRM, mûçe, raporkirina demê, kirrûbirra, ... hûn jê re dibêjin, û xwe di nav daneyan de veşartin. Youcalc and Successfactors (belkî êdî tune ne) Ev baş e!
  5. Li kesên ku hez dikin tinker bigerin "qirç" bi daneyan. Ew kêm û xerîb in (wek pelên çayê), lê ji karsaziyê re girîng in. Mînak helbestvanek dikare di pêwendiyê de pir baş be.
  6. Endezyar pêdivî ye! Pêdivî ye ku pirsgirêkên ku Crunchers ji daneyan derxistine veguherînin çareseriyê. Û serkeftin an têkçûna biryarê bi tevahî bi wan ve girêdayî ye.
  7. Pêşveçûn OpenSource projeyên nirxek mezin e û dihêle ku çareseriyên tevlihev bi pratîkî ji sifrê "civandin".
  8. Lê... divê em ji bîr nekin ku Hadoop pirtûkxaneyek e, û Lucene jî pirtûkxaneyek e, û dûrahiya di navbera pirtûkxane û berhema pîşesaziyê pir!
  9. Çareseriyên çêkirî dê bi girîngî bêne adaptekirin, ji ber modularity и integrability - xalên sereke.
  10. Hêzdar (Xwedê min efû bike) di danûstendina bi xerîdar û verastkirinê de teknîkek sereke ye hîpotezên, ku wê gelek hebin.
  11. Bi taybetî gengaz û pêdivî ye ku meriv hemî kodkirin û UI-yê derxe derve. Hemî analîtîk û taybetmendiyên karsaziyê paşvekêşana pêdivî ye ku derkeve hundur û wekî jêhatîbûnek bingehîn tê hesibandin.
  12. Divê biryarderên karsaziyê bi berdewamî "agahdar" bibin pêdivî ye ku meriv bi daneyan re rast bixebite û bi berdewamî li rêyên nû digerin ku wan analîz bikin. Kombûna jêhatîbûna teknîkî û karsaziyê ya karmendên me dê bibe alîkar ku statûya tevahiya rêxistinê bi tevahî bilind bike.
  13. Internet - çavkaniyek bêdawî ya îlhamê heye (wê demê ewqas pisîk tunebûn) di derbarê nêzîkatiyên ji bo rêveberiya daneya pargîdaniyê de, her çend armanc û çarçove pir cûda dibe.

Dabeşa Daneyê. sala 2013. Paşverû

Pêşniyarên teknolojîk ...

  1. Di nav de potansiyelek mezin a pêşveçûnê heye simplification daneyên çawa ji mirovan re têne nîşandan. Hûn dikarin vê peyva "iPhonization" bi nav bikin.
  2. Tevî vê rastiyê ku firoşkarên BI îdîa dikin ku ew rasterast in analîtîk ji bikarhênerên dawî re bînin, (û bê guman ew di vî alî de dimeşin) - serkeftin hîn çê nebûye. Mirov tenê baş fêm nakin piralî jimare.
  3. Navberek bikarhênerek ku tê de daneyên kêm-zêde tevlihev, bi şeklekî avakirî temsîl dike rûpêkirî form - di heman demê de hejmareke bêdawî pirsgirêkan jî pêşkêş dike. Encam: çi qas xweştir ew qas çêtir be.
  4. Platformek ku li ser bingeha derxistina daneya otomatîkî ya ji çavkaniyan hatî çêkirin (yên ku her gav ji bo derxistina wusa nayên sêwirandin) bi girîngî bi çavkaniyan, aramiya girêdanan û binesaziyê ve girêdayî ye. Platform (qasid) dê her gav ji ber negihandina encaman were tawanbar kirin. Trust - paytexta vî rengî platformên. Sermayeya ku bi zehmetî tê bidestxistin û windakirina wê hêsan e.
  5. Ji nêrînek karsaziyê, di navbera analîzkirina Daneyên Mezin û de cûdahî tune Tenê Daneyên. Bi gelemperî li pişt hejmarên hêsan ên wekî 2x2 bi mîlyonan dolar fersend hene. Nimûneyek baş daneyên li ser dawiya jiyana hêmanên binesaziyê yên li ser refika Norwêcî ye. Dema ku hemî tarîxên kelepên pêşerojê ne. tamîrkirina hemû alavan li ser yek eksê hatin danîn û wan fêhm kir ku di salên N de refika Armageddon tê - zilamekî pir dewlemend ji ser kursiya xwe rabû û bi lez û bez ji odê derket û got: "Bibore, ez nakim. gelek wext heye, divê ez fîloyê amade bikim…”
  6. Excel, û bi bingehîn pêşandanek tabloyek zelal û berbiçav a daneyan, xwedan hêzek pir mezin û pêşerojek mezin e. Ez ji maseyên xweşik bawer dikim (û hîn jî dikin) û ew e!
  7. Kevana sereke ya van hemî "analîtîkan" e otomatê de biryar. Derfetên herî mezin hene, di heman demê de xetereyên herî mezin jî hene, ji ber vê yekê derfet dewlemend in, ji ber vê yekê xetere hene, ji ber vê yekê derfet hene, ji ber vê yekê ew tof in…
  8. Ger "entegrasyon" taybetmendiyek sereke ye, wê hingê divê data de facto wekî karûbarek were pêşkêş kirin. REHETÎ qaîdeyên, lê divê em li ser optimization ji bîr ne birêvebirinî, ku naha pir caran ji bo entegrasyonê tê qurban kirin ji ber ku hêza hesabker her ku diçe mezin dibe.
  9. Daneyên master - ev e ya ku divê berî ku meriv pirsgirêkên karsaziyê çareser bike herêmîkirin, derxistin, standardîze kirin. Daneyên master piçûk in, lê pirsgirêkên wê mezin in! Wek birayên semantîk dibêjin, %50 pirsgirêkên cîhanê ji ber ku mirov heman tiştan bi navên cuda bi nav dikin û %50ê din jî ji ber ku ew bi heman navî dibêjin tiştên cuda ne.
  10. Ê encapsulation di asta hilanînê de, ew vebûna çareseriyê sînordar dike û ber bi SILO-fîkasyonê ve dibe. Baş e ku hûn firoşkarek mezin bin, wekî din ew wusa ye. (Li vir em dipeyivin, bê guman, ne li ser asta blokê û ne li ser AWS S3, ku wê hingê 6 salî bû, lê li ser pelan.).
  11. Modelkirina peywendîdar dane êdî ne hevalê me ye. RDF û key-nirx - xweş! Me veguherînên efsûnî yên databasên têkildar bi modelên 2000 tabloyan di 15 tabloyan de dît, û yek ji bikarhêneran tiştek winda nekir.
  12. Înternet ji ber ku heye dixebite URL wekî rêbazek yekgirtî ya navnîşan. Girîngiya URL an bêtir URI ji bo çavkaniyên agahdariya pargîdaniyê dijwar e ku meriv zêde binirxîne.
  13. Kêmkirina nivîsê û NLP populer in. Di Înternetê de. Lê tewra di sektora pargîdanî de, serkeftinek mezin dikare bi derxistina daneyên sazkirî ji daneyên pargîdanî yên nesazkirî were bidestxistin.
  14. Sînerjî di navbera daneya birêkûpêk û agahdariya ku ji daneyên nesazkirî têne derxistin, yanî. pelên - Klondike analîtîk.
  15. Dema ku daneyan derdixin, mafan ji bîr nekin û copyright.
  16. Divê pargîdaniya derxistina daneyan abeşa hackers, di wateya baş ya peyvê de. Ji şerê dijwar ê li dijî pergalên parastinê yên botê yên crawler ên Rûpelên Zer îlhama xwe girtiye.
  17. Berî ku hûn bi daneyan re bixebitin, pêdivî ye ku meriv "dîtin" bi tevayî. Zehmet e ku meriv rave bike. Formên tabloyê tên bîra mirov. Ji bo hinekan, nûnerên grafîkî, lê her grafî jixwe şîroveyek e. Bi vî awayî an din ... "bibînin"!
  18. Dubarekirina pirsgirêka "baweriya" bikarhêner li pêşiyê. Baweriya bi girêdan / pêvajoyên hilberîna daneyê, baweriya bi daneyan, bawerî bi biryarên hatine girtin.

Source: www.habr.com

Add a comment