Datuen Dibisioa. 2013 urtea. Atzera begirakoa

Urteko 2013 Analitza, orduan sortzen ari zela zirudien Datuen Dibisioa, halako braindump bat egiteko eskatu zidan (esklusiboki petrolio- eta gas-bezero korporatiboekiko elkarrekintzan oinarritutako esperientzian oinarrituta) Big Dataren arazo-eremuari eta, oro har, Datuei buruz. Beraz, 7 urte geroago topatu nuen eta dibertigarria iruditu zitzaidan. Gauza batzuk agerikoak dira. Batzuk guztiz egia ez zirela, baina... 7 urte pasa dira.

Ingelesez idatzi nuen eta orain errusierara itzultzea pentsatu nuen. Zer gertatuko da orain zerbait oraindik garrantzitsua bada? (Buletinak itzuliko ditut, baina utzi errotuluak ingelesez alferkeriagatik. Berdea ona da, gorria arriskutsua, urdina ametsa).

"Gaur" iruzkin minimoak formalizatuko ditut italiarraargia eta bereizgarria izan dadin.

Beraz, DATUAK! Datuak guretzat...

Datuen Dibisioa Odol Dibisioa da, datuak, adibidez, enpresa-organo baten zainetan eta arterietan zehar doan odolarekin aldera daitezkeelako. Hala ere, odola berdina den arren, organismoak desberdinak dira eta beraz ekoizpena oso zaila, baina garapenerako aukera ere adierazten du.

Datuak begietara zuzenean jauzi egiten dizkien jendea dago - hauek dira Dugu.
Eta bada, zoritxarrez, datuak hutsik ikusten ez dituenak. Hau, berriz, ai, gurea da Bezeroak!

Datuen Dibisioa. 2013 urtea. Atzera begirakoa

Horrela, negozio printzipioak...

  1. Saltzen dugu negozioaEta ez IT (informatikako espezialista guztiek aldi berean barkatzen didate) munduko arazoak konpontzen ari garelako, eta, tira, diru gehiago.
  2. Negozio-arazo guztiak industriaren bertikal tematikoen inguruan kontzentratzen dira eta egokiak beharko dituzte espezialitateak.
  3. Frogatzeko saiakerak "datuen" balioa edo, are zailagoa, negozio bati β€œdatuen kudeaketa”-ren balioa betiko sufrimendua eta mina da. Funtsean, ondo sentitzen den pertsona batengana etortzea eta esatea bezala da: "Txo, orain zure odola tratatuko dugu, eta, lagun, garestia da!"
  4. Nire "amets hezea" SaaS ereduaren barruan "datuen erauzketa" eta "analisiak" saltzea da enpresa txiki eta ertainakInterfaze politekin 123 hodeiko zerbitzuetara igo zena: proiektuen kudeaketa, laguntza-zerbitzua, kontabilitatea, CRM, nominak, denboraren berri ematea, marketina, ... esan, eta datuetan lurperatu zuten. Youcalc eta Successfactors (seguruenik ez daude gehiago) Hau ona da!
  5. Bilatu txosnak egitea gustatzen zaion jendea "kriskatu" datuekin. Arraroak eta arraroak dira (te hostoak bezala), baina negoziorako gakoak. Poeta bat, adibidez, oso ona izan daiteke korrelazioan.
  6. ingeniariak behar! Crunchers-ek datuetatik ateratako arazoak konponbide bihurtu behar dira. Eta erabakiaren arrakasta edo porrota haien mende dago erabat.
  7. garapena opensource proiektuak balio handia du eta irtenbide konplexuak ia hutsetik β€œmuntatzea” ahalbidetzen du.
  8. Baina... ez dugu ahaztu behar Hadoop liburutegi bat dela, eta Lucene liburutegi bat ere badela, eta arteko distantzia. liburutegia eta industria produktua asko!
  9. Eraikitako irtenbideak nabarmen egokitu beharko dira, zeren modulartasuna ΠΈ integragarritasuna - funtsezko puntuak.
  10. Arina (Jainkoak barka nazazu) funtsezko teknika bat da bezeroarekin elkarrekintzan eta egiaztapenean hipotesiak, asko izango dira.
  11. Batez ere posible eta beharrezkoa da kodeketa eta UI guztiak azpikontratatzea. Negozioaren analisi eta zehaztapen guztiak backend alde egin behar barruan eta oinarrizko gaitasuntzat hartzen da.
  12. Enpresa erabakiak hartzen dituztenek etengabe "informatuta" egon behar dute datuak behar bezala lan egiteko beharra eta horiek aztertzeko modu berriak bilatzen etengabe. Gure langileen gaitasun teknikoen eta enpresarialen konbinazioak erakunde osoaren egoera igotzen lagunduko du.
  13. Internetek – inspirazio iturri amaigabea dago (orduan ez zegoen horrenbeste katu) enpresen datuen kudeaketarako planteamenduei dagokienez, nahiz eta helburuak eta irismena nabarmen aldatzen diren.

Datuen Dibisioa. 2013 urtea. Atzera begirakoa

Postulatu teknologikoak...

  1. Garapen ahalmen handia dago bertan sinplifikazioa jendeari datuak nola erakusten zaizkion. Honi "iPhonization" hitza dei diezaiokezu.
  2. BI saltzaileek zuzenean daudela esan arren analisiak ekarri amaierako erabiltzaileei, (eta zalantzarik gabe norabide horretan ari dira) - aurrerapausoa ez da oraindik gertatu. Jendeak ez du ondo ulertzen dimentsio anitzekoa datuak.
  3. Erabiltzaile-interfazea datu konplexuagoak edo baxuagoak irudikatzen dituena fazetatuak forma - arazo kopuru amaigabea ere aurkezten du. Ondorioa: zenbat eta lauagoa hobe.
  4. Iturburuetatik datuen erauzketa automatikoan oinarrituta eraikitako plataforma (beti erauzketa horretarako diseinatuta ez daudenak) iturrien, konektoreen egonkortasunaren eta azpiegituren menpe dago nabarmen. Plataformari (mezularia) beti leporatuko zaio emaitzak ez emateagatik. Konfiantza – mota honetako plataformen kapitala. Irabazten zaila eta galtzen erraza den kapitala.
  5. Negozioaren ikuspuntutik, ez dago alderik Big Data analisiaren eta Datuak besterik ez. Askotan 2x2 bezain zenbaki sinpleen atzean milioika dolar aukerak daude. Adibide on bat Norvegiako apaleko azpiegituren elementuen bizitzaren amaierari buruzko datuak dira. Noiz dira etorkizuneko txapelen data guztiak. ekipamendu guztien konponketak ardatz bakarrean jarri zituzten eta N urtetan Armageddon apalategia zetorrela jakin zuten - gizon oso aberats bat aulkitik altxatu zen eta berehala makurtu zen gelatik: "Barkatu, ez dut. denbora asko daukat, flota prestatu behar dut...”
  6. Excel-ek, eta, funtsean, datuen taula-aurkezpen argi eta zehatz batek, indar handia eta etorkizun handia du. Mahai ederretan sinesten dut (eta oraindik egin) eta kitto!
  7. "Analitika" honen guztiaren branka nagusia da erabakien automatizazioa. Aukera handienak daude, baina baita arrisku handienak ere, horregatik aukerak aberatsak dira, horregatik daude arriskuak, horregatik daude aukerak, horregatik dira toffee... πŸ™‚ Putzuen zulaketen kudeaketa, adibidez...
  8. "Integragarritasuna" funtsezko ezaugarria bada, datuak de facto zerbitzu gisa aurkeztu beharko lirateke. REST arauak, baina ez dugu ahaztu behar optimizazioaz produktibitatea, gaur egun integragarritasunagatik sakrifikatzen dena, konputazio-potentzia hazten jarraitzen duen heinean.
  9. Datu nagusiak - hau da lokalizatu, atera, estandarizatu behar dena negozio-arazoei aurre egiteko. Datu nagusiak txikiak dira, baina arazoak handiak dira! Semantikaren anaiek dioten bezala, munduko arazo guztien %50 jendeak gauza berdinei izen ezberdinez deitzen dielako gertatzen dira, eta beste %50ak gauza ezberdinei izen berdinez deitzen dietelako.
  10. edozein kapsulatzea biltegiratze mailan, soluzioaren irekitasuna mugatzen du eta SILO-fikatzea dakar. Ona da saltzaile handia bazara, bestela horrela da. (Hemen hitz egiten ari gara, noski, ez bloke mailari buruz eta ez orduan jada 3 urte zituen AWS S6ri buruz, fitxategiei buruz baizik.).
  11. Erlazio eredua datuak jada ez dira gure lagunak. RDF eta gako-balioa - polita! Erlazio datu-baseen eraldaketa magikoak ikusi ditugu 2000 taulako ereduekin 15 tauletan, eta erabiltzaileetako inork ez zuen ezer galdu.
  12. Internetek existitzen delako funtzionatzen du URL helbideratzeko metodo bateratu gisa. URLaren garrantzia edo hobeto esanda URI enpresen informazio baliabideak zaila da gainestimatzea.
  13. Testu-meatzaritza eta NLP ezagunak dira. Interneten. Baina sektore korporatiboan ere, arrakasta handia lor daiteke egituratu gabeko datu korporatiboetatik datu egituratuak ateraz.
  14. Sinergia datu egituratuen eta egituratu gabeko datuetatik ateratako informazioaren artean, hau da. fitxategiak – Klondike analitikoa.
  15. Datuak ateratzerakoan, ez ahaztu eskubideez eta egile-eskubideak.
  16. Datuak erauzteko enpresak a eratu behar duhacker saila, hitzaren zentzu onean. Yellow Pages arakatzaileen bot babes sistemen aurkako maldan gorako borrokan inspiratuta.
  17. Datuekin lan egin aurretik, beharrezkoa da "ikusi" bere osotasunean. Zaila da azaltzea. Forma tabulatuak etortzen zaizkigu burura. Batzuentzat, irudikapen grafikoak, baina edozein grafiko interpretazio bat da jada. Era batera edo bestera... β€œikusi”!
  18. Erabiltzailearen "konfiantza"-ren arazoa errepikatzea frontend-ean. Konektore/datuak sortzeko prozesuetan konfiantza, datuetan konfiantza, hartutako erabakietan konfiantza.

Iturria: www.habr.com

Gehitu iruzkin berria