Gagnadeild. ári 2013. Til baka

Í 2013 ári IBS, sem þá virtist vera að skapa Gagnadeild, bað mig um að gera slíkt hugarflug (eingöngu byggt á reynslu af samskiptum við fyrirtækja olíu- og gasviðskiptavini) varðandi vandamálasvæði Big Data og Data almennt. Svo rakst ég á það 7 árum seinna og fannst það fyndið. Sumt er augljóst. Sumt reyndist ekki alveg satt, en... 7 ár eru liðin.

Ég skrifaði á ensku og datt núna í hug að þýða það yfir á rússnesku. Hvað ef eitthvað er ennþá viðeigandi núna? (Ég mun þýða fréttirnar, en skildu skiltin eftir á ensku af leti. Grænt er gott, rautt er hættulegt, blátt er draumur).

Ég mun formfesta lágmarks athugasemdir frá „í dag“ ítalskaþannig að það sé skýrt og greinilegt.

Svo, GÖGN! Gögn fyrir okkur...

Gagnadeildin er blóðdeildin, því gögnum má til dæmis líkja við blóðið sem rennur um æðar og slagæðar fyrirtækja. Hins vegar, þó blóðið sé það sama, eru lífverurnar ólíkar og þess vegna framleiðsluvæðingu mjög erfitt, en það felur líka í sér tækifæri til þróunar.

Það er fólk sem gögnin hoppa beint í augun á þeim - þetta er það Við.
Og það er fólk sem, því miður, sér ekki gagnapunktinn auðan. Þetta, aftur, því miður, er okkar Viðskiptavinir!

Gagnadeild. ári 2013. Til baka

Svo, viðskiptareglur...

  1. Við seljum viðskiptiOg ekki ИТ (megi allir upplýsingatæknisérfræðingar fyrirgefa mér strax) vegna þess að við erum að leysa vandamál heimsins, og jæja, meiri peninga.
  2. Öll viðskiptavandamál eru einbeitt í lóðréttum þemaiðnaði og mun krefjast fullnægjandi sérhæfingar.
  3. Tilraunir til að sanna gildi "gagna" eða, jafnvel erfiðara, gildi „gagnastjórnunar“ fyrir fyrirtæki er eilíf þjáning og sársauka. Í grundvallaratriðum er þetta eins og að koma til manneskju sem líður vel og segja: „Guð, við ætlum að meðhöndla blóðið þitt núna, og kallinn, það er dýrt!
  4. „blautur draumur“ minn er að selja „gagnaútdrátt“ og „greiningu“ innan SaaS líkansins lítil og meðalstór fyrirtækisem klifraði inn í 123 skýjaþjónustur með flott viðmót: verkefnastjórnun, þjónustuver, bókhald, CRM, launaskrá, tímaskýrslur, markaðssetningu, ... þú nefnir það, og gróf sig inn í gögnin. Youcalc og árangursþættir (það eru líklega ekki til lengur) Þetta er gott!
  5. Leitaðu að fólki sem finnst gaman að fikta “marr” með gögnum. Þau eru sjaldgæf og undarleg (eins og telauf), en lykillinn að viðskiptum. Skáld getur til dæmis verið mjög gott í fylgni.
  6. Verkfræðingar þarf! Þarf að breyta vandamálum sem Crunchers dró úr gögnum í lausnir. Og árangur eða mistök ákvörðunarinnar veltur algjörlega á þeim.
  7. Þróun opensource verkefni eru mikils virði og gera það mögulegt að „samsetja“ flóknar lausnir nánast frá grunni.
  8. En... við megum ekki gleyma því að Hadoop er bókasafn, og Lucene er líka bókasafn, og fjarlægðin milli bókasafn og iðnaðarvara mikið!
  9. Byggðu lausnirnar verða að laga verulega, vegna þess mát и samþættanleika - Lykil atriði.
  10. lipur (Guð fyrirgefi mér) er lykiltækni í samskiptum við viðskiptavininn og sannprófun tilgátur, sem verða margir.
  11. Það er sérstaklega mögulegt og nauðsynlegt að útvista allri kóðun og notendaviðmóti. Öll viðskiptagreining og forskriftir bakenda þarf að fara innan og litið á sem kjarnahæfni.
  12. Viðskiptaákvarðanir verða að vera stöðugt „upplýstir“ um nauðsyn þess að vinna rétt með gögn og stöðugt að leita að nýjum leiðum til að greina þær. Sambland af tækni- og viðskiptahæfni starfsmanna okkar mun hjálpa til við að hækka stöðu heildarskipulagsins í heild.
  13. The Internet - það er endalaus uppspretta innblásturs (það voru ekki svo margir kettir þá) í tengslum við aðferðir við gagnastjórnun fyrirtækja, þó að markmið og umfang séu mjög mismunandi.

Gagnadeild. ári 2013. Til baka

Tæknilegar forsendur...

  1. Það eru miklir þróunarmöguleikar í einföldun hvernig gögn eru sýnd fólki. Þú getur kallað þetta orðið „iPhonization“.
  2. Þrátt fyrir þá staðreynd að BI söluaðilar halda því fram að þeir séu beint koma greiningu til notenda, (og þeir eru vissulega að fara í þessa átt) - byltingin hefur ekki enn átt sér stað. Fólk skilur bara ekki vel fjölvíddar gögn.
  3. Notendaviðmót sem táknar meira eða minna flókin, lauslega skipulögð gögn í flötur form - býður einnig upp á endalausan fjölda vandamála. Niðurstaða: því flatari því betra.
  4. Vettvangur sem byggður er á grundvelli sjálfvirkrar gagnaútdráttar frá heimildum (sem eru ekki alltaf hannaðir fyrir slíkan útdrátt) er verulega háður uppsprettunum, stöðugleika tengjanna og innviði. Pallurinn (boðberi) verður alltaf kennt um að hafa ekki skilað árangri. Traust – fjármagn af þessu tagi palla. Fjármagn sem erfitt er að vinna sér inn og auðvelt að tapa.
  5. Frá viðskiptasjónarmiði er enginn munur á Big Data greiningu og Bara Gögn. Oft á bak við eins einfaldar tölur og 2x2 liggja tækifæri fyrir milljónir dollara. Gott dæmi eru gögn um lok líftíma innviðaþátta á norska landgrunninu. Hvenær eru allar dagsetningar framtíðarhetta. viðgerðir á öllum búnaði voru settar á einn ás og þeir komust að því að eftir N ár var hillan Armageddon að koma - einn mjög auðugur maður stóð upp úr stólnum sínum og hneigði sig í skyndi út úr herberginu með þessum orðum: „Því miður, ég geri það ekki. hef mikinn tíma, ég þarf að undirbúa flotann...“
  6. Excel, og í meginatriðum skýr og hnitmiðuð framsetning gagna í töflum, hefur gríðarlegan kraft og mikla framtíð. Ég trúi á falleg borð (og geri enn) og þannig er það!
  7. Aðalbogi allrar þessarar „greiningar“ er sjálfvirkni ákvarðana. Það eru mestu tækifærin, en líka mesta áhættan, þess vegna eru tækifærin rík, þess vegna eru áhætturnar, þess vegna eru tækifærin, þess vegna eru þau karamín... 🙂 Borunarstjórnun, til dæmis...
  8. Ef „samþættleiki“ er lykileiginleiki, þá ættu gögnin í raun að vera sett fram sem þjónusta. REST reglum, en ekki má gleyma hagræðingu frammistaða, sem nú er oft fórnað fyrir samþættanleika þar sem tölvumáttur heldur áfram að vaxa.
  9. Aðalgögn - þetta er það sem þarf að staðfæra, draga út, staðla áður en tekið er á viðskiptavandamálum. Aðalgögn eru lítil, en vandamál með þau eru mikil! Eins og bræður merkingarfræðinnar segja þá eru 50% allra vandamála heimsins vegna þess að fólk kallar sömu hluti mismunandi nöfnum og hin 50% eru vegna þess að þeir kalla mismunandi hluti sama nafni.
  10. Allir hjúpun á geymslustigi takmarkar það opnun lausnarinnar og leiðir til SILO-fication. Það er gott ef þú ert stór söluaðili, annars er það svo sem svo. (Hér erum við auðvitað ekki að tala um blokkastigið og ekki um AWS S3, sem var þá þegar 6 ára, heldur um skrár).
  11. Venslamótun gögn eru ekki lengur vinur okkar. RDF og lykilgildi – flott! Við höfum séð töfrandi umbreytingar á venslagagnagrunnum með líkönum af 2000 töflum í 15 töflur og enginn notenda tapaði neinu.
  12. Netið virkar vegna þess að það er til URL sem sameinaða aðferð til að takast á við. Mikilvægi URL eða réttara sagt URI Fyrir fyrirtæki upplýsingaauðlindir er erfitt að ofmeta.
  13. Textanám og NLP eru vinsælar. Á Netinu. En jafnvel í fyrirtækjageiranum er hægt að ná miklum árangri með því að vinna skipulögð gögn úr óskipulögðum fyrirtækjagögnum.
  14. Samlegðaráhrif milli skipulögðra gagna og upplýsinga sem unnar eru úr óskipulögðum gögnum, þ.e. skrár – greiningar Klondike.
  15. Við útdrátt gagna, ekki gleyma um réttindi og höfundarrétt.
  16. Gagnavinnslufyrirtækið skal mynda atölvuþrjótadeild, í góðri merkingu þess orðs. Innblásin af baráttunni gegn gulum síðum skriðbotnavarnarkerfum.
  17. Áður en unnið er með gögn er nauðsynlegt að "sjá" í heild sinni. Það er erfitt að útskýra. Töfluform koma upp í hugann. Fyrir suma, myndræn framsetning, en hvaða línurit sem er er nú þegar túlkun. Með einum eða öðrum hætti... „sjáið“!
  18. Endurtekið vandamálið um „traust“ notenda í framendanum. Traust á tengjum/gagnaframleiðsluferlum, traust á gögnum, traust á teknar ákvarðanir.

Heimild: www.habr.com

Bæta við athugasemd