Data Division. rok 2013. Retrospektíva

V 2013 roku IBS, ktorý potom akoby vytváral Data Division, ma požiadal, aby som urobil takýto braindump (výhradne na základe skúseností s interakciou s korporátnymi zákazníkmi ropy a zemného plynu) týkajúci sa problémovej oblasti Big Data a dát vo všeobecnosti. Tak som na to narazil o 7 rokov neskôr a prišlo mi to vtipné. Niektoré veci sú zrejmé. Ukázalo sa, že niektoré nie sú úplne pravdivé, ale... prešlo 7 rokov.

Písal som po anglicky a teraz ma napadlo preložiť to do ruštiny. Čo ak je teraz niečo stále aktuálne? (Bullíny preložím, ale nápisy v angličtine z lenivosti nechám. Zelená je dobrá, červená je nebezpečná, modrá je sen).

Formalizujem minimálne komentáre z „dnes“ talianskyaby to bolo jasné a rozlíšiteľné.

Takže, DÁTA! Údaje pre nás...

Data Division je Blood Division, pretože dáta možno prirovnať napríklad ku krvi, ktorá preteká žilami a tepnami obchodného orgánu. Avšak, hoci krv je rovnaká, organizmy sú odlišné a preto výroby veľmi ťažké, ale zároveň predstavuje príležitosť na rozvoj.

Sú ľudia, ktorým dáta skáču priamo do očí – to sú My.
A sú ľudia, ktorí, žiaľ, nevidia dátový bod prázdny. Toto je opäť, bohužiaľ, naše zákazníkov!

Data Division. rok 2013. Retrospektíva

Takže, obchodné princípy...

  1. Predávame podnikaniaA nie IT (nech mi to všetci IT špecialisti odpustia naraz), pretože riešime svetové problémy a, no, viac peňazí.
  2. Všetky obchodné problémy sú sústredené okolo tematických priemyselných vertikál a budú si vyžadovať adekvátne špecializácie.
  3. Pokusy dokázať hodnota "údajov" alebo, čo je ešte ťažšie, hodnota „správy údajov“ pre podnik je večné utrpenie a bolesť. V podstate je to ako prísť za človekom, ktorý sa cíti celkom dobre, a povedať: „Kámo, teraz ti ošetríme krv a, kámo, je to drahé!
  4. Mojím „mokrým snom“ je predávať „extrakciu údajov“ a „analytiku“ v rámci modelu SaaS malé a stredné podnikyktorí sa vyšplhali do 123 cloudových služieb so skvelými rozhraniami: projektový manažment, helpdesk, účtovníctvo, CRM, mzdy, vykazovanie času, marketing, ... a pohrabali sa v dátach. Youcalc a Successfactors (už asi žiadne nie sú) Toto je dobré!
  5. Hľadajte ľudí, ktorí radi fičia “chrumkať” s údajmi. Sú zriedkavé a zvláštne (ako čajové lístky), ale kľúčové pre podnikanie. Napríklad básnik vie byť veľmi dobrý v korelácii.
  6. technici potrebné! Potrebné na premenu problémov, ktoré Crunchers vytiahli z údajov, na riešenia. A úspech alebo neúspech rozhodnutia závisí výlučne od nich.
  7. Vývoj opensource projekty má veľkú hodnotu a umožňuje „poskladať“ komplexné riešenia prakticky od začiatku.
  8. Ale... nesmieme zabúdať, že Hadoop je knižnica a Lucene je tiež knižnica a vzdialenosť medzi nimi knižnica a priemyselný produkt veľa!
  9. Vybudované riešenia sa budú musieť výrazne prispôsobiť, pretože modulárnosť и integrovateľnosť - Kľúčové body.
  10. Agilný (Boh mi odpusť) je kľúčovou technikou v interakcii so zákazníkom a pri overovaní hypotéz, ktorých bude veľa.
  11. Je obzvlášť možné a potrebné outsourcovať všetko kódovanie a UI. Všetky obchodné analýzy a špecifikácie backend treba odísť vnútri a považuje sa za základnú kompetenciu.
  12. Osoby s rozhodovacou právomocou musia byť neustále „informované“. potreba správne pracovať s dátami a neustále hľadať nové spôsoby ich analýzy. Spojenie technických a obchodných kompetencií našich zamestnancov pomôže pozdvihnúť status celej organizácie ako celku.
  13. Internet - existuje nekonečný zdroj inšpirácie (vtedy ešte toľko mačiek nebolo) vo vzťahu k prístupom k správe podnikových údajov, hoci ciele a rozsah sa výrazne líšia.

Data Division. rok 2013. Retrospektíva

Technologické postuláty...

  1. Je tam obrovský rozvojový potenciál zjednodušenie ako sa údaje zobrazujú ľuďom. Môžete to nazvať slovom „iPhonizácia“.
  2. Napriek tomu, že predajcovia BI tvrdia, že sú priamo priniesť analytiku koncovým používateľom, (a určite sa uberajú týmto smerom) - prelom zatiaľ nenastal. Ľudia tomu jednoducho dobre nerozumejú viacrozmerný dát.
  3. Používateľské rozhranie predstavujúce viac či menej zložité, voľne štruktúrované údaje fazetovaný forma - tiež predstavuje nekonečné množstvo problémov. Záver: čím plochejšie, tým lepšie.
  4. Platforma postavená na báze automatickej extrakcie dát zo zdrojov (ktoré nie sú vždy na takúto extrakciu navrhnuté) je výrazne závislá od zdrojov, stability konektorov a infraštruktúry. Platforma (messenger) bude vždy obviňovaná z neposkytnutia výsledkov. dôvera – kapitál tohto druhu platforiem. Kapitál, ktorý sa ťažko zarába a ľahko stráca.
  5. Z obchodného hľadiska nie je rozdiel medzi analýzou veľkých dát a Len Data. Za číslami 2x2 sa často skrývajú príležitosti v hodnote miliónov dolárov. Dobrým príkladom sú údaje o konci životnosti prvkov infraštruktúry na nórskom šelfe. Kedy sú všetky dátumy budúcich čiapok? opravy všetkého zariadenia sa dali na jednu os a zistili, že o N rokov prichádza regálový Armagedon - jeden veľmi majetný muž vstal zo stoličky a rýchlo sa vyklonil z miestnosti so slovami: „Prepáčte, nemám mám veľa času, potrebujem pripraviť flotilu...“
  6. Excel a v podstate jasná a stručná tabuľková prezentácia údajov má obrovskú silu a veľkú budúcnosť. Verím v krásne stoly (a stále robiť) a je to!
  7. Hlavným oblúkom celej tejto „analytiky“ je automatizácia rozhodovania. Sú najväčšie príležitosti, ale aj najvyššie riziká, preto sú príležitosti bohaté, preto sú riziká, preto sú príležitosti, preto sú karamelové... 🙂 Napríklad manažment vrtov...
  8. Ak je „integrovateľnosť“ kľúčovou vlastnosťou, potom by sa údaje mali de facto prezentovať ako služba. REST pravidlá, no nesmieme zabúdať ani na optimalizáciu výkon, ktorý je teraz často obetovaný kvôli integrovateľnosti, keďže výpočtový výkon neustále rastie.
  9. Hlavné dáta – to je to, čo je potrebné lokalizovať, extrahovať, štandardizovať pred riešením akýchkoľvek obchodných problémov. Kmeňové dáta sú malé, ale problémy s nimi sú veľké! Ako hovoria bratia sémantici, 50 % všetkých problémov sveta je spôsobených tým, že ľudia nazývajú rovnaké veci rôznymi menami, a zvyšných 50 % je spôsobených tým, že nazývajú rôzne veci rovnakým menom.
  10. akýkoľvek zapuzdrenie na úrovni skladovania obmedzuje otvorenosť riešenia a vedie k SILO-fikácii. Je dobré, ak ste veľký predajca, inak je to tak. (Hovoríme tu, samozrejme, nie o úrovni bloku a nie o AWS S3, ktorý mal vtedy už 6 rokov, ale o súboroch).
  11. Relačné modelovanie údaje už nie sú naším priateľom. RDF a kľúč-hodnota – skvelé! Videli sme magické premeny relačných databáz s modelmi 2000 tabuliek na 15 tabuliek a nikto z používateľov o nič neprišiel.
  12. Internet funguje, pretože existuje URL ako jednotný spôsob oslovovania. Dôležitosť URL alebo skôr URI pre podnikové informačné zdroje je ťažké preceňovať.
  13. Populárna je ťažba textu a NLP. Na internete. Ale aj vo firemnom sektore možno dosiahnuť veľký úspech extrahovaním štruktúrovaných dát z neštruktúrovaných firemných dát.
  14. Spolupráca medzi štruktúrovanými dátami a informáciami extrahovanými z neštruktúrovaných dát, t.j. súbory – analytický Klondike.
  15. Pri extrakcii údajov nezabudnite na práva a autorské práva.
  16. Spoločnosť na extrakciu údajov musí vytvoriť aoddelenie hackerov, v dobrom zmysle slova. Inšpirované náročným bojom proti systémom ochrany prehľadávacích robotov Zlatých stránok.
  17. Pred prácou s dátami je potrebné "vidieť" V celom rozsahu. Ťažko sa to vysvetľuje. Na rad prichádzajú tabuľkové formy. Pre niekoho grafické znázornenia, ale akýkoľvek graf je už interpretáciou. Tak či onak... „pozri“!
  18. Opakovanie problému používateľskej „dôvery“ vo frontende. Dôvera v konektory/procesy generovania údajov, dôvera v údaje, dôveru v prijaté rozhodnutia.

Zdroj: hab.com

Pridať komentár