Datové oddělení. rok 2013. Retrospektivní

V roce 2013 IBS, který pak jako by tvořil Datové oddělení, mě požádal, abych udělal takový braindump (výhradně založený na zkušenostech s interakcí s firemními zákazníky ropy a zemního plynu) ohledně problémové oblasti Big Data a dat obecně. Tak jsem na to narazil o 7 let později a přišlo mi to vtipné. Některé věci jsou zřejmé. Některé se ukázaly jako ne úplně pravdivé, ale... uplynulo 7 let.

Psal jsem anglicky a teď mě napadlo to přeložit do ruštiny. Co když je teď něco stále aktuální? (Bulletiny přeložím, ale nápisy v angličtině z lenosti nechám. Zelená je dobrá, červená je nebezpečná, modrá je sen).

Formalizujem minimální komentáře z „dnes“ italštinatak, aby to bylo jasné a rozlišitelné.

Takže DATA! Data pro nás...

Datová divize je krevní divize, protože data lze přirovnat například ke krvi protékající žilami a tepnami obchodního těla. Avšak i když je krev stejná, organismy jsou odlišné a proto produkce velmi obtížné, ale zároveň představuje příležitost k rozvoji.

Jsou lidé, kterým data naskakují přímo do očí – to jsou My.
A jsou lidé, kteří bohužel nevidí datový bod prázdný. Tohle je, bohužel, zase naše Zákazníci!

Datové oddělení. rok 2013. Retrospektivní

To znamená, obchodní principy...

  1. Prodáváme podnikáníA ne IT (ať mi všichni IT specialisté prominou najednou), protože řešíme problémy světa a, no, víc peněz.
  2. Všechny obchodní problémy jsou soustředěny kolem tematických průmyslových vertikál a budou vyžadovat adekvátní řešení specializace.
  3. Pokusy dokázat hodnota "data" nebo, což je ještě obtížnější, hodnota „správy dat“ pro podnik je věčné utrpení a bolest. V podstatě je to jako přijít za člověkem, který se cítí dobře, a říct: „Ty vole, my ti teď ošetříme krev a, kámo, je to drahé!
  4. Mým „mokrým snem“ je prodávat „extrakce dat“ a „analytiku“ v rámci modelu SaaS malé a střední podnikykteří se vyšplhali do 123 cloudových služeb se skvělými rozhraními: projektový management, helpdesk, účetnictví, CRM, mzdy, výkazy času, marketing, ... a zahrabali se v datech. Youcalc a Successfactors (asi už žádné nejsou) To je dobré!
  5. Hledejte lidi, kteří rádi dělají "křupat" s daty. Jsou vzácné a zvláštní (jako čajové lístky), ale klíčové pro podnikání. Například básník může být velmi dobrý v korelaci.
  6. Inženýři potřeboval! Potřebné k přeměně problémů, které Crunchers vytáhli z dat, na řešení. A úspěch či neúspěch rozhodnutí závisí zcela na nich.
  7. Vývoj opensource projekty má velkou hodnotu a umožňuje „sestavit“ komplexní řešení prakticky od nuly.
  8. Ale... nesmíme zapomenout, že Hadoop je knihovna a Lucene je také knihovna a vzdálenost mezi nimi knihovna a průmyslový produkt hodně!
  9. Vybudovaná řešení se bude muset výrazně přizpůsobit, protože modularita и integrovatelnost - Klíčové body.
  10. Agilní (Bože, odpusť mi) je klíčová technika v interakci se zákazníkem a ověřování hypotézy, kterých bude mnoho.
  11. Zejména je možné a nutné outsourcovat veškeré kódování a UI. Veškeré obchodní analýzy a specifikace backend potřeba odejít uvnitř a považována za základní kompetence.
  12. Osoby s rozhodovací pravomocí musí být neustále „informovány“. potřeba správně pracovat s daty a neustále hledat nové způsoby, jak je analyzovat. Kombinace technických a obchodních kompetencí našich zaměstnanců pomůže pozvednout status celé organizace jako celku.
  13. Internet – existuje nekonečný zdroj inspirace (tehdy ještě tolik koček nebylo) ve vztahu k přístupům ke správě podnikových dat, ačkoli cíle a rozsah se výrazně liší.

Datové oddělení. rok 2013. Retrospektivní

Technologické předpoklady...

  1. Je tam obrovský rozvojový potenciál zjednodušení jak se data zobrazují lidem. Můžete tomu říkat slovo „iPhonizace“.
  2. Nehledě na to, že prodejci BI tvrdí, že jsou přímo přinášet analytiku koncovým uživatelům, (a určitě se ubírají tímto směrem) - průlom zatím nenastal. Lidé to prostě dobře nechápou multidimenzionální data.
  3. Uživatelské rozhraní představující více či méně složitá, volně strukturovaná data fasetovaný forma - také představuje nekonečné množství problémů. Závěr: čím plošší, tím lepší.
  4. Platforma postavená na bázi automatické extrakce dat ze zdrojů (které nejsou vždy pro takovou extrakci navrženy) je výrazně závislá na zdrojích, stabilitě konektorů a infrastruktuře. Platforma (messenger) bude vždy obviňována z neposkytnutí výsledků. Důvěra – kapitál tohoto druhu platforem. Kapitál, který je těžké vydělat a snadno ztratit.
  5. Z obchodního hlediska není žádný rozdíl mezi analýzou velkých dat a Jen Data. Za tak jednoduchými čísly jako 2x2 se často skrývají příležitosti v hodnotě milionů dolarů. Dobrým příkladem jsou údaje o konci životnosti prvků infrastruktury na norském šelfu. Kdy jsou všechna data budoucích čepic. opravy veškerého vybavení dali na jednu osu a zjistili, že za N let přichází regál Armagedon - jeden velmi bohatý muž vstal ze židle a spěšně se vyklonil z místnosti se slovy: „Promiňte, nemám mám hodně času, musím připravit flotilu...“
  6. Excel a v podstatě jasná a stručná tabulková prezentace dat má obrovskou sílu a velkou budoucnost. Věřím v krásné stoly (a stále) a to je vše!
  7. Hlavní luk celé této „analytiky“ je automatizace rozhodování. Jsou největší příležitosti, ale také nejvyšší rizika, proto jsou příležitosti bohaté, proto jsou rizika, proto jsou příležitosti, proto jsou karamelové... 🙂 No drilling management, například...
  8. Pokud je „integrovatelnost“ klíčovým prvkem, pak by data měla být de facto prezentována jako služba. REST pravidel, ale nesmíme zapomenout na optimalizaci výkon, který je nyní často obětován pro integrovatelnost, protože výpočetní výkon neustále roste.
  9. Hlavní data - to je to, co musí být lokalizováno, extrahováno, standardizováno před řešením jakýchkoli obchodních problémů. Kmenová data jsou malá, ale problémy s nimi jsou velké! Jak říkají bratři sémantici, 50 % všech světových problémů je způsobeno tím, že lidé nazývají stejné věci různými jmény, a zbývajících 50 % proto, že nazývají různé věci stejným jménem.
  10. Jakýkoli zapouzdření na úrovni úložiště omezuje otevřenost řešení a vede k SILO-fikaci. Je dobré, když jste velký prodejce, jinak je to tak. (Zde se samozřejmě nebavíme o úrovni bloku a ne o AWS S3, které bylo tehdy již 6 let, ale o souborech).
  11. Relační modelování data již nejsou naším přítelem. RDF a klíč-hodnota – skvělé! Viděli jsme kouzelné transformace relačních databází s modely 2000 tabulek do 15 tabulek a nikdo z uživatelů o nic nepřišel.
  12. Internet funguje, protože existuje URL jako jednotný způsob oslovování. Důležitost URL nebo spíše URI pro podnikové informační zdroje je obtížné přeceňovat.
  13. Populární je text mining a NLP. Na internetu. Ale i ve firemním sektoru lze dosáhnout velkého úspěchu extrakcí strukturovaných dat z nestrukturovaných firemních dat.
  14. Synergy mezi strukturovanými daty a informacemi extrahovanými z nestrukturovaných dat, tzn. soubory – analytický Klondike.
  15. Při vytěžování dat nezapomeňte na práva a autorská práva.
  16. Společnost pro extrakci dat musí vytvořit aoddělení hackerů, v dobrém slova smyslu. Inspirováno náročnou bitvou proti systémům ochrany prohledávacích robotů Zlatých stránek.
  17. Před prací s daty je nutné "vidět" v celém rozsahu. Je těžké to vysvětlit. Napadají mě tabulkové formy. Pro někoho grafická znázornění, ale jakýkoli graf je již interpretací. Tak či onak... „vidět“!
  18. Opakování problému uživatelské „důvěry“ ve frontendu. Důvěra v konektory/procesy generování dat, důvěra v data, důvěru v přijatá rozhodnutí.

Zdroj: www.habr.com

Přidat komentář