Divisione di dati. annu 2013. Retrospectiva

In 2013 anno Sorella Luna, chì tandu paria di creà Divisione di dati, m'hà dumandatu di fà un tali braindump (esclusivamente basatu annantu à l'esperienza di l'interazzione cù i clienti di u petroliu è di u gasu corporativu) in quantu à l'area di prublema di Big Data, è di Dati in generale. Allora l'aghju scontru 7 anni dopu è pensu chì era divertente. Alcune cose sò evidenti. Qualchidunu s'hè vultatu micca sanu veru, ma... 7 anni sò passati.

Aghju scrittu in inglese è avà aghju pensatu à traduce in russo. E se qualcosa hè sempre pertinente avà? (Traduceraghju i bollettini, ma lasciate i segni in inglese per pigrizia. U verde hè bonu, u rossu hè periculosu, u blu hè un sognu).

Furmalizà i cumenti minimi da "oghje" Talianucusì ch'ellu hè chjaru è distinguishable.

Allora, DATA! Avemu dati ...

A Divisione di Dati hè a Divisione di Sangue, perchè e dati ponu esse paragunati, per esempiu, à u sangue chì passa per i vini è l'arterie di un corpu cummerciale. In ogni casu, ancu s'è u sangue hè u listessu, l'organisimi sò diffirenti è per quessa pruduzzione assai difficiuli, ma rapprisenta dinù una opportunità di sviluppu.

Ci sò persone per quale i dati salta ghjustu in i so ochji - questi sò Мы.
E ci sò persone chì, sfurtunatamenti, ùn vedenu micca u puntu di dati in biancu. Questu, di novu, ahimè, hè u nostru Clienti!

Divisione di dati. annu 2013. Retrospectiva

Cusì, principii di cummerciale ...

  1. Vendimu affariè micca IT (Possi tutti i specialisti in IT mi pardunanu à una volta) perchè risolvemu i prublemi di u mondu, è, bè, più soldi.
  2. Tutti i prublemi di l'affari sò cuncentrati intornu à e verticali tematiche di l'industria è necessitanu adeguate spicializazioni.
  3. Tentativi di pruvà valore di "data" o, ancu più difficiuli, u valore di a "gestione di dati" per un affari hè eternu soffrenu è dolore. In fondu, hè cum'è vene à una persona chì si sente bè è dicendu: "Amicu, avemu da trattà u vostru sangue avà, è, omu, hè caru!"
  4. U mo "sognu umitu" hè di vende "estrazione di dati" è "analitiche" in u mudellu SaaS picculi è medie impresechì hà cullatu in 123 servizii di nuvola cù interfacce cool: gestione di prughjettu, helpdesk, contabilità, CRM, paga, rapportu di tempu, marketing, ... u nome, è si sò intarrati in i dati. Youcalc è Successfactors (probabilmente ùn ci sò più) Questu hè bonu!
  5. Cercate e persone chì piacenu à tinker "crunch" cù dati. Sò rari è strani (cum'è foglie di tè), ma chjave per l'affari. Un pueta, per esempiu, pò esse assai bonu in correlazione.
  6. Ingegneri bisognu! Needed to turn problems that Crunchers pulled from data in suluzioni. È u successu o fallimentu di a decisione dipende interamente da elli.
  7. Sviluppu opensource prughjetti hè di grande valore è permette di "assemble" suluzioni cumplessi praticamenti da zero.
  8. Ma... ùn devi micca scurdà chì Hadoop hè una biblioteca, è Lucene hè ancu una biblioteca, è a distanza trà biblioteca è pruduttu industriale assai!
  9. E soluzioni custruite anu da esse adattate significativamente, perchè modularità и integrabilità - punti chjave.
  10. Agile (Diu mi perdona) hè una tecnica chjave in l'interazzione cù u cliente è a verificazione ipotesi, di quale ci saranu assai.
  11. Hè soprattuttu pussibule è necessariu di esternalizà tutte e codificazione è UI. Tutte l'analisi di l'affari è e specificazioni backend bisognu di lascià ind'u è cunsideratu cum'è una cumpetenza core.
  12. I decisori di l'affari devenu esse constantemente "informati". u bisognu di travaglià bè cù dati è sempre à circà novi modi per analizà elli. A cumminazzioni di cumpetenze tecniche è cummerciale di i nostri impiegati aiutarà à elevà u statutu di l'urganizazione sana in tuttu.
  13. Internet - ci hè una fonte infinita di ispirazione (tandu ùn c’eranu tanti gatti) in relazione à l'avvicinamenti à a gestione di dati di l'impresa, anche se l'ugettivi è u scopu varienu significativamente.

Divisione di dati. annu 2013. Retrospectiva

I postulati tecnologichi ...

  1. Ci hè un enorme putenziale di sviluppu in simplificazione cumu i dati sò mostrati à e persone. Pudete chjamà sta parolla "iPhonization".
  2. Malgradu u fattu chì i venditori di BI dichjaranu chì sò direttamente porta l'analisi à l'utilizatori finali, (è certamenti si movenu in questa direzzione) - a scuperta ùn hè ancu accaduta. A ghjente solu ùn capisce micca bè multidimensionale i dati.
  3. Una interfaccia d'utilizatore chì rapprisenta dati più o menu cumplessi è strutturati in una struttura sfacciata forma - presenta dinù un numeru infinitu di prublemi. Conclusioni: u più flat u megliu.
  4. Una piattaforma custruita nantu à a basa di l'estrazione automatica di dati da e fonti (chì ùn sò micca sempre pensati per una tale estrazione) hè significativamente dipendente da e fonti, l'stabilità di i connettori è l'infrastruttura. A piattaforma (messenger) serà sempre inculpata per fallimentu di furnisce risultati. A fiducia - capitale di stu tipu di piattaforme. Capitale chì hè difficiule di guadagnà è faciule da perde.
  5. Da un puntu di vista cummerciale, ùn ci hè nisuna differenza trà l'analisi di Big Data è Solu Dati. Spessu daretu à numeri simplici cum'è 2x2 si trovanu milioni di dollari di opportunità. Un bon esempiu hè a dati nantu à a fine di a vita di l'elementi infrastrutturali nantu à a piattaforma norvegese. Quandu sò tutte e date di i tappi futuri. I riparazioni di tutti l'equipaggiu sò stati messi nantu à un assi è anu scupertu chì in N anni l'Armageddon era ghjuntu - un omu assai riccu si alzò da a so sedia è s'inchinava in fretta fora di a stanza cù e parolle: "Scusate, ùn aghju micca. avè assai tempu, aghju bisognu di preparà a flotta ... "
  6. Excel, è essenzialmente una presentazione tabulare chjara è concisa di dati, hà una putenza enormosa è un grande futuru. Credu in belli tavule (è sempre fà) è basta !
  7. L'arcu principale di tuttu questu "analitiche" hè automatizazione di decisione. Ci sò e più grande opportunità, ma ancu i più alti risichi, hè per quessa chì l'oportunità sò ricche, hè per quessa chì ci sò risichi, hè per quessa chì ci sò opportunità, hè per quessa ch'elli sò toffee... 🙂 Gestione di perforazione di pozzu, per esempiu...
  8. Se "integrabilità" hè una funzione chjave, allora i dati devenu esse de facto presentati cum'è un serviziu. REST regule, ma ùn devemu micca scurdate di l'ottimisazione produttività, chì hè avà spessu sacrificatu per l'integrabilità cum'è u putere di l'informatica cuntinueghja à cresce.
  9. Dati maestru - questu hè ciò chì deve esse localizatu, estratto, standardizatu prima di affruntà ogni prublema cummerciale. I dati maestri sò chjuchi, ma i prublemi sò grandi! Comu dicenu i fratelli di a semantica, u 50% di tutti i prublemi di u mondu sò perchè e persone chjamanu e cose cù nomi diffirenti, è l'altru 50% sò perchè chjamanu cose diverse cù u stessu nome.
  10. Qualcosa incapsulazione à u livellu di almacenamiento, limita l'apertura di a suluzione è porta à SILO-ficazione. Hè bonu sè vo site un grande venditore, altrimente hè cusì cusì. (Quì parlemu, sicuru, micca di u nivellu di bloccu è micca di AWS S3, chì avia digià 6 anni allora, ma di i schedari.).
  11. Modellazione relazionale data ùn hè più u nostru amicu. RDF è chjave-value - cool! Avemu vistu trasfurmazioni magichi di basa di dati relazionale cù mudelli di 2000 tables in 15 tables, è nimu di l'utilizatori persu nunda.
  12. Internet funziona perchè esiste URL cum'è un metudu unificatu di indirizzu. L'impurtanza di l'URL o megliu URI per i risorsi d'infurmazione di l'impresa hè difficiule di sopravvalutà.
  13. A minazione di testu è a NLP sò populari. In Internet. Ma ancu in u settore corporativu, un grande successu pò esse ottenutu per estrazione di dati strutturati da dati corporativi non strutturati.
  14. Sinergia trà dati strutturati è infurmazioni estratti da dati micca strutturati, i.e. schedarii - analiticu Klondike.
  15. Quandu extracting data, ùn vi scurdate di diritti è copyrights.
  16. A cumpagnia di estrazione di dati deve furmà adipartimentu di pirate, in u sensu bonu di a parolla. Ispiratu da a battaglia in salita contr'à i sistemi di prutezzione di bot crawler di Pagine Gialle.
  17. Prima di travaglià cù dati, hè necessariu "vedi" in tuttu. Hè difficiuli di spiegà. I formi tabulari venenu in mente. Per certi, rapprisentazioni gràfiche, ma ogni gràficu hè digià una interpretazione. D'una manera o di l'altru... "vedi" !
  18. Ripetendu u prublema di "fiducia" di l'utilizatori in u frontend. Fiducia in i cunnettori / prucessi di generazione di dati, fiducia in i dati, fiducia in e decisioni prese.

Source: www.habr.com

Add a comment