In 2013 anno Sorella Luna, chì tandu paria di creà Divisione di dati, m'hà dumandatu di fà un tali braindump (esclusivamente basatu annantu à l'esperienza di l'interazzione cù i clienti di u petroliu è di u gasu corporativu) in quantu à l'area di prublema di Big Data, è di Dati in generale. Allora l'aghju scontru 7 anni dopu è pensu chì era divertente. Alcune cose sò evidenti. Qualchidunu s'hè vultatu micca sanu veru, ma... 7 anni sò passati.
Aghju scrittu in inglese è avà aghju pensatu à traduce in russo. E se qualcosa hè sempre pertinente avà? (Traduceraghju i bollettini, ma lasciate i segni in inglese per pigrizia. U verde hè bonu, u rossu hè periculosu, u blu hè un sognu).
Furmalizà i cumenti minimi da "oghje" Talianucusì ch'ellu hè chjaru è distinguishable.
Allora, DATA! Avemu dati ...
A Divisione di Dati hè a Divisione di Sangue, perchè e dati ponu esse paragunati, per esempiu, à u sangue chì passa per i vini è l'arterie di un corpu cummerciale. In ogni casu, ancu s'è u sangue hè u listessu, l'organisimi sò diffirenti è per quessa pruduzzione assai difficiuli, ma rapprisenta dinù una opportunità di sviluppu.
Ci sò persone per quale i dati salta ghjustu in i so ochji - questi sò Мы.
E ci sò persone chì, sfurtunatamenti, ùn vedenu micca u puntu di dati in biancu. Questu, di novu, ahimè, hè u nostru Clienti!
Cusì, principii di cummerciale ...
- Vendimu affariè micca IT (Possi tutti i specialisti in IT mi pardunanu à una volta) perchè risolvemu i prublemi di u mondu, è, bè, più soldi.
- Tutti i prublemi di l'affari sò cuncentrati intornu à e verticali tematiche di l'industria è necessitanu adeguate spicializazioni.
- Tentativi di pruvà valore di "data" o, ancu più difficiuli, u valore di a "gestione di dati" per un affari hè eternu soffrenu è dolore. In fondu, hè cum'è vene à una persona chì si sente bè è dicendu: "Amicu, avemu da trattà u vostru sangue avà, è, omu, hè caru!"
- U mo "sognu umitu" hè di vende "estrazione di dati" è "analitiche" in u mudellu SaaS picculi è medie impresechì hà cullatu in 123 servizii di nuvola cù interfacce cool: gestione di prughjettu, helpdesk, contabilità, CRM, paga, rapportu di tempu, marketing, ... u nome, è si sò intarrati in i dati. Youcalc è Successfactors (probabilmente ùn ci sò più) Questu hè bonu!
- Cercate e persone chì piacenu à tinker "crunch" cù dati. Sò rari è strani (cum'è foglie di tè), ma chjave per l'affari. Un pueta, per esempiu, pò esse assai bonu in correlazione.
- Ingegneri bisognu! Needed to turn problems that Crunchers pulled from data in suluzioni. È u successu o fallimentu di a decisione dipende interamente da elli.
- Sviluppu opensource prughjetti hè di grande valore è permette di "assemble" suluzioni cumplessi praticamenti da zero.
- Ma... ùn devi micca scurdà chì Hadoop hè una biblioteca, è Lucene hè ancu una biblioteca, è a distanza trà biblioteca è pruduttu industriale assai!
- E soluzioni custruite anu da esse adattate significativamente, perchè modularità и integrabilità - punti chjave.
- Agile (Diu mi perdona) hè una tecnica chjave in l'interazzione cù u cliente è a verificazione ipotesi, di quale ci saranu assai.
- Hè soprattuttu pussibule è necessariu di esternalizà tutte e codificazione è UI. Tutte l'analisi di l'affari è e specificazioni backend bisognu di lascià ind'u è cunsideratu cum'è una cumpetenza core.
- I decisori di l'affari devenu esse constantemente "informati". u bisognu di travaglià bè cù dati è sempre à circà novi modi per analizà elli. A cumminazzioni di cumpetenze tecniche è cummerciale di i nostri impiegati aiutarà à elevà u statutu di l'urganizazione sana in tuttu.
- Internet - ci hè una fonte infinita di ispirazione (tandu ùn c’eranu tanti gatti) in relazione à l'avvicinamenti à a gestione di dati di l'impresa, anche se l'ugettivi è u scopu varienu significativamente.
I postulati tecnologichi ...
- Ci hè un enorme putenziale di sviluppu in simplificazione cumu i dati sò mostrati à e persone. Pudete chjamà sta parolla "iPhonization".
- Malgradu u fattu chì i venditori di BI dichjaranu chì sò direttamente porta l'analisi à l'utilizatori finali, (è certamenti si movenu in questa direzzione) - a scuperta ùn hè ancu accaduta. A ghjente solu ùn capisce micca bè multidimensionale i dati.
- Una interfaccia d'utilizatore chì rapprisenta dati più o menu cumplessi è strutturati in una struttura sfacciata forma - presenta dinù un numeru infinitu di prublemi. Conclusioni: u più flat u megliu.
- Una piattaforma custruita nantu à a basa di l'estrazione automatica di dati da e fonti (chì ùn sò micca sempre pensati per una tale estrazione) hè significativamente dipendente da e fonti, l'stabilità di i connettori è l'infrastruttura. A piattaforma (messenger) serà sempre inculpata per fallimentu di furnisce risultati. A fiducia - capitale di stu tipu di piattaforme. Capitale chì hè difficiule di guadagnà è faciule da perde.
- Da un puntu di vista cummerciale, ùn ci hè nisuna differenza trà l'analisi di Big Data è Solu Dati. Spessu daretu à numeri simplici cum'è 2x2 si trovanu milioni di dollari di opportunità. Un bon esempiu hè a dati nantu à a fine di a vita di l'elementi infrastrutturali nantu à a piattaforma norvegese. Quandu sò tutte e date di i tappi futuri. I riparazioni di tutti l'equipaggiu sò stati messi nantu à un assi è anu scupertu chì in N anni l'Armageddon era ghjuntu - un omu assai riccu si alzò da a so sedia è s'inchinava in fretta fora di a stanza cù e parolle: "Scusate, ùn aghju micca. avè assai tempu, aghju bisognu di preparà a flotta ... "
- Excel, è essenzialmente una presentazione tabulare chjara è concisa di dati, hà una putenza enormosa è un grande futuru. Credu in belli tavule (è sempre fà) è basta !
- L'arcu principale di tuttu questu "analitiche" hè automatizazione di decisione. Ci sò e più grande opportunità, ma ancu i più alti risichi, hè per quessa chì l'oportunità sò ricche, hè per quessa chì ci sò risichi, hè per quessa chì ci sò opportunità, hè per quessa ch'elli sò toffee... 🙂 Gestione di perforazione di pozzu, per esempiu...
- Se "integrabilità" hè una funzione chjave, allora i dati devenu esse de facto presentati cum'è un serviziu. REST regule, ma ùn devemu micca scurdate di l'ottimisazione produttività, chì hè avà spessu sacrificatu per l'integrabilità cum'è u putere di l'informatica cuntinueghja à cresce.
- Dati maestru - questu hè ciò chì deve esse localizatu, estratto, standardizatu prima di affruntà ogni prublema cummerciale. I dati maestri sò chjuchi, ma i prublemi sò grandi! Comu dicenu i fratelli di a semantica, u 50% di tutti i prublemi di u mondu sò perchè e persone chjamanu e cose cù nomi diffirenti, è l'altru 50% sò perchè chjamanu cose diverse cù u stessu nome.
- Qualcosa incapsulazione à u livellu di almacenamiento, limita l'apertura di a suluzione è porta à SILO-ficazione. Hè bonu sè vo site un grande venditore, altrimente hè cusì cusì. (Quì parlemu, sicuru, micca di u nivellu di bloccu è micca di AWS S3, chì avia digià 6 anni allora, ma di i schedari.).
- Modellazione relazionale data ùn hè più u nostru amicu. RDF è chjave-value - cool! Avemu vistu trasfurmazioni magichi di basa di dati relazionale cù mudelli di 2000 tables in 15 tables, è nimu di l'utilizatori persu nunda.
- Internet funziona perchè esiste URL cum'è un metudu unificatu di indirizzu. L'impurtanza di l'URL o megliu URI per i risorsi d'infurmazione di l'impresa hè difficiule di sopravvalutà.
- A minazione di testu è a NLP sò populari. In Internet. Ma ancu in u settore corporativu, un grande successu pò esse ottenutu per estrazione di dati strutturati da dati corporativi non strutturati.
- Sinergia trà dati strutturati è infurmazioni estratti da dati micca strutturati, i.e. schedarii - analiticu Klondike.
- Quandu extracting data, ùn vi scurdate di diritti è copyrights.
- A cumpagnia di estrazione di dati deve furmà adipartimentu di pirate, in u sensu bonu di a parolla. Ispiratu da a battaglia in salita contr'à i sistemi di prutezzione di bot crawler di Pagine Gialle.
- Prima di travaglià cù dati, hè necessariu "vedi" in tuttu. Hè difficiuli di spiegà. I formi tabulari venenu in mente. Per certi, rapprisentazioni gràfiche, ma ogni gràficu hè digià una interpretazione. D'una manera o di l'altru... "vedi" !
- Ripetendu u prublema di "fiducia" di l'utilizatori in u frontend. Fiducia in i cunnettori / prucessi di generazione di dati, fiducia in i dati, fiducia in e decisioni prese.
Source: www.habr.com