Nell'anno 2013 IBS, che poi sembrava stesse creando Divisione dati, mi ha chiesto di fare un simile braindump (basato esclusivamente sull'esperienza di interazione con i clienti aziendali di petrolio e gas) riguardo all'area problematica dei Big Data e dei dati in generale. Così mi sono imbattuto in esso 7 anni dopo e ho pensato che fosse divertente. Alcune cose sono ovvie. Alcune si sono rivelate non del tutto vere, ma... sono passati 7 anni.
Ho scritto in inglese e ora ho pensato di tradurlo in russo. E se qualcosa fosse ancora rilevante adesso? (Tradurrò i bollettini, ma per pigrizia lascio i cartelli in inglese. Il verde è bello, il rosso è pericoloso, il blu è un sogno).
Formalizzerò i commenti minimi di “oggi” Italianoin modo che sia chiaro e distinguibile.
Quindi, DATI! Dati per noi...
La Divisione Dati è la Divisione Sangue, perché i dati possono essere paragonati, ad esempio, al sangue che scorre nelle vene e nelle arterie di un'azienda. Tuttavia, sebbene il sangue sia lo stesso, gli organismi sono diversi e quindi produttivizzazione molto difficile, ma rappresenta anche un’opportunità di sviluppo.
Ci sono persone per le quali i dati saltano direttamente agli occhi: queste sono Noi.
E ci sono persone che, sfortunatamente, non vedono i dati in bianco. Questo, ancora una volta, ahimè, è nostro clienti!
Così, principi aziendali...
- Vendere attività commercialeE non IT (che tutti gli specialisti IT mi perdonino subito) perché stiamo risolvendo i problemi del mondo e, beh, più soldi.
- Tutti i problemi aziendali si concentrano attorno ai settori verticali tematici e richiederanno adeguati interventi specializzazioni.
- Tentativi di dimostrare valore di "dati" o, cosa ancora più difficile, il valore della “gestione dei dati” per un’azienda è sofferenza e dolore eterni. Fondamentalmente è come andare da una persona che si sente bene e dire: “Amico, adesso tratteremo il tuo sangue e, amico, è costoso!”
- Il mio “sogno bagnato” è vendere “estrazione dati” e “analisi” all’interno del modello SaaS piccola e media impresache sono entrati in 123 servizi cloud con interfacce interessanti: gestione progetti, helpdesk, contabilità, CRM, buste paga, reporting temporale, marketing, ... qualsiasi cosa, e si sono sepolti nei dati. Youcalc e Successfactors (probabilmente non ce ne sono più) Questo è buono!
- Cerca persone a cui piace armeggiare “scricchiolio” con i dati. Sono rari e strani (come le foglie di tè), ma fondamentali per gli affari. Un poeta, ad esempio, può essere molto bravo nella correlazione.
- ingegneri necessario! Necessario per trasformare i problemi che Crunchers ricavava dai dati in soluzioni. E il successo o il fallimento della decisione dipende interamente da loro.
- Sviluppo opensource progetti è di grande valore e permette di “assemblare” soluzioni complesse praticamente da zero.
- Ma... non dobbiamo dimenticare che Hadoop è una biblioteca, e anche Lucene è una biblioteca, e la distanza in mezzo biblioteca e prodotto industriale tanto!
- Le soluzioni costruite dovranno essere adattate in modo significativo, perché modularità и integrabilità - punti chiave.
- Agile (perdonami signore) è una tecnica chiave nell'interazione con il cliente e nella verifica ipotesi, di cui ce ne saranno molti.
- In particolare, è possibile e necessario esternalizzare tutta la codifica e l'interfaccia utente. Tutte le analisi e le specifiche aziendali back-end bisogno di andarsene interno e considerata una competenza fondamentale.
- I decisori aziendali devono essere costantemente “informati” in merito la necessità di lavorare correttamente con i dati e alla costante ricerca di nuovi modi per analizzarli. La combinazione delle competenze tecniche e aziendali dei nostri dipendenti contribuirà a migliorare lo status dell'intera organizzazione nel suo insieme.
- Internet – c’è una fonte infinita di ispirazione (non c'erano molti gatti allora) in relazione agli approcci alla gestione dei dati aziendali, sebbene gli obiettivi e la portata varino in modo significativo.
Postulati tecnologici...
- C'è un enorme potenziale di sviluppo in semplificazione come i dati vengono mostrati alle persone. Puoi chiamarlo la parola "iPhonizzazione".
- Nonostante il fatto che i fornitori di BI affermino di esserlo direttamente portare l'analisi agli utenti finali, (e sicuramente si stanno muovendo in questa direzione) - la svolta non è ancora avvenuta. La gente semplicemente non capisce bene multidimensionale i dati.
- Un'interfaccia utente che rappresenta dati più o meno complessi e strutturati in modo approssimativo sfaccettato forma - presenta anche un'infinità di problemi. Conclusione: più è piatto, meglio è.
- Una piattaforma costruita sulla base dell'estrazione automatica dei dati dalle fonti (che non sempre sono progettate per tale estrazione) dipende in modo significativo dalle fonti, dalla stabilità dei connettori e dall'infrastruttura. La piattaforma (messenger) sarà sempre accusata della mancata consegna dei risultati. fiducia – capitale di questo tipo di piattaforme. Capitale difficile da guadagnare e facile da perdere.
- Da un punto di vista aziendale, non c’è differenza tra l’analisi dei Big Data e Solo dati. Spesso dietro numeri semplici come 2x2 si celano opportunità per milioni di dollari. Un buon esempio sono i dati sulla fine vita degli elementi infrastrutturali sulla piattaforma norvegese. Quando sono tutte le date dei futuri limiti. le riparazioni di tutte le attrezzature furono messe su un asse e scoprirono che tra N anni sarebbe arrivato lo scaffale Armageddon: un uomo molto ricco si alzò dalla sedia e si inchinò frettolosamente fuori dalla stanza con le parole: “Mi dispiace, non lo so ho molto tempo, devo preparare la flotta...”
- Excel, e essenzialmente una presentazione tabellare chiara e concisa dei dati, ha un potere enorme e un grande futuro. Credo nelle belle tavole (e ancora) e basta!
- L'arco principale di tutta questa "analisi" è automazione delle decisioni. Ci sono le maggiori opportunità, ma anche i rischi più alti, ecco perché le opportunità sono ricche, ecco perché ci sono i rischi, ecco perché ci sono le opportunità, ecco perché sono caramellate... 🙂 Beh, la gestione delle perforazioni, per esempio...
- Se l’“integrabilità” è una caratteristica fondamentale, allora i dati dovrebbero di fatto essere presentati come un servizio. REST regole, ma non dobbiamo dimenticare l’ottimizzazione produttività, che ora viene spesso sacrificato a favore dell'integrabilità poiché la potenza di calcolo continua a crescere.
- Dati anagrafici - questo è ciò che deve essere localizzato, estratto, standardizzato prima di affrontare qualsiasi problema aziendale. I dati anagrafici sono piccoli, ma i problemi sono grandi! Come dicono i fratelli della semantica, il 50% di tutti i problemi del mondo sono dovuti al fatto che le persone chiamano le stesse cose con nomi diversi, e il restante 50% è dovuto al fatto che chiamano cose diverse con lo stesso nome.
- Qualsiasi incapsulamento a livello di storage, limita l’apertura della soluzione e porta alla SILO-ficazione. Va bene se sei un grande venditore, altrimenti è così così. (Qui non stiamo parlando ovviamente del livello di blocco e non di AWS S3, che allora aveva già 6 anni, ma di file).
- Modellazione relazionale i dati non sono più nostri amici. RDF e valore-chiave: fantastico! Abbiamo assistito a magiche trasformazioni di database relazionali con modelli da 2000 tabelle in 15 tabelle e nessuno degli utenti ha perso nulla.
- Internet funziona perché esiste URL come metodo unificato di indirizzamento. L'importanza dell'URL o meglio URI per le risorse informative aziendali è difficile da sopravvalutare.
- Il text mining e la PNL sono popolari. Su internet. Ma anche nel settore aziendale si possono ottenere grandi successi estraendo dati strutturati da dati aziendali non strutturati.
- Synergy tra dati strutturati e informazioni estratte da dati non strutturati, ovvero file – Klondike analitico.
- Quando si estraggono i dati, non dimenticare i diritti e diritti d'autore.
- La società di estrazione dei dati deve formare adipartimento degli hacker, nel buon senso della parola. Ispirato dalla dura battaglia contro i sistemi di protezione dei bot crawler delle Pagine Gialle.
- Prima di lavorare con i dati, è necessario "Vedere" nella sua interezza. È difficile da spiegare. Mi vengono in mente le forme tabulari. Per alcuni sono rappresentazioni grafiche, ma qualsiasi grafico è già un'interpretazione. In un modo o nell'altro... “vedere”!
- Ripetendo il problema della “fiducia” dell’utente nel frontend. Fiducia nei connettori/processi di generazione dei dati, fiducia nei dati, fiducia nelle decisioni prese.
Fonte: habr.com