Divisione dati. anno 2013. Retrospettiva

Nell'anno 2013 IBS, che poi sembrava stesse creando Divisione dati, mi ha chiesto di fare un simile braindump (basato esclusivamente sull'esperienza di interazione con i clienti aziendali di petrolio e gas) riguardo all'area problematica dei Big Data e dei dati in generale. Così mi sono imbattuto in esso 7 anni dopo e ho pensato che fosse divertente. Alcune cose sono ovvie. Alcune si sono rivelate non del tutto vere, ma... sono passati 7 anni.

Ho scritto in inglese e ora ho pensato di tradurlo in russo. E se qualcosa fosse ancora rilevante adesso? (Tradurrò i bollettini, ma per pigrizia lascio i cartelli in inglese. Il verde è bello, il rosso è pericoloso, il blu è un sogno).

Formalizzerò i commenti minimi di “oggi” Italianoin modo che sia chiaro e distinguibile.

Quindi, DATI! Dati per noi...

La Divisione Dati è la Divisione Sangue, perché i dati possono essere paragonati, ad esempio, al sangue che scorre nelle vene e nelle arterie di un'azienda. Tuttavia, sebbene il sangue sia lo stesso, gli organismi sono diversi e quindi produttivizzazione molto difficile, ma rappresenta anche un’opportunità di sviluppo.

Ci sono persone per le quali i dati saltano direttamente agli occhi: queste sono Noi.
E ci sono persone che, sfortunatamente, non vedono i dati in bianco. Questo, ancora una volta, ahimè, è nostro clienti!

Divisione dati. anno 2013. Retrospettiva

Così, principi aziendali...

  1. Vendere attività commercialeE non IT (che tutti gli specialisti IT mi perdonino subito) perché stiamo risolvendo i problemi del mondo e, beh, più soldi.
  2. Tutti i problemi aziendali si concentrano attorno ai settori verticali tematici e richiederanno adeguati interventi specializzazioni.
  3. Tentativi di dimostrare valore di "dati" o, cosa ancora più difficile, il valore della “gestione dei dati” per un’azienda è sofferenza e dolore eterni. Fondamentalmente è come andare da una persona che si sente bene e dire: “Amico, adesso tratteremo il tuo sangue e, amico, è costoso!”
  4. Il mio “sogno bagnato” è vendere “estrazione dati” e “analisi” all’interno del modello SaaS piccola e media impresache sono entrati in 123 servizi cloud con interfacce interessanti: gestione progetti, helpdesk, contabilità, CRM, buste paga, reporting temporale, marketing, ... qualsiasi cosa, e si sono sepolti nei dati. Youcalc e Successfactors (probabilmente non ce ne sono più) Questo è buono!
  5. Cerca persone a cui piace armeggiare “scricchiolio” con i dati. Sono rari e strani (come le foglie di tè), ma fondamentali per gli affari. Un poeta, ad esempio, può essere molto bravo nella correlazione.
  6. ingegneri necessario! Necessario per trasformare i problemi che Crunchers ricavava dai dati in soluzioni. E il successo o il fallimento della decisione dipende interamente da loro.
  7. Sviluppo opensource progetti è di grande valore e permette di “assemblare” soluzioni complesse praticamente da zero.
  8. Ma... non dobbiamo dimenticare che Hadoop è una biblioteca, e anche Lucene è una biblioteca, e la distanza in mezzo biblioteca e prodotto industriale tanto!
  9. Le soluzioni costruite dovranno essere adattate in modo significativo, perché modularità и integrabilità - punti chiave.
  10. Agile (perdonami signore) è una tecnica chiave nell'interazione con il cliente e nella verifica ipotesi, di cui ce ne saranno molti.
  11. In particolare, è possibile e necessario esternalizzare tutta la codifica e l'interfaccia utente. Tutte le analisi e le specifiche aziendali back-end bisogno di andarsene interno e considerata una competenza fondamentale.
  12. I decisori aziendali devono essere costantemente “informati” in merito la necessità di lavorare correttamente con i dati e alla costante ricerca di nuovi modi per analizzarli. La combinazione delle competenze tecniche e aziendali dei nostri dipendenti contribuirà a migliorare lo status dell'intera organizzazione nel suo insieme.
  13. Internet – c’è una fonte infinita di ispirazione (non c'erano molti gatti allora) in relazione agli approcci alla gestione dei dati aziendali, sebbene gli obiettivi e la portata varino in modo significativo.

Divisione dati. anno 2013. Retrospettiva

Postulati tecnologici...

  1. C'è un enorme potenziale di sviluppo in semplificazione come i dati vengono mostrati alle persone. Puoi chiamarlo la parola "iPhonizzazione".
  2. Nonostante il fatto che i fornitori di BI affermino di esserlo direttamente portare l'analisi agli utenti finali, (e sicuramente si stanno muovendo in questa direzione) - la svolta non è ancora avvenuta. La gente semplicemente non capisce bene multidimensionale i dati.
  3. Un'interfaccia utente che rappresenta dati più o meno complessi e strutturati in modo approssimativo sfaccettato forma - presenta anche un'infinità di problemi. Conclusione: più è piatto, meglio è.
  4. Una piattaforma costruita sulla base dell'estrazione automatica dei dati dalle fonti (che non sempre sono progettate per tale estrazione) dipende in modo significativo dalle fonti, dalla stabilità dei connettori e dall'infrastruttura. La piattaforma (messenger) sarà sempre accusata della mancata consegna dei risultati. fiducia – capitale di questo tipo di piattaforme. Capitale difficile da guadagnare e facile da perdere.
  5. Da un punto di vista aziendale, non c’è differenza tra l’analisi dei Big Data e Solo dati. Spesso dietro numeri semplici come 2x2 si celano opportunità per milioni di dollari. Un buon esempio sono i dati sulla fine vita degli elementi infrastrutturali sulla piattaforma norvegese. Quando sono tutte le date dei futuri limiti. le riparazioni di tutte le attrezzature furono messe su un asse e scoprirono che tra N anni sarebbe arrivato lo scaffale Armageddon: un uomo molto ricco si alzò dalla sedia e si inchinò frettolosamente fuori dalla stanza con le parole: “Mi dispiace, non lo so ho molto tempo, devo preparare la flotta...”
  6. Excel, e essenzialmente una presentazione tabellare chiara e concisa dei dati, ha un potere enorme e un grande futuro. Credo nelle belle tavole (e ancora) e basta!
  7. L'arco principale di tutta questa "analisi" è automazione delle decisioni. Ci sono le maggiori opportunità, ma anche i rischi più alti, ecco perché le opportunità sono ricche, ecco perché ci sono i rischi, ecco perché ci sono le opportunità, ecco perché sono caramellate... 🙂 Beh, la gestione delle perforazioni, per esempio...
  8. Se l’“integrabilità” è una caratteristica fondamentale, allora i dati dovrebbero di fatto essere presentati come un servizio. REST regole, ma non dobbiamo dimenticare l’ottimizzazione produttività, che ora viene spesso sacrificato a favore dell'integrabilità poiché la potenza di calcolo continua a crescere.
  9. Dati anagrafici - questo è ciò che deve essere localizzato, estratto, standardizzato prima di affrontare qualsiasi problema aziendale. I dati anagrafici sono piccoli, ma i problemi sono grandi! Come dicono i fratelli della semantica, il 50% di tutti i problemi del mondo sono dovuti al fatto che le persone chiamano le stesse cose con nomi diversi, e il restante 50% è dovuto al fatto che chiamano cose diverse con lo stesso nome.
  10. Qualsiasi incapsulamento a livello di storage, limita l’apertura della soluzione e porta alla SILO-ficazione. Va bene se sei un grande venditore, altrimenti è così così. (Qui non stiamo parlando ovviamente del livello di blocco e non di AWS S3, che allora aveva già 6 anni, ma di file).
  11. Modellazione relazionale i dati non sono più nostri amici. RDF e valore-chiave: fantastico! Abbiamo assistito a magiche trasformazioni di database relazionali con modelli da 2000 tabelle in 15 tabelle e nessuno degli utenti ha perso nulla.
  12. Internet funziona perché esiste URL come metodo unificato di indirizzamento. L'importanza dell'URL o meglio URI per le risorse informative aziendali è difficile da sopravvalutare.
  13. Il text mining e la PNL sono popolari. Su internet. Ma anche nel settore aziendale si possono ottenere grandi successi estraendo dati strutturati da dati aziendali non strutturati.
  14. Synergy tra dati strutturati e informazioni estratte da dati non strutturati, ovvero file – Klondike analitico.
  15. Quando si estraggono i dati, non dimenticare i diritti e diritti d'autore.
  16. La società di estrazione dei dati deve formare adipartimento degli hacker, nel buon senso della parola. Ispirato dalla dura battaglia contro i sistemi di protezione dei bot crawler delle Pagine Gialle.
  17. Prima di lavorare con i dati, è necessario "Vedere" nella sua interezza. È difficile da spiegare. Mi vengono in mente le forme tabulari. Per alcuni sono rappresentazioni grafiche, ma qualsiasi grafico è già un'interpretazione. In un modo o nell'altro... “vedere”!
  18. Ripetendo il problema della “fiducia” dell’utente nel frontend. Fiducia nei connettori/processi di generazione dei dati, fiducia nei dati, fiducia nelle decisioni prese.

Fonte: habr.com

Aggiungi un commento