Data Division. år 2013. Retrospektiv

Under 2013 år IBS, som sedan verkade skapa Data Division, bad mig att göra en sådan braindump (endast baserat på erfarenhet av interaktion med företags olje- och gaskunder) angående problemområdet Big Data och Data i allmänhet. Så jag stötte på den 7 år senare och tyckte den var rolig. Vissa saker är uppenbara. Vissa visade sig inte vara helt sanna, men... 7 år har gått.

Jag skrev på engelska och nu tänkte jag översätta det till ryska. Tänk om något fortfarande är relevant nu? (Jag ska översätta bulletinerna, men lämna skyltarna på engelska av lättja. Grönt är bra, rött är farligt, blått är en dröm).

Jag kommer att formalisera de minimala kommentarerna från "idag" italienskaså att den är tydlig och urskiljbar.

Alltså DATA! Data för oss...

Datadivisionen är bloddivisionen, eftersom data till exempel kan jämföras med blodet som rinner genom venerna och artärerna i ett företag. Men även om blodet är detsamma, är organismerna olika och därför produktisering mycket svårt, men det innebär också en möjlighet till utveckling.

Det finns människor för vilka uppgifterna hoppar rakt in i deras ögon - det är de Vi.
Och det finns människor som tyvärr inte ser datapunkten tom. Detta, igen, tyvärr, är vårt Kunder!

Data Division. år 2013. Retrospektiv

Så, affärsprinciper...

  1. Vi säljer företagOch inte DET (må alla IT-specialister förlåta mig på en gång) för vi löser världens problem, och, ja, mer pengar.
  2. Alla affärsproblem är koncentrerade kring tematiska industrivertikaler och kommer att kräva tillräckliga inriktningar.
  3. Försök att bevisa värdet av "data" eller, ännu svårare, värdet av "datahantering" för ett företag är evigt lidande och smärta. I grund och botten är det som att komma till en person som mår bra och säga: "Dude, vi ska behandla ditt blod nu, och, dude, det är dyrt!"
  4. Min "våta dröm" är att sälja "dataextraktion" och "analytics" inom SaaS-modellen små och medelstora företagsom klättrade in i 123 molntjänster med häftiga gränssnitt: projektledning, helpdesk, redovisning, CRM, löner, tidsrapportering, marknadsföring, ... you name it, och grävde ner sig i datan. Youcalc och framgångsfaktorer (det finns nog inga längre) Det här är bra!
  5. Leta efter folk som gillar att pyssla "knastrande" med data. De är sällsynta och konstiga (som teblad), men nyckeln till affärer. En poet kan till exempel vara väldigt bra på korrelation.
  6. ingenjörer behövs! Behövde förvandla problem som Crunchers drog från data till lösningar. Och beslutets framgång eller misslyckande beror helt på dem.
  7. Utveckling OpenSource projekt är av stort värde och gör det möjligt att ”montera” komplexa lösningar praktiskt taget från grunden.
  8. Men... vi får inte glömma att Hadoop är ett bibliotek, och Lucene är också ett bibliotek, och avståndet mellan bibliotek och industriprodukt mycket!
  9. De byggda lösningarna kommer att behöva anpassas avsevärt, eftersom modularitet и integrerbarhet - nyckelord.
  10. Agile (Gud förlåt mig) är en nyckelteknik i interaktion med kunden och verifiering hypoteser, som det kommer att finnas många av.
  11. Det är särskilt möjligt och nödvändigt att lägga ut all kodning och UI. All affärsanalys och specifikationer backend behöver lämna inom och betraktas som en kärnkompetens.
  12. Affärsbeslutsfattare måste ständigt "informeras" om behovet av att arbeta korrekt med data och ständigt söka efter nya sätt att analysera dem. Kombinationen av tekniska och affärsmässiga kompetenser hos våra anställda kommer att bidra till att höja statusen för hela organisationen som helhet.
  13. Internet – det finns en oändlig inspirationskälla (det fanns inte så många katter då) i förhållande till metoder för företagsdatahantering, även om målen och omfattningen varierar avsevärt.

Data Division. år 2013. Retrospektiv

Teknologiska postulat...

  1. Det finns en enorm utvecklingspotential i förenkling hur data visas för människor. Du kan kalla detta ordet "iPhonization".
  2. Trots att BI-leverantörer hävdar att de är direkt föra analys till slutanvändare, (och de rör sig verkligen i denna riktning) - genombrottet har ännu inte inträffat. Folk förstår bara inte bra flerdimensionell data.
  3. Ett användargränssnitt som representerar mer eller mindre komplexa, löst strukturerade data i fasetterad form - ger också ett oändligt antal problem. Slutsats: ju plattare desto bättre.
  4. En plattform som bygger på automatisk dataextraktion från källor (som inte alltid är designad för sådan extrahering) är väsentligt beroende av källorna, stabiliteten hos anslutningarna och infrastrukturen. Plattformen (budbäraren) kommer alltid att skyllas för att inte leverera resultat. förtroende – kapital för denna typ av plattformar. Kapital som är svårt att tjäna och lätt att förlora.
  5. Ur affärsmässig synvinkel är det ingen skillnad mellan Big Data-analys och Bara data. Ofta bakom siffror så enkla som 2x2 ligger möjligheter för miljontals dollar. Ett bra exempel är data om slutet av livslängden för infrastrukturelement på norsk sokkel. När är alla datum för framtida kepsar. reparationer av all utrustning sattes på en axel och de fick reda på att om N år var hyllan Armageddon på väg - en mycket rik man reste sig från sin stol och böjde sig hastigt ut ur rummet med orden: "Förlåt, det gör jag inte har mycket tid, jag måste förbereda flottan...”
  6. Excel, och i grunden en tydlig och koncis tabellpresentation av data, har enorm kraft och en stor framtid. Jag tror på vackra bord (och fortfarande) och det är allt!
  7. Huvudbågen för all denna "analys" är beslutsautomatisering. Det finns de största möjligheterna, men också de högsta riskerna, det är därför möjligheterna är rika, det är därför det finns risker, det är därför det finns möjligheter, det är därför de är kola... 🙂 Brunnsborrningsledning, till exempel...
  8. Om "integrerbarhet" är en nyckelfunktion, bör data de facto presenteras som en tjänst. REST regler, men vi får inte glömma optimering produktivitet, som nu ofta offras för integrerbarhet när datorkraften fortsätter att växa.
  9. Basdata - det här är vad som måste lokaliseras, extraheras, standardiseras innan några affärsproblem tas upp. Masterdata är liten, men problemen med den är stora! Som semantikens bröder säger beror 50 % av världens alla problem på att människor kallar samma saker vid olika namn, och de andra 50 % beror på att de kallar olika saker vid samma namn.
  10. någon inkapsling på lagringsnivå begränsar det lösningens öppenhet och leder till SILO-ficering. Det är bra om du är en stor försäljare, annars är det så som så. (Här pratar vi förstås inte om blocknivån och inte om AWS S3, som redan var 6 år gammal då, utan om filer).
  11. Relationsmodellering data är inte längre vår vän. RDF och nyckel-värde – coolt! Vi har sett magiska transformationer av relationsdatabaser med modeller av 2000 tabeller till 15 tabeller, och ingen av användarna förlorade något.
  12. Internet fungerar för att det finns URL som en enhetlig metod för adressering. Vikten av URL eller snarare URI för företag är informationsresurserna svåra att överskatta.
  13. Text mining och NLP är populära. På internet. Men även inom företagssektorn kan stor framgång uppnås genom att extrahera strukturerad data från ostrukturerad företagsdata.
  14. Synergi mellan strukturerad data och information utvunnen från ostrukturerad data, dvs. filer – analytisk Klondike.
  15. När du extraherar data, glöm inte rättigheter och upphovsrätt.
  16. Datautvinningsföretaget måste bilda enhackare avdelning, i ordets goda mening. Inspirerad av uppförsbacken mot Gula Sidornas sökrobotskyddssystem.
  17. Innan man arbetar med data är det nödvändigt att "ser" i sin helhet. Det är svårt att förklara. Tabellformer kommer att tänka på. För vissa, grafiska representationer, men vilken graf som helst är redan en tolkning. På ett eller annat sätt... "se"!
  18. Upprepa problemet med användarens "förtroende" i frontend. Förtroende för kopplingar/datagenereringsprocesser, tillit till data, tillit till fattade beslut.

Källa: will.com

Lägg en kommentar