Podział Danych. rok 2013. Z mocą wsteczną

W 2013 roku IBS, który wówczas zdawał się tworzyć Podział Danych, poprosił mnie o dokonanie takiej burzy mózgów (wyłącznie w oparciu o doświadczenia w interakcjach z korporacyjnymi klientami z branży ropy i gazu) odnośnie obszaru problemowego Big Data i danych w ogóle. Natknąłem się na to 7 lat później i pomyślałem, że to zabawne. Niektóre rzeczy są oczywiste. Niektóre okazywały się nie do końca prawdą, ale… minęło 7 lat.

Napisałem po angielsku, a teraz pomyślałem o przetłumaczeniu tego na rosyjski. A co jeśli coś jest nadal aktualne? (Przetłumaczę biuletyny, ale z lenistwa zostaw napisy po angielsku. Zielony jest dobry, czerwony jest niebezpieczny, niebieski to marzenie).

Sformalizuję minimalne komentarze z „dzisiaj” Włoskitak, aby było jasne i rozpoznawalne.

Zatem DANE! Dane dla nas...

Dział Danych to Dział Krwi, ponieważ dane można porównać na przykład z krwią płynącą w żyłach i tętnicach przedsiębiorstwa. Jednakże, chociaż krew jest taka sama, organizmy są różne i dlatego produktyzacja bardzo trudne, ale stanowi także szansę na rozwój.

Są ludzie, którym dane rzucają się w oczy – to są ludzie My.
Są też ludzie, dla których niestety nie są to dane puste. To znowu, niestety, jest nasze Klienci!

Podział Danych. rok 2013. Z mocą wsteczną

W ten sposób zasady biznesowe...

  1. Sprzedać biznesI nie IT (niech wszyscy informatyki mi od razu wybaczą), bo rozwiązujemy problemy świata i, cóż, więcej pieniędzy.
  2. Wszystkie problemy biznesowe koncentrują się wokół branż tematycznych i będą wymagały odpowiednich rozwiązań specjalizacje.
  3. Próby udowodnienia wartość „danych” lub, co jest jeszcze trudniejsze, wartość „zarządzania danymi” dla firmy to wieczne cierpienie i ból. Zasadniczo to tak, jakby przyjść do osoby, która czuje się dobrze i powiedzieć: „Stary, teraz będziemy leczyć twoją krew, a to jest drogie!”
  4. Moim „mokrym marzeniem” jest sprzedaż „ekstrakcji danych” i „analityki” w modelu SaaS małych i średnich przedsiębiorstwktórzy wspięli się na 123 usługi w chmurze z fajnymi interfejsami: zarządzanie projektami, helpdesk, księgowość, CRM, płace, raportowanie czasu, marketing,… tak to nazywasz, i zakopali się w danych. Youcalc i czynniki sukcesu (chyba już ich nie ma) To jest dobre!
  5. Poszukaj ludzi, którzy lubią majsterkować "schrupać" z danymi. Są rzadkie i dziwne (jak liście herbaty), ale kluczowe dla biznesu. Na przykład poeta może być bardzo dobry w korelacji.
  6. Inżynierowie potrzebne! Potrzebne do przekształcenia problemów, które Crunchers wyciągnęli z danych, w rozwiązania. A sukces lub porażka decyzji zależy wyłącznie od nich.
  7. rozwój opensource projektów ma ogromną wartość i pozwala „montować” złożone rozwiązania praktycznie od podstaw.
  8. Ale... nie wolno nam zapominać, że Hadoop to biblioteka, Lucene to także biblioteka i odległość pomiędzy nimi biblioteka i produkt przemysłowy dużo!
  9. Budowane rozwiązania będą musiały zostać znacząco dostosowane, gdyż modułowość и integralność - Kluczowe punkty.
  10. Zręczny (Boże wybacz mi) to kluczowa technika w interakcji z klientem i weryfikacji hipotezy, których będzie wiele.
  11. Szczególnie możliwe i konieczne jest outsourcing całego kodowania i interfejsu użytkownika. Wszystkie analizy biznesowe i specyfikacje zaplecze muszę wyjść wewnątrz i uważana za kompetencję kluczową.
  12. Decydenci biznesowi muszą być stale „informowani”. konieczność właściwej pracy z danymi i stale poszukuje nowych sposobów ich analizy. Połączenie kompetencji technicznych i biznesowych naszych pracowników pomoże podnieść status całej organizacji jako całości.
  13. Internet – istnieje niewyczerpane źródło inspiracji (nie było wtedy zbyt wielu kotów) w odniesieniu do podejść do zarządzania danymi przedsiębiorstwa, chociaż cele i zakres znacznie się różnią.

Podział Danych. rok 2013. Z mocą wsteczną

Postulaty technologiczne...

  1. W Olsztynie drzemie ogromny potencjał rozwoju uproszczenie w jaki sposób dane są pokazywane ludziom. Można to nazwać słowem „iPonizacja”.
  2. Pomimo tego, że dostawcy BI twierdzą, że są bezpośrednio udostępniać analizy użytkownikom końcowym, (i na pewno zmierzają w tym kierunku) – przełom jeszcze nie nastąpił. Ludzie po prostu nie rozumieją dobrze wielowymiarowy dane.
  3. Interfejs użytkownika reprezentujący mniej lub bardziej złożone dane o luźnej strukturze fasetowany formie - stwarza również nieskończoną liczbę problemów. Wniosek: im bardziej płaski, tym lepiej.
  4. Platforma zbudowana w oparciu o automatyczną ekstrakcję danych ze źródeł (które nie zawsze są do tego przeznaczone) jest w dużym stopniu uzależniona od źródeł, stabilności złączy i infrastruktury. Platforma (posłaniec) zawsze będzie obwiniana za niepowodzenie w dostarczaniu wyników. Zaufaj – stolica tego typu platform. Kapitał, który trudno zdobyć i łatwo stracić.
  5. Z biznesowego punktu widzenia nie ma różnicy pomiędzy analizą Big Data a analizą Big Data Tylko dane. Często za liczbami tak prostymi jak 2x2 kryją się możliwości warte miliony dolarów. Dobrym przykładem są dane o zakończeniu życia elementów infrastruktury na szelfie norweskim. Kiedy są wszystkie daty przyszłych czapek. naprawy całego sprzętu postawiono na jedną oś i okazało się, że za N lat nadchodzi Armagedon z półki - jeden bardzo zamożny człowiek wstał z krzesła i pospiesznie wyszedł z pokoju ze słowami: „Przepraszam, nie mam dużo czasu, muszę przygotować flotę...”
  6. Excel, a w zasadzie jasna i zwięzła tabelaryczna prezentacja danych, ma ogromną moc i wielką przyszłość. Wierzę w piękne stoły (i nadal) i to wszystko!
  7. Głównym łukiem całej tej „analizy” jest automatyzacja decyzji. Są największe możliwości, ale i największe ryzyko, dlatego możliwości są bogate, dlatego są ryzyka, dlatego są możliwości, dlatego są toffi... 🙂 Na przykład zarządzanie odwiertami...
  8. Jeżeli kluczową cechą jest „integrowalność”, dane powinny de facto być prezentowane jako usługa. REST zasad, ale nie możemy zapominać o optymalizacji wydajność, który obecnie często poświęca się na rzecz integracji w miarę ciągłego wzrostu mocy obliczeniowej.
  9. Dane podstawowe – to właśnie należy zlokalizować, wyodrębnić i ujednolicić, zanim zajmiemy się jakimikolwiek problemami biznesowymi. Dane podstawowe są małe, ale problemy z nimi duże! Jak mówią bracia semantycy, 50% wszystkich problemów świata wynika z tego, że ludzie nazywają te same rzeczy różnymi nazwami, a pozostałe 50% wynika z tego, że nazywają różne rzeczy tą samą nazwą.
  10. dowolny kapsułkowanie na poziomie magazynowania ogranicza otwartość rozwiązania i prowadzi do SILOfikacji. Dobrze, jeśli jesteś dużym sprzedawcą, w przeciwnym razie jest tak sobie. (Mówimy tu oczywiście nie o poziomie blokowym i nie o AWS S3, który miał już wtedy 6 lat, a o plikach).
  11. Modelowanie relacyjne dane nie są już naszym przyjacielem. RDF i para klucz-wartość – super! Widzieliśmy magiczne transformacje relacyjnych baz danych z modelami 2000 tabel w 15 tabel i żaden z użytkowników nic nie stracił.
  12. Internet działa, bo istnieje URL jako ujednolicona metoda adresowania. Znaczenie adresu URL lub raczej URI dla zasobów informacyjnych przedsiębiorstwa jest trudne do przecenienia.
  13. Popularne są eksploracja tekstu i NLP. W Internecie. Ale nawet w sektorze przedsiębiorstw duży sukces można osiągnąć, wyodrębniając ustrukturyzowane dane z nieustrukturyzowanych danych korporacyjnych.
  14. Synergia pomiędzy danymi ustrukturyzowanymi a informacjami wydobytymi z danych nieustrukturyzowanych, tj. pliki – analityczne Klondike.
  15. Wyodrębniając dane, nie zapomnij o prawach i prawa autorskie.
  16. Firma zajmująca się ekstrakcją danych musi utworzyć adział hakerów, w dobrym tego słowa znaczeniu. Zainspirowany żmudną walką z systemami ochrony botów indeksujących Yellow Pages.
  17. Przed pracą z danymi należy to zrobić "Widzieć" w całości. Trudno to wyjaśnić. Przychodzą mi na myśl formy tabelaryczne. Dla niektórych przedstawienie graficzne, ale każdy wykres jest już interpretacją. Tak czy inaczej... „zobacz”!
  18. Powtórzenie kwestii „zaufania” użytkowników w interfejsie. Zaufaj konektorom/procesom generowania danych, zaufaj danym, zaufanie do podjętych decyzji.

Źródło: www.habr.com

Dodaj komentarz