W 2013 roku IBS, który wówczas zdawał się tworzyć Podział Danych, poprosił mnie o dokonanie takiej burzy mózgów (wyłącznie w oparciu o doświadczenia w interakcjach z korporacyjnymi klientami z branży ropy i gazu) odnośnie obszaru problemowego Big Data i danych w ogóle. Natknąłem się na to 7 lat później i pomyślałem, że to zabawne. Niektóre rzeczy są oczywiste. Niektóre okazywały się nie do końca prawdą, ale… minęło 7 lat.
Napisałem po angielsku, a teraz pomyślałem o przetłumaczeniu tego na rosyjski. A co jeśli coś jest nadal aktualne? (Przetłumaczę biuletyny, ale z lenistwa zostaw napisy po angielsku. Zielony jest dobry, czerwony jest niebezpieczny, niebieski to marzenie).
Sformalizuję minimalne komentarze z „dzisiaj” Włoskitak, aby było jasne i rozpoznawalne.
Zatem DANE! Dane dla nas...
Dział Danych to Dział Krwi, ponieważ dane można porównać na przykład z krwią płynącą w żyłach i tętnicach przedsiębiorstwa. Jednakże, chociaż krew jest taka sama, organizmy są różne i dlatego produktyzacja bardzo trudne, ale stanowi także szansę na rozwój.
Są ludzie, którym dane rzucają się w oczy – to są ludzie My.
Są też ludzie, dla których niestety nie są to dane puste. To znowu, niestety, jest nasze Klienci!
W ten sposób zasady biznesowe...
- Sprzedać biznesI nie IT (niech wszyscy informatyki mi od razu wybaczą), bo rozwiązujemy problemy świata i, cóż, więcej pieniędzy.
- Wszystkie problemy biznesowe koncentrują się wokół branż tematycznych i będą wymagały odpowiednich rozwiązań specjalizacje.
- Próby udowodnienia wartość „danych” lub, co jest jeszcze trudniejsze, wartość „zarządzania danymi” dla firmy to wieczne cierpienie i ból. Zasadniczo to tak, jakby przyjść do osoby, która czuje się dobrze i powiedzieć: „Stary, teraz będziemy leczyć twoją krew, a to jest drogie!”
- Moim „mokrym marzeniem” jest sprzedaż „ekstrakcji danych” i „analityki” w modelu SaaS małych i średnich przedsiębiorstwktórzy wspięli się na 123 usługi w chmurze z fajnymi interfejsami: zarządzanie projektami, helpdesk, księgowość, CRM, płace, raportowanie czasu, marketing,… tak to nazywasz, i zakopali się w danych. Youcalc i czynniki sukcesu (chyba już ich nie ma) To jest dobre!
- Poszukaj ludzi, którzy lubią majsterkować "schrupać" z danymi. Są rzadkie i dziwne (jak liście herbaty), ale kluczowe dla biznesu. Na przykład poeta może być bardzo dobry w korelacji.
- Inżynierowie potrzebne! Potrzebne do przekształcenia problemów, które Crunchers wyciągnęli z danych, w rozwiązania. A sukces lub porażka decyzji zależy wyłącznie od nich.
- rozwój opensource projektów ma ogromną wartość i pozwala „montować” złożone rozwiązania praktycznie od podstaw.
- Ale... nie wolno nam zapominać, że Hadoop to biblioteka, Lucene to także biblioteka i odległość pomiędzy nimi biblioteka i produkt przemysłowy dużo!
- Budowane rozwiązania będą musiały zostać znacząco dostosowane, gdyż modułowość и integralność - Kluczowe punkty.
- Zręczny (Boże wybacz mi) to kluczowa technika w interakcji z klientem i weryfikacji hipotezy, których będzie wiele.
- Szczególnie możliwe i konieczne jest outsourcing całego kodowania i interfejsu użytkownika. Wszystkie analizy biznesowe i specyfikacje zaplecze muszę wyjść wewnątrz i uważana za kompetencję kluczową.
- Decydenci biznesowi muszą być stale „informowani”. konieczność właściwej pracy z danymi i stale poszukuje nowych sposobów ich analizy. Połączenie kompetencji technicznych i biznesowych naszych pracowników pomoże podnieść status całej organizacji jako całości.
- Internet – istnieje niewyczerpane źródło inspiracji (nie było wtedy zbyt wielu kotów) w odniesieniu do podejść do zarządzania danymi przedsiębiorstwa, chociaż cele i zakres znacznie się różnią.
Postulaty technologiczne...
- W Olsztynie drzemie ogromny potencjał rozwoju uproszczenie w jaki sposób dane są pokazywane ludziom. Można to nazwać słowem „iPonizacja”.
- Pomimo tego, że dostawcy BI twierdzą, że są bezpośrednio udostępniać analizy użytkownikom końcowym, (i na pewno zmierzają w tym kierunku) – przełom jeszcze nie nastąpił. Ludzie po prostu nie rozumieją dobrze wielowymiarowy dane.
- Interfejs użytkownika reprezentujący mniej lub bardziej złożone dane o luźnej strukturze fasetowany formie - stwarza również nieskończoną liczbę problemów. Wniosek: im bardziej płaski, tym lepiej.
- Platforma zbudowana w oparciu o automatyczną ekstrakcję danych ze źródeł (które nie zawsze są do tego przeznaczone) jest w dużym stopniu uzależniona od źródeł, stabilności złączy i infrastruktury. Platforma (posłaniec) zawsze będzie obwiniana za niepowodzenie w dostarczaniu wyników. Zaufaj – stolica tego typu platform. Kapitał, który trudno zdobyć i łatwo stracić.
- Z biznesowego punktu widzenia nie ma różnicy pomiędzy analizą Big Data a analizą Big Data Tylko dane. Często za liczbami tak prostymi jak 2x2 kryją się możliwości warte miliony dolarów. Dobrym przykładem są dane o zakończeniu życia elementów infrastruktury na szelfie norweskim. Kiedy są wszystkie daty przyszłych czapek. naprawy całego sprzętu postawiono na jedną oś i okazało się, że za N lat nadchodzi Armagedon z półki - jeden bardzo zamożny człowiek wstał z krzesła i pospiesznie wyszedł z pokoju ze słowami: „Przepraszam, nie mam dużo czasu, muszę przygotować flotę...”
- Excel, a w zasadzie jasna i zwięzła tabelaryczna prezentacja danych, ma ogromną moc i wielką przyszłość. Wierzę w piękne stoły (i nadal) i to wszystko!
- Głównym łukiem całej tej „analizy” jest automatyzacja decyzji. Są największe możliwości, ale i największe ryzyko, dlatego możliwości są bogate, dlatego są ryzyka, dlatego są możliwości, dlatego są toffi... 🙂 Na przykład zarządzanie odwiertami...
- Jeżeli kluczową cechą jest „integrowalność”, dane powinny de facto być prezentowane jako usługa. REST zasad, ale nie możemy zapominać o optymalizacji wydajność, który obecnie często poświęca się na rzecz integracji w miarę ciągłego wzrostu mocy obliczeniowej.
- Dane podstawowe – to właśnie należy zlokalizować, wyodrębnić i ujednolicić, zanim zajmiemy się jakimikolwiek problemami biznesowymi. Dane podstawowe są małe, ale problemy z nimi duże! Jak mówią bracia semantycy, 50% wszystkich problemów świata wynika z tego, że ludzie nazywają te same rzeczy różnymi nazwami, a pozostałe 50% wynika z tego, że nazywają różne rzeczy tą samą nazwą.
- dowolny kapsułkowanie na poziomie magazynowania ogranicza otwartość rozwiązania i prowadzi do SILOfikacji. Dobrze, jeśli jesteś dużym sprzedawcą, w przeciwnym razie jest tak sobie. (Mówimy tu oczywiście nie o poziomie blokowym i nie o AWS S3, który miał już wtedy 6 lat, a o plikach).
- Modelowanie relacyjne dane nie są już naszym przyjacielem. RDF i para klucz-wartość – super! Widzieliśmy magiczne transformacje relacyjnych baz danych z modelami 2000 tabel w 15 tabel i żaden z użytkowników nic nie stracił.
- Internet działa, bo istnieje URL jako ujednolicona metoda adresowania. Znaczenie adresu URL lub raczej URI dla zasobów informacyjnych przedsiębiorstwa jest trudne do przecenienia.
- Popularne są eksploracja tekstu i NLP. W Internecie. Ale nawet w sektorze przedsiębiorstw duży sukces można osiągnąć, wyodrębniając ustrukturyzowane dane z nieustrukturyzowanych danych korporacyjnych.
- Synergia pomiędzy danymi ustrukturyzowanymi a informacjami wydobytymi z danych nieustrukturyzowanych, tj. pliki – analityczne Klondike.
- Wyodrębniając dane, nie zapomnij o prawach i prawa autorskie.
- Firma zajmująca się ekstrakcją danych musi utworzyć adział hakerów, w dobrym tego słowa znaczeniu. Zainspirowany żmudną walką z systemami ochrony botów indeksujących Yellow Pages.
- Przed pracą z danymi należy to zrobić "Widzieć" w całości. Trudno to wyjaśnić. Przychodzą mi na myśl formy tabelaryczne. Dla niektórych przedstawienie graficzne, ale każdy wykres jest już interpretacją. Tak czy inaczej... „zobacz”!
- Powtórzenie kwestii „zaufania” użytkowników w interfejsie. Zaufaj konektorom/procesom generowania danych, zaufaj danym, zaufanie do podjętych decyzji.
Źródło: www.habr.com