Úpadek éry velkých dat

Mnoho zahraničních autorů se shoduje, že éra Big Data skončila. A v tomto případě termín Big Data označuje technologie založené na Hadoopu. Mnoho autorů dokonce dokáže sebevědomě pojmenovat datum, kdy Big Data opustila tento svět a tímto datem je 05.06.2019.

Co se stalo v tento významný den?

V tento den MAPR slíbil, že přeruší svou práci, pokud nenajde prostředky na další provoz. Společnost MAPR později získala společnost HP v srpnu 2019. Ale když se vrátíme k červnu, nelze si nevšimnout tragédie tohoto období pro trh s velkými daty. Tento měsíc došlo ke kolapsu cen akcií společnosti CLOUDERA, předního hráče na trhu, která se v lednu téhož roku spojila s chronicky ztrátovou společností HORTOWORKS. Kolaps byl poměrně významný a činil 43 %, nakonec se kapitalizace CLOUDERA snížila ze 4,1 na 1,4 miliardy dolarů.

Nelze neříct, že zvěsti o bublině na poli technologií na bázi Hadoopu kolují již od prosince 2014, ale statečně se držela dalších téměř pět let. Tyto fámy byly založeny na tom, že Google, společnost, kde technologie Hadoop pocházela, odmítla svůj vynález. Technologie ale zakořenila během přechodu firem na nástroje cloudového zpracování a rychlého rozvoje umělé inteligence. Proto při pohledu zpět můžeme s jistotou říci, že smrt byla očekávána.

Éra Big Data tedy skončila, ale v procesu práce na Big Data si společnosti uvědomily všechny nuance práce na nich, výhody, které mohou Big Data přinést podnikání, a také se naučily používat umělé inteligenci k extrakci hodnoty z nezpracovaných dat.

O to zajímavější se stává otázka, co tuto technologii nahradí a jak se budou analytické technologie dále vyvíjet.

Rozšířená analytika

Během popsaných událostí společnosti působící v oblasti analýzy dat neposedly. Co lze posoudit na základě informací o transakcích, ke kterým došlo v roce 2019. V letošním roce byla uskutečněna největší transakce na trhu – akvizice analytické platformy Tableau společností Salesforce za 15,7 miliardy dolarů. Mezi Googlem a Lookerem došlo k menší dohodě. A samozřejmě nelze nezmínit akvizici velké datové platformy Attunity společností Qlik.

Lídři trhu BI a odborníci společnosti Gartner oznamují obrovský posun v přístupech k analýze dat, který zcela zničí trh BI a povede k nahrazení BI AI. V této souvislosti je třeba poznamenat, že zkratka AI není „Artificial Intelligence“, ale „Augmented Intelligence“. Podívejme se blíže na to, co se skrývá za slovy „Augmented Analytics“.

Rozšířená analytika, stejně jako rozšířená realita, je založena na několika obecných postulátech:

  • schopnost komunikovat pomocí NLP (Natural Language Processing), tzn. v lidské řeči;
  • využití umělé inteligence, to znamená, že data budou předzpracována strojovou inteligencí;
  • a samozřejmě doporučení dostupná uživateli systému, která vygenerovala umělá inteligence.

Podle výrobců analytických platforem bude jejich použití dostupné uživatelům, kteří nemají speciální dovednosti, jako je znalost SQL nebo podobného skriptovacího jazyka, kteří nemají statistické nebo matematické vzdělání, kteří nemají znalosti populárních jazyků. specializující se na zpracování dat a odpovídající knihovny. Takoví lidé, nazývaní „Citizen Data Scientists“, musí mít pouze vynikající obchodní kvalifikaci. Jejich úkolem je zachytit obchodní postřehy z tipů a předpovědí, které jim umělá inteligence poskytne, a mohou své odhady upřesnit pomocí NLP.

Při popisu procesu práce uživatelů se systémy této třídy si lze představit následující obrázek. Osoba, která přichází do práce a spouští příslušnou aplikaci, kromě obvyklé sady sestav a řídicích panelů, které lze analyzovat pomocí standardních přístupů (třídění, seskupování, provádění aritmetických operací), vidí určité tipy a doporučení, například: „V abyste dosáhli KPI, počtu prodejů, měli byste uplatnit slevu na produkty z kategorie „Zahradnictví“. Kromě toho může osoba kontaktovat firemní messenger: Skype, Slack atd. Dokáže klást robotovi otázky textem nebo hlasem: „Dejte mi pět nejziskovějších klientů.“ Poté, co obdrží vhodnou odpověď, musí učinit nejlepší rozhodnutí na základě svých obchodních zkušeností a přinést společnosti zisk.

Pokud uděláte krok zpět a podíváte se na složení analyzovaných informací, v této fázi mohou produkty rozšířené analýzy usnadnit lidem život. V ideálním případě se předpokládá, že uživatel bude muset analytický produkt pouze nasměrovat na zdroje požadovaných informací a program se sám postará o vytvoření datového modelu, propojení tabulek a podobné úkony.

To vše by mělo v prvé řadě zajistit „demokratizaci“ dat, tzn. Každý může analyzovat celou řadu informací, které má společnost k dispozici. Rozhodovací proces musí být podpořen metodami statistické analýzy. Doba přístupu k datům by měla být minimální, takže není potřeba psát skripty a SQL dotazy. A samozřejmě můžete ušetřit peníze na vysoce placených specialistech Data Science.

Hypoteticky, technologie nabízí velmi světlé vyhlídky pro podnikání.

Co nahrazuje velká data?

Ale ve skutečnosti jsem začal svůj článek Big Data. A toto téma bych nemohl rozvíjet bez krátké exkurze do moderních nástrojů BI, jejichž základem jsou často velká data. Osud velkých dat je nyní jasně určen a je to cloudová technologie. Zaměřil jsem se na transakce provedené s dodavateli BI, abych ukázal, že nyní má každý analytický systém za sebou cloudové úložiště a cloudové služby mají BI jako frontend.

Nezapomínáme ani na takové pilíře v oblasti databází, jako jsou ORACLE a Microsoft, je třeba si povšimnout jejich zvoleného směru rozvoje podnikání a tím je cloud. Všechny nabízené služby lze nalézt v cloudu, ale některé cloudové služby již nejsou dostupné on-premise. Odvedli významnou práci na využití modelů strojového učení, vytvořili knihovny dostupné uživatelům a nakonfigurovali rozhraní pro snadnou práci s modely od jejich výběru až po nastavení času zahájení.

Další důležitou výhodou využívání cloudových služeb, kterou vyjadřují výrobci, je dostupnost téměř neomezených datových sad na jakékoli téma pro tréninkové modely.

Nabízí se však otázka: jak dalece se u nás cloudové technologie prosadí?

Zdroj: www.habr.com

Přidat komentář