Η παρακμή της εποχής των Big Data

Πολλοί ξένοι συγγραφείς συμφωνούν ότι η εποχή των Big Data έφτασε στο τέλος της. Και σε αυτή την περίπτωση, ο όρος Big Data αναφέρεται σε τεχνολογίες που βασίζονται στο Hadoop. Πολλοί συγγραφείς μπορούν ακόμη και να ονομάσουν με σιγουριά την ημερομηνία κατά την οποία τα Big Data έφυγαν από αυτόν τον κόσμο και αυτή η ημερομηνία είναι 05.06.2019/XNUMX/XNUMX.

Τι συνέβη αυτή τη σημαντική μέρα;

Την ημέρα αυτή, η MAPR υποσχέθηκε να αναστείλει τις εργασίες της εάν δεν μπορούσε να βρει κεφάλαια για περαιτέρω λειτουργία. Η MAPR εξαγοράστηκε αργότερα από την HP τον Αύγουστο του 2019. Επιστρέφοντας όμως στον Ιούνιο, δεν μπορεί κανείς να μην σημειώσει την τραγωδία αυτής της περιόδου για την αγορά Big Data. Αυτόν τον μήνα σημειώθηκε κατάρρευση των τιμών των μετοχών της CLOUDERA, κορυφαίου παίκτη στην αγορά, η οποία συγχωνεύτηκε με τη χρόνια ασύμφορη HORTOWORKS τον Ιανουάριο του ίδιου έτους. Η κατάρρευση ήταν αρκετά σημαντική και ανήλθε στο 43% και τελικά η κεφαλαιοποίηση της CLOUDERA μειώθηκε από 4,1 σε 1,4 δισ. δολάρια.

Είναι αδύνατο να μην πούμε ότι οι φήμες για μια φούσκα στον τομέα των τεχνολογιών που βασίζονται στο Hadoop κυκλοφορούν από τον Δεκέμβριο του 2014, αλλά με γενναιότητα κράτησε για σχεδόν άλλα πέντε χρόνια. Αυτές οι φήμες βασίστηκαν στην άρνηση της Google, της εταιρείας από την οποία ξεκίνησε η τεχνολογία Hadoop, από την εφεύρεσή της. Όμως η τεχνολογία ρίζωσε κατά τη μετάβαση των εταιρειών στα εργαλεία επεξεργασίας cloud και την ταχεία ανάπτυξη της τεχνητής νοημοσύνης. Επομένως, κοιτάζοντας πίσω, μπορούμε να πούμε με σιγουριά ότι ο θάνατος ήταν αναμενόμενος.

Έτσι, η εποχή των Μεγάλων Δεδομένων έφτασε στο τέλος της, αλλά στη διαδικασία επεξεργασίας των Μεγάλων Δεδομένων, οι εταιρείες έχουν συνειδητοποιήσει όλες τις αποχρώσεις της εργασίας σε αυτά, τα οφέλη που μπορούν να φέρουν τα Μεγάλα Δεδομένα στις επιχειρήσεις και έχουν μάθει επίσης να χρησιμοποιούν τεχνητά νοημοσύνη για εξαγωγή αξίας από ακατέργαστα δεδομένα.

Το πιο ενδιαφέρον γίνεται το ερώτημα τι θα αντικαταστήσει αυτή την τεχνολογία και πώς θα αναπτυχθούν περαιτέρω οι τεχνολογίες ανάλυσης.

Αυξημένη ανάλυση

Κατά τη διάρκεια των περιγραφόμενων γεγονότων, οι εταιρείες που εργάζονται στον τομέα της ανάλυσης δεδομένων δεν παρέμειναν ακίνητες. Τι μπορεί να κριθεί με βάση πληροφορίες για συναλλαγές που πραγματοποιήθηκαν το 2019. Φέτος, πραγματοποιήθηκε η μεγαλύτερη συναλλαγή στην αγορά - η εξαγορά της αναλυτικής πλατφόρμας Tableau από τη Salesforce για 15,7 δισεκατομμύρια δολάρια. Πραγματοποιήθηκε μια μικρότερη συμφωνία μεταξύ της Google και του Looker. Και φυσικά, δεν μπορεί να μην σημειωθεί η εξαγορά από την Qlik της πλατφόρμας μεγάλων δεδομένων Attunity.

Οι ηγέτες της αγοράς BI και οι ειδικοί της Gartner ανακοινώνουν μια μνημειώδη αλλαγή στις προσεγγίσεις στην ανάλυση δεδομένων· αυτή η αλλαγή θα καταστρέψει εντελώς την αγορά BI και θα οδηγήσει στην αντικατάσταση του BI με AI. Σε αυτό το πλαίσιο, πρέπει να σημειωθεί ότι η συντομογραφία AI δεν είναι «Τεχνητή νοημοσύνη» αλλά «Αυξημένη Νοημοσύνη». Ας ρίξουμε μια πιο προσεκτική ματιά στο τι κρύβεται πίσω από τις λέξεις "Augmented Analytics".

Η επαυξημένη ανάλυση, όπως και η επαυξημένη πραγματικότητα, βασίζεται σε πολλά γενικά αξιώματα:

  • την ικανότητα επικοινωνίας με χρήση NLP (Natural Language Processing), π.χ. στην ανθρώπινη γλώσσα?
  • τη χρήση τεχνητής νοημοσύνης, αυτό σημαίνει ότι τα δεδομένα θα υποβληθούν σε προεπεξεργασία από μηχανική νοημοσύνη.
  • και φυσικά, προτάσεις που είναι διαθέσιμες στον χρήστη του συστήματος, οι οποίες δημιουργήθηκαν από την τεχνητή νοημοσύνη.

Σύμφωνα με τους κατασκευαστές αναλυτικών πλατφορμών, η χρήση τους θα είναι διαθέσιμη σε χρήστες που δεν έχουν ειδικές δεξιότητες, όπως γνώση SQL ή παρόμοιας γλώσσας δέσμης ενεργειών, που δεν έχουν στατιστική ή μαθηματική κατάρτιση, που δεν έχουν γνώση δημοφιλών γλωσσών με εξειδίκευση στην επεξεργασία δεδομένων και αντίστοιχες βιβλιοθήκες. Αυτοί οι άνθρωποι, που ονομάζονται «Επιστήμονες Δεδομένων Πολιτών», πρέπει να έχουν μόνο εξαιρετικά επιχειρηματικά προσόντα. Το καθήκον τους είναι να συλλάβουν επιχειρηματικές γνώσεις από τις συμβουλές και τις προβλέψεις που θα τους δώσει η τεχνητή νοημοσύνη και μπορούν να βελτιώσουν τις εικασίες τους χρησιμοποιώντας το NLP.

Περιγράφοντας τη διαδικασία των χρηστών που εργάζονται με συστήματα αυτής της κατηγορίας, μπορεί κανείς να φανταστεί την παρακάτω εικόνα. Ένα άτομο, που έρχεται στη δουλειά και ξεκινά την αντίστοιχη εφαρμογή, εκτός από το συνηθισμένο σύνολο αναφορών και πινάκων εργαλείων που μπορούν να αναλυθούν χρησιμοποιώντας τυπικές προσεγγίσεις (ταξινόμηση, ομαδοποίηση, εκτέλεση αριθμητικών πράξεων), βλέπει ορισμένες συμβουλές και συστάσεις, όπως: Για να επιτύχετε KPI, αριθμός πωλήσεων, θα πρέπει να εφαρμόσετε έκπτωση σε προϊόντα από την κατηγορία "Κηπουρική". Επιπλέον, ένα άτομο μπορεί να επικοινωνήσει με έναν εταιρικό αγγελιοφόρο: Skype, Slack κ.λπ. Μπορεί να κάνει ερωτήσεις στο ρομπότ, μέσω κειμένου ή φωνής: «Δώστε μου τους πέντε πιο κερδοφόρους πελάτες». Έχοντας λάβει την κατάλληλη απάντηση, πρέπει να πάρει την καλύτερη απόφαση με βάση την επιχειρηματική του εμπειρία και να αποφέρει κέρδη στην εταιρεία.

Εάν κάνετε ένα βήμα πίσω και κοιτάξετε τη σύνθεση των πληροφοριών που αναλύονται και σε αυτό το στάδιο, τα προϊόντα επαυξημένης ανάλυσης μπορούν να κάνουν τη ζωή των ανθρώπων ευκολότερη. Στην ιδανική περίπτωση, θεωρείται ότι ο χρήστης θα χρειαστεί μόνο να υποδείξει το αναλυτικό προϊόν στις πηγές των επιθυμητών πληροφοριών και το ίδιο το πρόγραμμα θα φροντίσει να δημιουργήσει ένα μοντέλο δεδομένων, να συνδέσει πίνακες και παρόμοιες εργασίες.

Όλα αυτά θα πρέπει πρώτα από όλα να εξασφαλίσουν τον «εκδημοκρατισμό» των δεδομένων, δηλ. Οποιοσδήποτε μπορεί να αναλύσει ολόκληρη τη σειρά πληροφοριών που διαθέτει η εταιρεία. Η διαδικασία λήψης αποφάσεων πρέπει να υποστηρίζεται από μεθόδους στατιστικής ανάλυσης. Ο χρόνος πρόσβασης στα δεδομένα πρέπει να είναι ελάχιστος, επομένως δεν χρειάζεται να γράφετε σενάρια και ερωτήματα SQL. Και φυσικά, μπορείτε να εξοικονομήσετε χρήματα σε υψηλά αμειβόμενους ειδικούς της Επιστήμης Δεδομένων.

Υποθετικά, η τεχνολογία προσφέρει πολύ φωτεινές προοπτικές για τις επιχειρήσεις.

Τι αντικαθιστά τα Big Data;

Αλλά, στην πραγματικότητα, ξεκίνησα το άρθρο μου με τα Big Data. Και δεν θα μπορούσα να αναπτύξω αυτό το θέμα χωρίς μια σύντομη περιήγηση σε σύγχρονα εργαλεία BI, η βάση των οποίων είναι συχνά τα Μεγάλα Δεδομένα. Η μοίρα των μεγάλων δεδομένων είναι πλέον ξεκάθαρα καθορισμένη και είναι η τεχνολογία cloud. Επικεντρώθηκα στις συναλλαγές που πραγματοποιήθηκαν με προμηθευτές BI για να δείξω ότι πλέον κάθε αναλυτικό σύστημα έχει αποθηκευτικό χώρο στο cloud και οι υπηρεσίες cloud έχουν το BI ως το μπροστινό μέρος.

Χωρίς να ξεχνάμε τέτοιους πυλώνες στον τομέα των βάσεων δεδομένων όπως η ORACLE και η Microsoft, είναι απαραίτητο να σημειώσουμε την επιλεγμένη κατεύθυνση επιχειρηματικής ανάπτυξης και αυτό είναι το cloud. Όλες οι προσφερόμενες υπηρεσίες μπορούν να βρεθούν στο cloud, αλλά ορισμένες υπηρεσίες cloud δεν είναι πλέον διαθέσιμες on-premise. Έχουν κάνει σημαντική δουλειά στη χρήση μοντέλων μηχανικής εκμάθησης, έχουν δημιουργήσει βιβλιοθήκες διαθέσιμες στους χρήστες και έχουν διαμορφώσει διεπαφές για ευκολία στην εργασία με μοντέλα από την επιλογή τους έως τη ρύθμιση της ώρας έναρξης.

Ένα άλλο σημαντικό πλεονέκτημα της χρήσης υπηρεσιών cloud, το οποίο εκφράζεται από τους κατασκευαστές, είναι η διαθεσιμότητα σχεδόν απεριόριστων συνόλων δεδομένων για οποιοδήποτε θέμα για μοντέλα εκπαίδευσης.

Ωστόσο, τίθεται το ερώτημα: πόσο μακριά θα ριζώσουν οι τεχνολογίες cloud στη χώρα μας;

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο