Kemerosotan era Data Besar

Ramai pengarang asing bersetuju bahawa era Data Besar telah berakhir. Dan dalam kes ini, istilah Big Data merujuk kepada teknologi berdasarkan Hadoop. Ramai penulis boleh menamakan tarikh Big Data meninggalkan dunia ini dengan yakin dan tarikh ini ialah 05.06.2019/XNUMX/XNUMX.

Apa yang berlaku pada hari penting ini?

Pada hari ini, MAPR berjanji untuk menggantung kerjanya jika ia tidak dapat mencari dana untuk operasi selanjutnya. MAPR kemudiannya diperoleh oleh HP pada Ogos 2019. Tetapi kembali ke bulan Jun, seseorang tidak boleh tidak menyedari tragedi tempoh ini untuk pasaran Data Besar. Bulan ini menyaksikan kejatuhan harga saham CLOUDERA, pemain terkemuka dalam pasaran, yang bergabung dengan HORTOWORKS yang tidak menguntungkan secara kronik pada Januari tahun yang sama. Keruntuhan itu agak ketara dan berjumlah 43%; akhirnya, permodalan CLOUDERA berkurangan daripada 4,1 kepada 1,4 bilion dolar.

Adalah mustahil untuk tidak mengatakan bahawa khabar angin tentang gelembung dalam bidang teknologi berasaskan Hadoop telah tersebar sejak Disember 2014, tetapi ia dengan berani bertahan selama hampir lima tahun lagi. Khabar angin ini adalah berdasarkan keengganan Google, syarikat tempat teknologi Hadoop berasal, daripada ciptaannya. Tetapi teknologi itu berakar umbi semasa peralihan syarikat kepada alat pemprosesan awan dan perkembangan pesat kecerdasan buatan. Oleh itu, melihat ke belakang, kita boleh mengatakan dengan yakin bahawa kematian itu dijangka.

Oleh itu, era Data Besar telah berakhir, tetapi dalam proses mengusahakan Data Besar, syarikat telah menyedari semua nuansa mengusahakannya, faedah yang boleh dibawa oleh Data Besar kepada perniagaan, dan juga belajar menggunakan tiruan. kecerdasan untuk mengekstrak nilai daripada data mentah.

Semakin menarik menjadi persoalan tentang apa yang akan menggantikan teknologi ini dan bagaimana teknologi analitik akan berkembang lebih jauh.

Analitis Ditambah

Semasa peristiwa yang diterangkan, syarikat yang bekerja dalam bidang analisis data tidak berdiam diri. Apa yang boleh dinilai berdasarkan maklumat tentang transaksi yang berlaku pada tahun 2019. Tahun ini, transaksi terbesar dalam pasaran telah dijalankan - pemerolehan platform analisis Tableau oleh Salesforce untuk $15,7 bilion. Perjanjian yang lebih kecil berlaku antara Google dan Looker. Dan sudah tentu, seseorang tidak boleh gagal untuk mencatat pemerolehan oleh Qlik platform data besar Attunity.

Pemimpin pasaran BI dan pakar Gartner mengumumkan peralihan monumental dalam pendekatan analisis data; peralihan ini akan memusnahkan pasaran BI sepenuhnya dan membawa kepada penggantian BI dengan AI. Dalam konteks ini, perlu diingatkan bahawa singkatan AI bukanlah "Kecerdasan buatan" tetapi "Kecerdasan Ditambah". Mari kita lihat dengan lebih dekat perkara di sebalik perkataan "Analitis Ditambah."

Analisis tambahan, seperti realiti tambahan, adalah berdasarkan beberapa postulat umum:

  • keupayaan untuk berkomunikasi menggunakan NLP (Natural Language Processing), i.e. dalam bahasa manusia;
  • penggunaan kecerdasan buatan, ini bermakna data akan diproses terlebih dahulu oleh kecerdasan mesin;
  • dan sudah tentu, cadangan tersedia kepada pengguna sistem, yang dihasilkan oleh kecerdasan buatan.

Menurut pengeluar platform analisis, penggunaannya akan tersedia kepada pengguna yang tidak mempunyai kemahiran khas, seperti pengetahuan tentang SQL atau bahasa skrip yang serupa, yang tidak mempunyai latihan statistik atau matematik, yang tidak mempunyai pengetahuan tentang bahasa popular. pakar dalam pemprosesan data dan perpustakaan yang sepadan. Orang sedemikian, yang dipanggil "Saintis Data Warganegara", mesti hanya mempunyai kelayakan perniagaan yang cemerlang. Tugas mereka adalah untuk menangkap cerapan perniagaan daripada petua dan ramalan yang akan diberikan oleh kecerdasan buatan kepada mereka, dan mereka boleh memperhalusi tekaan mereka menggunakan NLP.

Menggambarkan proses pengguna yang bekerja dengan sistem kelas ini, seseorang boleh membayangkan gambar berikut. Seseorang, datang untuk bekerja dan melancarkan aplikasi yang sepadan, sebagai tambahan kepada set laporan dan papan pemuka biasa yang boleh dianalisis menggunakan pendekatan standard (mengisih, mengumpulkan, melakukan operasi aritmetik), melihat petua dan cadangan tertentu, seperti: "Dalam untuk mencapai KPI, bilangan jualan, anda harus menggunakan diskaun pada produk daripada kategori "Berkebun". Di samping itu, seseorang boleh menghubungi utusan korporat: Skype, Slack, dsb. Boleh bertanya soalan robot, melalui teks atau suara: "Beri saya lima pelanggan yang paling menguntungkan." Setelah mendapat jawapan yang sesuai, dia mesti membuat keputusan yang terbaik berdasarkan pengalaman perniagaannya dan membawa keuntungan kepada syarikat.

Jika anda mengambil langkah ke belakang dan melihat komposisi maklumat yang sedang dianalisis, dan pada peringkat ini, produk analisis tambahan boleh menjadikan kehidupan orang ramai lebih mudah. Sebaik-baiknya, diandaikan bahawa pengguna hanya perlu menunjukkan produk analisis kepada sumber maklumat yang diingini, dan program itu sendiri akan menguruskan mencipta model data, memautkan jadual dan tugasan yang serupa.

Semua ini harus, pertama sekali, memastikan "pendemokrasian" data, i.e. Mana-mana orang boleh menganalisis keseluruhan pelbagai maklumat yang tersedia untuk syarikat. Proses membuat keputusan mesti disokong oleh kaedah analisis statistik. Masa capaian data hendaklah minimum, jadi tidak perlu menulis skrip dan pertanyaan SQL. Dan sudah tentu, anda boleh menjimatkan wang untuk pakar Sains Data berbayar tinggi.

Secara hipotesis, teknologi menawarkan prospek yang sangat cerah untuk perniagaan.

Apakah yang menggantikan Big Data?

Tetapi, sebenarnya, saya memulakan artikel saya dengan Big Data. Dan saya tidak dapat mengembangkan topik ini tanpa lawatan singkat ke dalam alat BI moden, yang asasnya selalunya Data Besar. Nasib data besar kini ditentukan dengan jelas, dan ia adalah teknologi awan. Saya menumpukan pada transaksi yang dibuat dengan vendor BI untuk menunjukkan bahawa kini setiap sistem analisis mempunyai storan awan di belakangnya, dan perkhidmatan awan mempunyai BI sebagai bahagian hadapan.

Tidak lupa tentang tonggak tersebut dalam bidang pangkalan data seperti ORACLE dan Microsoft, adalah perlu untuk mengambil perhatian arah pilihan mereka dalam pembangunan perniagaan dan ini adalah awan. Semua perkhidmatan yang ditawarkan boleh didapati di awan, tetapi sesetengah perkhidmatan awan tidak lagi tersedia di premis. Mereka telah melakukan kerja yang penting dalam penggunaan model pembelajaran mesin, mencipta perpustakaan yang tersedia kepada pengguna dan mengkonfigurasikan antara muka untuk memudahkan bekerja dengan model daripada memilih model tersebut hingga menetapkan masa mula.

Satu lagi kelebihan penting menggunakan perkhidmatan awan, yang disuarakan oleh pengeluar, ialah ketersediaan set data yang hampir tidak terhad pada sebarang topik untuk model latihan.

Namun, persoalan timbul: sejauh manakah teknologi awan akan berakar di negara kita?

Sumber: www.habr.com

Tambah komen