Big Data-ийн эриний уналт

Гадаадын олон зохиолчид Big Data-ын эрин үе дууссан гэдэгтэй санал нэгддэг. Мөн энэ тохиолдолд Big Data гэсэн нэр томъёо нь Hadoop дээр суурилсан технологиудыг хэлдэг. Олон зохиолчид Big Data энэ ертөнцийг орхисон огноог ч итгэлтэйгээр нэрлэж чаддаг бөгөөд энэ огноо нь 05.06.2019 оны XNUMX-р сарын XNUMX-ны өдөр юм.

Энэ чухал өдөр юу болсон бэ?

Энэ өдөр MAPR цаашид үйл ажиллагаа явуулах хөрөнгө олдохгүй бол ажлаа түр зогсооно гэж амласан. Дараа нь MAPR-ийг 2019 оны 43-р сард HP худалдаж авсан. Гэхдээ 4,1-р сар руу буцаж ирэхэд Big Data зах зээлийн энэ үеийн эмгэнэлт байдлыг анзаарахгүй байхын аргагүй юм. Энэ сард зах зээлд тэргүүлэгч CLOUDERA-ийн хувьцааны үнэ уналтад орсон бөгөөд энэ нь мөн оны 1,4-р сард архаг ашиггүй HORTOWORKS-тай нэгдсэн. Уналт нь нэлээд ач холбогдолтой байсан бөгөөд XNUMX% -ийг эзэлж, эцэст нь CLOUDERA-ийн капиталжуулалт XNUMX-ээс XNUMX тэрбум доллар болж буурсан.

2014 оны XNUMX-р сараас эхлэн Hadoop-д суурилсан технологийн салбарт хөөс үүсэх тухай цуурхал гарч байсан ч бараг таван жил зоригтойгоор хадгалагдлаа гэж хэлэхгүй байх боломжгүй юм. Эдгээр цуу яриа нь Hadoop технологийг үүсгэсэн Google компаний шинэ бүтээлээс татгалзсантай холбоотой юм. Гэвч энэ технологи нь компаниуд үүлэн боловсруулах хэрэгсэлд шилжиж, хиймэл оюун ухаан хурдацтай хөгжиж байх үед үндэслэсэн. Тиймээс эргээд харахад үхэл хүлээгдэж байсан гэж итгэлтэйгээр хэлж чадна.

Ийнхүү Big Data-ын эрин үе дуусч байгаа ч Big Data дээр ажиллах явцад компаниуд түүн дээр ажиллах бүх нарийн ширийн зүйлс, Big Data нь бизнест авчрах ашиг тусыг ойлгож, мөн хиймэл өгөгдөл ашиглаж сурсан. түүхий мэдээллээс үнэ цэнийг гаргаж авах оюун ухаан.

Энэ технологийг юу орлох вэ, аналитик технологи цаашид хэрхэн хөгжих вэ гэдэг асуулт илүү сонирхолтой болж байна.

Өргөтгөсөн аналитик

Тайлбарласан үйл явдлын үеэр мэдээллийн шинжилгээний чиглэлээр ажилладаг компаниуд зүгээр суусангүй. 2019 онд хийгдсэн гүйлгээний талаарх мэдээлэлд үндэслэн юуг дүгнэж болох вэ. Энэ жил зах зээл дээрх хамгийн том гүйлгээ хийгдсэн - Salesforce Tableau аналитик платформыг 15,7 тэрбум доллараар худалдаж авсан. Google болон Looker хоёрын хооронд жижиг хэлэлцээр хийгдсэн. Мэдээжийн хэрэг, Attunity том өгөгдлийн платформыг Qlik худалдаж авсныг тэмдэглэх нь зүйтэй.

BI зах зээлийн удирдагчид болон Gartner-ийн мэргэжилтнүүд өгөгдөлд дүн шинжилгээ хийх арга барилд томоохон өөрчлөлт гарсныг зарлаж байна; энэхүү өөрчлөлт нь BI зах зээлийг бүрмөсөн устгаж, BI-г хиймэл оюун ухаанаар солиход хүргэнэ. Энэ утгаараа AI гэсэн товчлол нь “Хиймэл оюун ухаан” биш харин “Өргөтгөсөн оюун ухаан” гэдгийг тэмдэглэх нь зүйтэй. "Augmented Analytics" гэсэн үгийн ард юу байгааг нарийвчлан авч үзье.

Өргөтгөсөн аналитик нь нэмэгдүүлсэн бодит байдал шиг хэд хэдэн ерөнхий үзэл баримтлал дээр суурилдаг:

  • NLP (Natural Language Processing) ашиглан харилцах чадвар, i.e. хүний ​​хэлээр;
  • хиймэл оюун ухааныг ашиглах, энэ нь өгөгдлийг машины оюун ухаанаар урьдчилан боловсруулна гэсэн үг юм;
  • Мэдээжийн хэрэг, хиймэл оюун ухаанаар бий болгосон системийн хэрэглэгчдэд зориулсан зөвлөмжүүд.

Аналитик платформ үйлдвэрлэгчдийн үзэж байгаагаар тэдгээрийг ашиглах нь SQL эсвэл ижил төстэй скрипт хэлний мэдлэггүй, статистик эсвэл математикийн сургалтгүй, түгээмэл хэлний мэдлэггүй хэрэглэгчид ашиглах боломжтой болно. өгөгдөл боловсруулах болон холбогдох номын сангуудад мэргэшсэн. "Иргэдийн мэдээлэл судлаач" гэж нэрлэгддэг ийм хүмүүс зөвхөн бизнесийн өндөр ур чадвартай байх ёстой. Тэдний даалгавар бол хиймэл оюун ухааны тэдэнд өгөх зөвлөмж, таамаглалаас бизнесийн ойлголтыг олж авах бөгөөд NLP ашиглан таамаглалаа сайжруулах боломжтой.

Энэ ангиллын системтэй ажиллах хэрэглэгчдийн үйл явцыг тайлбарлахдаа дараах зургийг төсөөлж болно. Ажилдаа ирж, холбогдох програмыг ажиллуулж байгаа хүн стандарт арга барил (ангилах, бүлэглэх, арифметик үйлдлүүд хийх) ашиглан дүн шинжилгээ хийх ердийн тайлан, хяналтын самбараас гадна дараахь зөвлөмж, зөвлөмжийг олж хардаг. KPI, борлуулалтын тоонд хүрэхийн тулд та "Цэцэрлэгжүүлэлт" ангиллын бүтээгдэхүүнд хөнгөлөлт үзүүлэх ёстой. Нэмж дурдахад хүн корпорацийн мессенжертэй холбогдож болно: Skype, Slack гэх мэт. "Надад хамгийн ашигтай таван үйлчлүүлэгчийг өгөөч" гэсэн асуултыг роботоос асууж болно. Тохирох хариултыг авсны дараа тэрээр бизнесийн туршлага дээрээ үндэслэн хамгийн сайн шийдвэр гаргаж, компанид ашиг авчрах ёстой.

Хэрэв та нэг алхам ухарч, дүн шинжилгээ хийж буй мэдээллийн бүрэлдэхүүнийг харвал энэ үе шатанд нэмэлт аналитик бүтээгдэхүүнүүд хүмүүсийн амьдралыг хөнгөвчлөх боломжтой. Хамгийн тохиромжтой нь хэрэглэгч зөвхөн аналитик бүтээгдэхүүнийг хүссэн мэдээллийн эх сурвалж руу чиглүүлэх шаардлагатай бөгөөд програм нь өөрөө өгөгдлийн загвар үүсгэх, хүснэгтүүдийг холбох болон үүнтэй төстэй ажлуудыг хариуцах болно гэж үздэг.

Энэ бүхэн нь юуны түрүүнд мэдээллийн "ардчилал" -ыг хангах ёстой, жишээлбэл. Аливаа хүн компанид байгаа бүхэл бүтэн мэдээллийг шинжлэх боломжтой. Шийдвэр гаргах үйл явцыг статистикийн шинжилгээний аргаар дэмжих ёстой. Өгөгдөл хандалтын хугацаа хамгийн бага байх ёстой тул скрипт болон SQL асуулга бичих шаардлагагүй. Мэдээжийн хэрэг, та өндөр цалинтай Data Science мэргэжилтнүүдэд мөнгө хэмнэх боломжтой.

Таамаглалаар технологи нь бизнесийн хувьд маш тод ирээдүйг санал болгодог.

Том өгөгдлийг юу орлож байна вэ?

Гэхдээ үнэндээ би нийтлэлээ Big Data-аас эхлүүлсэн. Би энэ сэдвийг орчин үеийн BI хэрэглүүрүүдтэй товч танилцахгүйгээр хөгжүүлэх боломжгүй байсан бөгөөд үүний үндэс нь ихэвчлэн Big Data юм. Том өгөгдлийн хувь заяа одоо тодорхой тодорхойлогдсон бөгөөд энэ нь үүлэн технологи юм. Одоо аналитик систем болгоны ард үүлэн хадгалах сан, үүлэн үйлчилгээ нь BI-г урд талын төгсгөл болгож байгааг харуулахын тулд би BI үйлдвэрлэгчидтэй хийсэн гүйлгээнд анхаарлаа хандуулсан.

ORACLE, Microsoft зэрэг мэдээллийн сангийн салбар дахь тулгуур багануудыг мартаж болохгүй, тэдний сонгосон бизнесийн хөгжлийн чиглэлийг тэмдэглэх нь зүйтэй бөгөөд энэ бол үүл юм. Санал болгож буй бүх үйлчилгээг үүлэн дотроос олох боломжтой боловч зарим үүлэн үйлчилгээг газар дээр нь ашиглах боломжгүй болсон. Тэд машин сургалтын загваруудыг ашиглах талаар томоохон ажил хийж, хэрэглэгчдэд нээлттэй номын санг бий болгож, загвар сонгохоос эхлээд эхлэх цагийг тохируулах хүртэл ажиллахад хялбар интерфейсүүдийг тохируулсан.

Үйлдвэрлэгчдийн хэлж буй үүлэн үйлчилгээг ашиглах бас нэг чухал давуу тал бол сургалтын загварт зориулж ямар ч сэдвээр бараг хязгааргүй мэдээллийн багц ашиглах боломжтой байдаг.

Гэсэн хэдий ч манай улсад үүлэн технологи хэр зэрэг хөгжих вэ гэсэн асуулт гарч ирнэ.

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх