Үлкен деректерді талдау - Ресейдегі және әлемдегі шындықтар мен перспективалар

Үлкен деректерді талдау - Ресейдегі және әлемдегі шындықтар мен перспективалар

Бүгінде сыртқы әлеммен сыртқы байланысы жоқ адамдар ғана үлкен деректер туралы естімеген. Хабреде Үлкен деректерді талдау тақырыбы және оған қатысты тақырыптар танымал. Бірақ өздерін үлкен деректерді зерттеуге арнағысы келетін маман емес адамдар үшін бұл саланың қандай перспективалары бар, Big Data аналитикасын қайда қолдануға болатыны және жақсы талдаушы неге сене алатыны әрқашан анық емес. Оны анықтауға тырысайық.

Адам шығаратын ақпарат көлемі жыл сайын артып келеді. 2020 жылға қарай сақталған деректер көлемі 40-44 зеттабайтқа дейін артады (1 ЗБ ~ 1 млрд ГБ). 2025 жылға қарай – шамамен 400 зеттабайтқа дейін. Тиісінше, заманауи технологияларды пайдалана отырып, құрылымдық және құрылымданбаған деректерді басқару барған сайын маңызды болып келе жатқан сала болып табылады. Жеке компаниялар да, тұтас елдер де үлкен деректерге қызығушылық танытады.

Айтпақшы, ақпараттық бум мен адам жасаған деректерді өңдеу әдістерін талқылау кезінде Big Data термині пайда болды. Оны алғаш рет 2008 жылы Nature журналының редакторы Клиффорд Линч ұсынған деп есептеледі.

Содан бері үлкен деректер нарығы жыл сайын бірнеше ондаған пайызға артып келеді. Ал бұл үрдіс, сарапшылардың пікірінше, әлі де жалғаса бермек. Осылайша, компанияның бағалауы бойынша Аяз және Салливан 2021 жылы үлкен деректерді талдаудың жалпы әлемдік нарығы 67,2 миллиард долларға дейін өседі, жылдық өсім шамамен 35,9% құрайды.

Неліктен бізге үлкен деректерді талдау керек?

Ол құрылымдық немесе құрылымдалмаған деректер жиынынан өте құнды ақпаратты анықтауға мүмкіндік береді. Осының арқасында бизнес, мысалы, тенденцияларды анықтай алады, өндіріс өнімділігін болжайды және өз шығындарын оңтайландырады. Шығындарды азайту үшін компаниялар соңғы шешімдерді енгізуге дайын екені анық.

Үлкен деректерді талдау үшін қолданылатын технологиялар мен талдау әдістері:

  • Мәліметтерді өндіру;
  • краудсорсинг;
  • деректерді араластыру және біріктіру;
  • машиналық оқыту;
  • жасанды нейрондық желілер;
  • үлгіні тану;
  • болжамды талдау;
  • имитациялық модельдеу;
  • кеңістіктік талдау;
  • статистикалық талдау;
  • аналитикалық мәліметтерді визуализациялау.

Әлемдегі үлкен деректердің аналитикасы

Үлкен деректерді талдауды қазір бүкіл әлем бойынша компаниялардың 50%-дан астамы пайдаланады. 2015 жылы бұл көрсеткіш небәрі 17 пайызды құрағанына қарамастан. Үлкен деректерді телекоммуникация және қаржылық қызметтер секторында жұмыс істейтін компаниялар белсенді түрде пайдаланады. Одан кейін денсаулық сақтау технологиясына маманданған компаниялар бар. Білім беру компанияларында Big Data аналитикасын минималды пайдалану: көп жағдайда осы саланың өкілдері жақын арада технологияны қолдану ниеттерін жариялады.

Америка Құрама Штаттарында Big Data аналитикасы ең белсенді қолданылады: әртүрлі салалардағы компаниялардың 55% -дан астамы осы технологиямен жұмыс істейді. Еуропа мен Азияда үлкен деректердің аналитикасына сұраныс әлдеқайда төмен емес – шамамен 53%.

Ресейде ше?

IDC сарапшыларының пікірінше, Ресей - үлкен деректерді талдау шешімдерінің ең ірі аймақтық нарығы. Орталық және Шығыс Еуропада мұндай шешімдер нарығының өсуі айтарлықтай белсенді, бұл көрсеткіш жыл сайын 11%-ға артады. 2022 жылға қарай ол сандық түрде 5,4 миллиард долларға жетеді.

Көп жағдайда нарықтың бұл қарқынды дамуы Ресейдегі осы аймақтың өсуіне байланысты. 2018 жылы Ресей Федерациясында тиісті шешімдерді сатудан түскен кіріс бүкіл аймақтағы үлкен деректерді өңдеу технологияларына салынған жалпы инвестицияның 40% құрады.

Ресей Федерациясында үлкен деректерді өңдеуге ең көп қаражатты банктік және мемлекеттік секторлар, телекоммуникациялар және өнеркәсіп компаниялары жұмсайды.

Үлкен деректер талдаушысы не істейді және ол Ресейде қанша алады?

Үлкен деректер талдаушысы жартылай құрылымдалған және құрылымдалмаған ақпараттың үлкен көлемін зерттеуге жауапты. Банктік ұйымдар үшін бұл транзакциялар, операторлар үшін - қоңыраулар мен трафик, бөлшек саудада - клиенттерге бару және сатып алу. Жоғарыда айтылғандай, Үлкен деректерді талдау «шикі ақпарат тарихындағы» әртүрлі факторлардың, мысалы, өндірістік процесс немесе химиялық реакция арасындағы байланыстарды табуға мүмкіндік береді. Талдау деректеріне сүйене отырып, өндірістен медицинаға дейін әртүрлі салаларда жаңа тәсілдер мен шешімдер әзірленеді.

Үлкен деректер талдаушысы үшін қажетті дағдылар:

  • Талдау жүргізілетін аймақтың ерекшеліктерін тез түсіну және қажетті аймақтың аспектілеріне ену мүмкіндігі. Бұл бөлшек сауда, мұнай-газ өнеркәсібі, медицина және т.б. болуы мүмкін.
  • Статистикалық мәліметтерді талдау әдістерін білу, математикалық модельдерді құру (нейрондық желілер, Байес желілері, кластерлеу, регрессия, факторлық, дисперсиялық және корреляциялық талдаулар және т.б.).
  • Әртүрлі көздерден деректерді алу, талдау үшін түрлендіру және аналитикалық дерекқорға жүктей алу.
  • SQL тілін жетік меңгерген.
  • Техникалық құжаттарды оңай оқу үшін жеткілікті деңгейде ағылшын тілін білу.
  • Python (ең болмағанда негіздері), Bash (жұмыс процесінде онсыз істеу өте қиын) тілдерін білу, сонымен қатар Java және Scala негіздерін (Spark белсенді пайдалану үшін қажет, олардың бірі үлкен деректермен жұмыс істеуге арналған ең танымал фреймворктар).
  • Hadoop-пен жұмыс істеу мүмкіндігі.

Үлкен деректер талдаушысы қанша алады?

Үлкен деректер мамандары қазір тапшы; сұраныс ұсыныстан асып түседі. Себебі, бизнес түсіністікке келе жатыр: даму жаңа технологияларды, ал технологияны дамыту үшін мамандар қажет.

Сонымен, АҚШ-тағы Data Scientist және Data Analytics 3 жылдың үздік 2017 мамандығының қатарына енді Glassdoor рекрутингтік агенттігінің мәліметі бойынша. Америкадағы бұл мамандардың орташа жалақысы жылына 100 мың доллардан басталады.

Ресейде машиналық оқыту мамандары айына 130-дан 300 мың рубльге дейін, үлкен деректер талдаушылары - айына 73-тен 200 мың рубльге дейін алады. Мұның бәрі тәжірибе мен біліктілікке байланысты. Әрине, жалақысы аз бос орындар бар, ал басқалары жоғары. Мәскеу мен Санкт-Петербургтегі үлкен деректер талдаушыларына максималды сұраныс. Мәскеу, бұл таңқаларлық емес, белсенді бос орындардың шамамен 50% құрайды (hh.ru деректері бойынша). Минск пен Киевте сұраныс әлдеқайда аз. Айта кету керек, кейбір бос орындар икемді сағаттар мен қашықтықтан жұмысты ұсынады. Бірақ жалпы компанияларға кеңседе жұмыс істейтін мамандар қажет.

Уақыт өте келе біз Big Data талдаушыларына және сәйкес мамандықтардың өкілдеріне сұраныстың артатынын күтуге болады. Жоғарыда айтылғандай, технология саласындағы кадр тапшылығы жойылған жоқ. Бірақ, әрине, Big Data талдаушысы болу үшін жоғарыда аталған дағдыларды да, қосымшаларды да жетілдіре отырып, оқу және жұмыс істеу керек. Үлкен деректер талдаушысының жолын бастау мүмкіндіктерінің бірі Geekbrains курсына жазылыңыз және үлкен деректермен жұмыс істеуге тырысыңыз.

Ақпарат көзі: www.habr.com

пікір қалдыру