Бүгінде сыртқы әлеммен сыртқы байланысы жоқ адамдар ғана үлкен деректер туралы естімеген. Хабреде Үлкен деректерді талдау тақырыбы және оған қатысты тақырыптар танымал. Бірақ өздерін үлкен деректерді зерттеуге арнағысы келетін маман емес адамдар үшін бұл саланың қандай перспективалары бар, Big Data аналитикасын қайда қолдануға болатыны және жақсы талдаушы неге сене алатыны әрқашан анық емес. Оны анықтауға тырысайық.
Адам шығаратын ақпарат көлемі жыл сайын артып келеді. 2020 жылға қарай сақталған деректер көлемі 40-44 зеттабайтқа дейін артады (1 ЗБ ~ 1 млрд ГБ). 2025 жылға қарай – шамамен 400 зеттабайтқа дейін. Тиісінше, заманауи технологияларды пайдалана отырып, құрылымдық және құрылымданбаған деректерді басқару барған сайын маңызды болып келе жатқан сала болып табылады. Жеке компаниялар да, тұтас елдер де үлкен деректерге қызығушылық танытады.
Айтпақшы, ақпараттық бум мен адам жасаған деректерді өңдеу әдістерін талқылау кезінде Big Data термині пайда болды. Оны алғаш рет 2008 жылы Nature журналының редакторы Клиффорд Линч ұсынған деп есептеледі.
Содан бері үлкен деректер нарығы жыл сайын бірнеше ондаған пайызға артып келеді. Ал бұл үрдіс, сарапшылардың пікірінше, әлі де жалғаса бермек. Осылайша, компанияның бағалауы бойынша
Неліктен бізге үлкен деректерді талдау керек?
Ол құрылымдық немесе құрылымдалмаған деректер жиынынан өте құнды ақпаратты анықтауға мүмкіндік береді. Осының арқасында бизнес, мысалы, тенденцияларды анықтай алады, өндіріс өнімділігін болжайды және өз шығындарын оңтайландырады. Шығындарды азайту үшін компаниялар соңғы шешімдерді енгізуге дайын екені анық.
Үлкен деректерді талдау үшін қолданылатын технологиялар мен талдау әдістері:
- Мәліметтерді өндіру;
- краудсорсинг;
- деректерді араластыру және біріктіру;
- машиналық оқыту;
- жасанды нейрондық желілер;
- үлгіні тану;
- болжамды талдау;
- имитациялық модельдеу;
- кеңістіктік талдау;
- статистикалық талдау;
- аналитикалық мәліметтерді визуализациялау.
Әлемдегі үлкен деректердің аналитикасы
Үлкен деректерді талдауды қазір бүкіл әлем бойынша компаниялардың 50%-дан астамы пайдаланады. 2015 жылы бұл көрсеткіш небәрі 17 пайызды құрағанына қарамастан. Үлкен деректерді телекоммуникация және қаржылық қызметтер секторында жұмыс істейтін компаниялар белсенді түрде пайдаланады. Одан кейін денсаулық сақтау технологиясына маманданған компаниялар бар. Білім беру компанияларында Big Data аналитикасын минималды пайдалану: көп жағдайда осы саланың өкілдері жақын арада технологияны қолдану ниеттерін жариялады.
Америка Құрама Штаттарында Big Data аналитикасы ең белсенді қолданылады: әртүрлі салалардағы компаниялардың 55% -дан астамы осы технологиямен жұмыс істейді. Еуропа мен Азияда үлкен деректердің аналитикасына сұраныс әлдеқайда төмен емес – шамамен 53%.
Ресейде ше?
IDC сарапшыларының пікірінше,
Көп жағдайда нарықтың бұл қарқынды дамуы Ресейдегі осы аймақтың өсуіне байланысты. 2018 жылы Ресей Федерациясында тиісті шешімдерді сатудан түскен кіріс бүкіл аймақтағы үлкен деректерді өңдеу технологияларына салынған жалпы инвестицияның 40% құрады.
Ресей Федерациясында үлкен деректерді өңдеуге ең көп қаражатты банктік және мемлекеттік секторлар, телекоммуникациялар және өнеркәсіп компаниялары жұмсайды.
Үлкен деректер талдаушысы не істейді және ол Ресейде қанша алады?
Үлкен деректер талдаушысы жартылай құрылымдалған және құрылымдалмаған ақпараттың үлкен көлемін зерттеуге жауапты. Банктік ұйымдар үшін бұл транзакциялар, операторлар үшін - қоңыраулар мен трафик, бөлшек саудада - клиенттерге бару және сатып алу. Жоғарыда айтылғандай, Үлкен деректерді талдау «шикі ақпарат тарихындағы» әртүрлі факторлардың, мысалы, өндірістік процесс немесе химиялық реакция арасындағы байланыстарды табуға мүмкіндік береді. Талдау деректеріне сүйене отырып, өндірістен медицинаға дейін әртүрлі салаларда жаңа тәсілдер мен шешімдер әзірленеді.
Үлкен деректер талдаушысы үшін қажетті дағдылар:
- Талдау жүргізілетін аймақтың ерекшеліктерін тез түсіну және қажетті аймақтың аспектілеріне ену мүмкіндігі. Бұл бөлшек сауда, мұнай-газ өнеркәсібі, медицина және т.б. болуы мүмкін.
- Статистикалық мәліметтерді талдау әдістерін білу, математикалық модельдерді құру (нейрондық желілер, Байес желілері, кластерлеу, регрессия, факторлық, дисперсиялық және корреляциялық талдаулар және т.б.).
- Әртүрлі көздерден деректерді алу, талдау үшін түрлендіру және аналитикалық дерекқорға жүктей алу.
- SQL тілін жетік меңгерген.
- Техникалық құжаттарды оңай оқу үшін жеткілікті деңгейде ағылшын тілін білу.
- Python (ең болмағанда негіздері), Bash (жұмыс процесінде онсыз істеу өте қиын) тілдерін білу, сонымен қатар Java және Scala негіздерін (Spark белсенді пайдалану үшін қажет, олардың бірі үлкен деректермен жұмыс істеуге арналған ең танымал фреймворктар).
- Hadoop-пен жұмыс істеу мүмкіндігі.
Үлкен деректер талдаушысы қанша алады?
Үлкен деректер мамандары қазір тапшы; сұраныс ұсыныстан асып түседі. Себебі, бизнес түсіністікке келе жатыр: даму жаңа технологияларды, ал технологияны дамыту үшін мамандар қажет.
Сонымен, АҚШ-тағы Data Scientist және Data Analytics
Ресейде машиналық оқыту мамандары айына 130-дан 300 мың рубльге дейін, үлкен деректер талдаушылары - айына 73-тен 200 мың рубльге дейін алады. Мұның бәрі тәжірибе мен біліктілікке байланысты. Әрине, жалақысы аз бос орындар бар, ал басқалары жоғары. Мәскеу мен Санкт-Петербургтегі үлкен деректер талдаушыларына максималды сұраныс. Мәскеу, бұл таңқаларлық емес, белсенді бос орындардың шамамен 50% құрайды (hh.ru деректері бойынша). Минск пен Киевте сұраныс әлдеқайда аз. Айта кету керек, кейбір бос орындар икемді сағаттар мен қашықтықтан жұмысты ұсынады. Бірақ жалпы компанияларға кеңседе жұмыс істейтін мамандар қажет.
Уақыт өте келе біз Big Data талдаушыларына және сәйкес мамандықтардың өкілдеріне сұраныстың артатынын күтуге болады. Жоғарыда айтылғандай, технология саласындағы кадр тапшылығы жойылған жоқ. Бірақ, әрине, Big Data талдаушысы болу үшін жоғарыда аталған дағдыларды да, қосымшаларды да жетілдіре отырып, оқу және жұмыс істеу керек. Үлкен деректер талдаушысының жолын бастау мүмкіндіктерінің бірі
Ақпарат көзі: www.habr.com