MLOps: Maşın Öyrənmə dünyasında DevOps

2018-ci ildə MLOps konsepsiyası peşəkar dairələrdə və süni intellektə həsr olunmuş tematik konfranslarda peyda oldu, bu, sürətlə sənayedə yerini aldı və indi müstəqil bir istiqamət kimi inkişaf edir. Gələcəkdə MLOps İT sahəsində ən populyar sahələrdən birinə çevrilə bilər. Bu nədir və nə ilə yeyilir?Gəlin aşağıda öyrənək.

MLOps: Maşın Öyrənmə dünyasında DevOps

MLOps nədir

MLOps (maşın öyrənməsi texnologiyalarını və prosesləri və işlənmiş modelləri biznes proseslərinə tətbiq etmək üçün yanaşmaları birləşdirən) süni intellekt sistemlərinin yaradılması zamanı biznes nümayəndələri, alimlər, riyaziyyatçılar, maşın öyrənmə mütəxəssisləri və İT mühəndisləri arasında əməkdaşlığın yeni üsuludur.

Başqa sözlə, bu, maşın öyrənmə üsullarını və texnologiyalarını biznes problemlərinin həlli üçün faydalı bir vasitəyə çevirməyin bir yoludur. 

Anlamaq lazımdır ki, məhsuldarlıq zənciri modelin hazırlanmasından çox əvvəl başlayır. Onun ilk addımı biznes problemini, məlumatlardan çıxarıla bilən dəyər haqqında fərziyyəni və onu tətbiq etmək üçün biznes ideyasını müəyyən etməkdir. 

MLOps konsepsiyasının özü maşın öyrənmə modelləri və texnologiyaları ilə bağlı DevOps konsepsiyasına bənzətmə kimi yaranmışdır. DevOps bir sıra yanaşmalardan, o cümlədən davamlı inkişaf, funksiyaların bir sıra müstəqil mikroservislərə bölünməsi, avtomatlaşdırılmış sınaq və fərdi proqramların yerləşdirilməsi də daxil olmaqla, çeviklik və etibarlılığı qoruyaraq fərdi dəyişikliklərin həyata keçirilməsi sürətini artırmağa imkan verən proqram təminatının hazırlanmasına yanaşmadır. dəyişikliklər, qlobal sağlamlıq monitorinqi, aşkar edilmiş nasazlıqlara sürətli reaksiya sistemi və s. 

DevOps proqram təminatının həyat dövrünü müəyyən etdi və cəmiyyət eyni metodologiyanı böyük verilənlərə tətbiq etmək ideyası ilə çıxış etdi. DataOps müxtəlif və qarşılıqlı fəaliyyət göstərən platformalarda böyük həcmdə məlumatların saxlanması, ötürülməsi və emalı xüsusiyyətlərini nəzərə alaraq metodologiyanı uyğunlaşdırmaq və genişləndirmək cəhdidir.
  
Müəssisələrin iş proseslərində həyata keçirilən maşın öyrənmə modellərinin müəyyən kritik kütləsinin meydana çıxması ilə riyazi maşın öyrənmə modellərinin həyat dövrü ilə proqram təminatının həyat dövrü arasında güclü oxşarlıq müşahidə edildi. Yeganə fərq, model alqoritmlərinin maşın öyrənmə alətləri və metodlarından istifadə etməklə yaradılmasıdır. Buna görə də, təbii olaraq, maşın öyrənmə modelləri üçün proqram təminatının hazırlanmasına artıq məlum yanaşmaları tətbiq etmək və uyğunlaşdırmaq ideyası yarandı. Beləliklə, maşın öyrənmə modellərinin həyat dövründə aşağıdakı əsas mərhələləri ayırd etmək olar:

  • biznes ideyasının müəyyənləşdirilməsi;
  • model təlimi;
  • modelin sınaqdan keçirilməsi və biznes prosesinə tətbiqi;
  • modelin işləməsi.

Əməliyyat zamanı modeli yeni məlumatlar üzrə dəyişdirmək və ya yenidən hazırlamaq zərurəti yarandıqda, dövr yenidən başlayır - model təmizlənir, sınaqdan keçirilir və yeni versiya yerləşdirilir.

Geri çəkilmək. Niyə yenidən hazırlanmalı və yenidən hazırlanmamalıdır? "Modellərin yenidən hazırlanması" termini ikiqat məna daşıyır: ekspertlər arasında bu, model yaxşı proqnozlaşdırdıqda, təlim dəstində proqnozlaşdırılan parametri faktiki olaraq təkrarlayan, lakin xarici məlumat nümunəsində daha pis performans göstərən bir model qüsuru deməkdir. Təbii ki, belə bir model qüsurdur, çünki bu qüsur onun istifadəsinə imkan vermir.

Bu həyat dövründə DevOps alətlərindən istifadə etmək məntiqli görünür: avtomatlaşdırılmış sınaq, yerləşdirmə və monitorinq, ayrıca mikroservislər şəklində model hesablamalarının layihələndirilməsi. Lakin əlavə ML bağlaması olmadan bu vasitələrin birbaşa istifadəsinə mane olan bir sıra xüsusiyyətlər də var.

MLOps: Maşın Öyrənmə dünyasında DevOps

Modelləri necə işlətmək və qazanc əldə etmək olar

MLOps yanaşmasının istifadəsini nümayiş etdirəcəyimiz bir nümunə olaraq, bir bank (və ya hər hansı digər) məhsul üçün söhbət dəstəyini robotlaşdırmaq kimi klassik tapşırığı götürəcəyik. Tipik olaraq, söhbət dəstəyi iş prosesi belə görünür: müştəri söhbətdə sualı olan mesaja daxil olur və əvvəlcədən təyin edilmiş dialoq ağacında mütəxəssisdən cavab alır. Belə bir söhbətin avtomatlaşdırılması vəzifəsi, bir qayda olaraq, inkişaf etdirilməsi və saxlanması çox əmək tələb edən mütəxəssis tərəfindən müəyyən edilmiş qaydalar toplusundan istifadə etməklə həll edilir. Bu cür avtomatlaşdırmanın səmərəliliyi tapşırığın mürəkkəblik səviyyəsindən asılı olaraq 20-30% ola bilər. Təbii ki, belə bir fikir yaranır ki, süni intellekt modulunu - maşın öyrənməsindən istifadə etməklə hazırlanmış modeli tətbiq etmək daha sərfəlidir.

  • operatorun iştirakı olmadan daha çox sayda sorğunu emal edə bilir (mövzudan asılı olaraq, bəzi hallarda səmərəlilik 70-80% -ə çata bilər);
  • dialoqda qeyri-standart ifadələrə daha yaxşı uyğunlaşır - aydın şəkildə ifadə olunmayan sorğu əsasında istifadəçinin niyyətini, real istəyini müəyyən etməyi bacarır;
  • modelin cavabının adekvat olduğunu və bu cavabın "məlumatlılığına" şübhə yarandıqda və əlavə aydınlaşdırıcı sual vermək və ya operatora keçmək lazım olduqda necə təyin edəcəyini bilir;
  • əlavə olaraq avtomatik olaraq öyrədilə bilər (cavab skriptlərini daim uyğunlaşdıran və düzəldən bir qrup tərtibatçı əvəzinə, model müvafiq maşın öyrənmə kitabxanalarından istifadə edərək Məlumat Elmi mütəxəssisi tərəfindən əlavə olaraq öyrədilir). 

MLOps: Maşın Öyrənmə dünyasında DevOps

Belə inkişaf etmiş bir modeli necə işləmək olar? 

Hər hansı digər problemin həllində olduğu kimi, belə bir modulu inkişaf etdirməzdən əvvəl, bir iş prosesini müəyyənləşdirmək və maşın öyrənmə metodundan istifadə edərək həll edəcəyimiz konkret vəzifəni rəsmi şəkildə təsvir etmək lazımdır. Bu nöqtədə Ops abbreviaturası ilə təyin olunan əməliyyatlaşdırma prosesi başlayır. 

Növbəti addım Data Scientist-in Data Engineer ilə əməkdaşlıqda məlumatların mövcudluğunu və kifayət qədərliyini və biznes ideyasının həyat qabiliyyətinə dair biznes fərziyyəsini yoxlayır, prototip modelini hazırlayır və onun faktiki effektivliyini sınaqdan keçirir. Yalnız biznes tərəfindən təsdiq edildikdən sonra modelin hazırlanmasından onun konkret biznes prosesini həyata keçirən sistemlərə inteqrasiyasına keçid başlaya bilər. Başdan sona həyata keçirmə planlaması, modelin necə istifadə ediləcəyi və onun hansı iqtisadi effekt verəcəyi ilə bağlı hər mərhələdə dərin anlayış, şirkətin texnoloji mənzərəsinə MLOps yanaşmalarının tətbiqi proseslərində əsas məqamdır.

Süni intellekt texnologiyalarının inkişafı ilə maşın öyrənməsindən istifadə etməklə həll edilə bilən problemlərin sayı və müxtəlifliyi eksponent olaraq artır. Hər bir belə biznes prosesi kütləvi işçilərin əməyinin avtomatlaşdırılması (çağrı mərkəzi, sənədlərin yoxlanılması və çeşidlənməsi və s.) hesabına şirkət üçün qənaətdir, yeni cəlbedici və rahat funksiyalar əlavə etməklə müştəri bazasının genişləndirilməsidir, o, onların optimal istifadəsi və resursların yenidən bölüşdürülməsi hesabına pula qənaət edir və s. Son nəticədə istənilən proses dəyər yaratmağa yönəlib və nəticədə müəyyən iqtisadi effekt verməlidir. Burada biznes ideyasını dəqiq formalaşdırmaq və şirkətin ümumi dəyər yaratma strukturunda modeli həyata keçirməkdən gözlənilən mənfəəti hesablamaq çox vacibdir. Modelin həyata keçirilməsinin özünü doğrultmadığı hallar var və maşın öyrənməsi mütəxəssislərinin sərf etdiyi vaxt bu işi yerinə yetirən operatorun iş yerindən daha bahalıdır. Odur ki, süni intellekt sistemlərinin yaradılmasının ilkin mərhələlərində belə halları müəyyən etməyə çalışmaq lazımdır.

Nəticə etibarı ilə, modellər yalnız MLOps prosesində biznes problemi düzgün tərtib edildikdə, prioritetlər müəyyən edildikdə və inkişafın ilkin mərhələlərində modelin sistemə daxil edilməsi prosesi formalaşdıqda mənfəət əldə etməyə başlayır.

Yeni proses - yeni çağırışlar

ML modellərinin problemlərin həllində necə tətbiq oluna biləcəyi ilə bağlı fundamental biznes sualına hərtərəfli cavab, AI-yə ümumi etibar məsələsi MLOps yanaşmalarının hazırlanması və tətbiqi prosesində əsas problemlərdən biridir. İlkin olaraq, müəssisələr maşın öyrənməsinin proseslərə tətbiqinə şübhə ilə yanaşırlar - əvvəllər, bir qayda olaraq, insanların işlədiyi yerlərdə modellərə etibar etmək çətindir. Biznes üçün proqramlar “qara qutu” kimi görünür, aktuallığı hələ də sübuta yetirilməlidir. Bundan əlavə, bank işində, telekommunikasiya operatorlarının biznesində və digərlərində dövlət tənzimləyicilərinin ciddi tələbləri var. Bank proseslərində tətbiq olunan bütün sistemlər və alqoritmlər auditə məruz qalır. Bu problemi həll etmək, biznesə və tənzimləyicilərə süni intellekt cavablarının etibarlılığını və düzgünlüyünü sübut etmək üçün modellə yanaşı monitorinq alətləri də tətbiq edilir. Bundan əlavə, tənzimləyici modellər üçün məcburi olan, Mərkəzi Bankın tələblərinə cavab verən müstəqil qiymətləndirmə proseduru mövcuddur. Müstəqil ekspert qrupu daxil olan məlumatları nəzərə alaraq modelin əldə etdiyi nəticələri yoxlayır.

İkinci problem maşın öyrənmə modelini həyata keçirərkən model risklərinin qiymətləndirilməsi və nəzərə alınmasıdır. İnsan həmin paltarın ağ və ya mavi olması sualına yüz faiz əminliklə cavab verə bilməsə belə, süni intellektin də səhv etmək hüququ var. Məlumatların zamanla dəyişə biləcəyini də nəzərə almağa dəyər və kifayət qədər dəqiq nəticə əldə etmək üçün modellər yenidən hazırlanmalıdır. Biznes prosesinin əziyyət çəkməməsini təmin etmək üçün model risklərini idarə etmək və modelin işinə nəzarət etmək, onu mütəmadi olaraq yeni məlumatlar üzrə yenidən hazırlamaq lazımdır.

MLOps: Maşın Öyrənmə dünyasında DevOps

Amma inamsızlığın birinci mərhələsindən sonra əks effekt özünü göstərməyə başlayır. Proseslərə nə qədər çox model uğurla tətbiq edilərsə, biznesin süni intellektdən istifadə iştahı bir o qədər artır - maşın öyrənmə metodlarından istifadə etməklə həll edilə bilən yeni və yeni problemlər tapılır. Hər bir tapşırıq müəyyən səlahiyyətlər tələb edən bütöv bir prosesi tetikler:

  • məlumat mühəndisləri məlumatları hazırlayır və emal edir;
  • məlumat alimləri maşın öyrənmə vasitələrindən istifadə edir və model hazırlayır;
  • İT modeli sistemə tətbiq edir;
  • ML mühəndisi bu modeli prosesə necə düzgün inteqrasiya edəcəyini, sorğuların axını, cavab müddəti və s. nəzərə alaraq, modelin tətbiqi rejiminə olan tələblərdən asılı olaraq hansı İT alətlərindən istifadə edəcəyini müəyyənləşdirir. 
  • ML memarı bir proqram məhsulunun sənaye sistemində fiziki olaraq necə həyata keçirilə biləcəyini dizayn edir.

Bütün dövrə çoxlu sayda yüksək ixtisaslı mütəxəssislər tələb edir. ML modellərinin iş proseslərinə inkişafının və nüfuzunun müəyyən bir nöqtəsində, tapşırıqların sayının artmasına mütənasib olaraq mütəxəssislərin sayını xətti miqyaslandırmanın bahalı və səmərəsiz olduğu ortaya çıxır. Buna görə də, MLOps prosesinin avtomatlaşdırılması sualı yaranır - maşın öyrənmə problemlərinin bir neçə standart siniflərinin müəyyən edilməsi, standart məlumatların emalı boru kəmərlərinin hazırlanması və modellərin əlavə təlimi. İdeal bir şəkildə, bu cür problemlərin həlli Big Data, Data Science, DevOps və IT-nin kəsişməsində eyni dərəcədə bacarıqlı mütəxəssislər tələb edir. Buna görə də, Data Science sənayesindəki ən böyük problem və MLOps proseslərinin təşkilində ən böyük problem mövcud təlim bazarında belə bir səriştənin olmamasıdır. Bu tələblərə cavab verən mütəxəssislər hazırda əmək bazarında nadir hallarda rast gəlinir və öz çəkisini qızılla qiymətləndirirlər.

Bacarıqlar məsələsinə dair

Teorik olaraq, bütün MLOps tapşırıqları klassik DevOps alətlərindən istifadə etməklə və rol modelinin ixtisaslaşmış genişləndirilməsinə müraciət etmədən həll edilə bilər. Sonra, yuxarıda qeyd etdiyimiz kimi, məlumat alimi təkcə riyaziyyatçı və məlumat analitiki deyil, həm də bütün boru kəmərinin guru olmalıdır - o, arxitekturanın işlənib hazırlanmasına, memarlıqdan asılı olaraq bir neçə dildə proqramlaşdırma modellərinin hazırlanmasına cavabdehdir. data market və tətbiqin özünü yerləşdirmə. Bununla belə, end-to-end MLOps prosesində həyata keçirilən texnoloji bazanın yaradılması əmək xərclərinin 80%-ni tələb edir ki, bu da o deməkdir ki, keyfiyyətli Data Scientist olan ixtisaslı riyaziyyatçı vaxtının yalnız 20%-ni ixtisasına həsr edəcək. . Buna görə də, maşın öyrənmə modellərinin tətbiqi prosesində iştirak edən mütəxəssislərin rollarının müəyyənləşdirilməsi həyati əhəmiyyət kəsb edir. 

Rolların nə qədər təfərrüatlı şəkildə təsvir edilməsi müəssisənin ölçüsündən asılıdır. Bir başlanğıcın öz mühəndisi, memarı və DevOps olan bir mütəxəssisi, enerji ehtiyatında çalışqan bir işçisi varsa, bu bir şeydir. Böyük bir müəssisədə bütün model inkişaf prosesləri bir neçə yüksək səviyyəli Data Science mütəxəssisi üzərində cəmləşdiyi halda, proqramçı və ya verilənlər bazası mütəxəssisi - əmək bazarında daha çox yayılmış və daha az xərc tələb edən bir səriştə - bu, tamamilə fərqli bir məsələdir. işin çoxunda.müntəzəm işlərdə.

Beləliklə, hazırlanmış modellərin sürəti və keyfiyyəti, komandanın məhsuldarlığı və içindəki mikroiqlim birbaşa MLOps prosesini dəstəkləmək üçün mütəxəssislərin seçilməsində sərhədin harada yerləşməsindən və hazırlanmış modellərin istismarı prosesinin necə təşkil olunduğundan asılıdır. .

Komandamız artıq nə edib

Biz bu yaxınlarda səriştə strukturu və MLOps prosesləri qurmağa başladıq. Lakin modelin həyat dövrünün idarə edilməsi və modellərdən xidmət kimi istifadə üzrə layihələrimiz artıq MVP test mərhələsindədir.

Biz həmçinin böyük bir müəssisə üçün optimal səlahiyyət strukturunu və prosesin bütün iştirakçıları arasında qarşılıqlı əlaqənin təşkilati strukturunu müəyyən etdik. Bütün biznes müştəriləri üçün problemləri həll etmək üçün çevik komandalar təşkil edildi və tikilməkdə olan MLOps binasının əsasını təşkil edən platformalar və infrastruktur yaratmaq üçün layihə qrupları ilə qarşılıqlı əlaqə prosesi quruldu.

Gələcək üçün suallar

MLOps, səriştələrin çatışmazlığı ilə üzləşən və gələcəkdə təcil qazanacaq inkişaf edən bir sahədir. Bu arada, DevOps inkişafları və təcrübələri üzərində qurmaq daha yaxşıdır. MLOps-un əsas məqsədi biznes problemlərini həll etmək üçün ML modellərindən daha səmərəli istifadə etməkdir. Ancaq bu, bir çox sual doğurur:

  • Modellərin istehsala buraxılması üçün vaxtı necə azaltmaq olar?
  • Müxtəlif səlahiyyətlərə malik komandalar arasında bürokratik sürtüşməni necə azaltmaq və əməkdaşlığa diqqəti artırmaq olar?
  • Modelləri necə izləmək, versiyaları idarə etmək və effektiv monitorinqi necə təşkil etmək olar?
  • Müasir ML modeli üçün həqiqətən dairəvi həyat dövrü necə yaradılır?
  • Maşın öyrənmə prosesini necə standartlaşdırmaq olar?

Bu sualların cavabları əsasən MLO-ların tam potensialına nə qədər tez çatacağını müəyyən edəcək.

Mənbə: www.habr.com

Добавить комментарий