Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

Саяхан гарсан нийтлэл, энэ нь сүүлийн жилүүдэд машин сургалтын сайн хандлагыг харуулж байна. Товчхондоо: сүүлийн хоёр жилд машин сургалтын стартапуудын тоо огцом буурчээ.

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?
За. "Бөмбөлөг хагарсан эсэх", "хэрхэн үргэлжлүүлэн амьдрах вэ" гэсэн асуултуудыг авч үзээд, энэ гулсалт хаанаас үүссэн талаар ярилцъя.

Эхлээд энэ муруйн өдөөгч нь юу байсан талаар ярилцъя. Тэр хаанаас ирсэн бэ? Тэд магадгүй бүх зүйлийг санаж байх болно ялалт 2012 онд ImageNet тэмцээнд машин сургалтын . Эцсийн эцэст энэ бол дэлхийн анхны арга хэмжээ юм! Гэвч бодит байдал дээр энэ нь тийм биш юм. Мөн муруйн өсөлт нь арай эрт эхэлдэг. Би үүнийг хэд хэдэн зүйл болгон задлах болно.

  1. 2008 онд "том өгөгдөл" гэсэн нэр томъёо гарч ирэв. Жинхэнэ бүтээгдэхүүнүүд эхэлсэн гарч ирнэ 2010 оноос хойш. Том өгөгдөл нь машин сурахтай шууд холбоотой. Том өгөгдөлгүйгээр тухайн үед байсан алгоритмуудыг тогтвортой ажиллуулах боломжгүй юм. Мөн эдгээр нь мэдрэлийн сүлжээ биш юм. 2012 он хүртэл мэдрэлийн сүлжээ нь ахиу цөөнхийн хадгалагдаж байсан. Гэвч дараа нь олон жил, бүр хэдэн арван жилийн турш оршин байсан огт өөр алгоритмууд ажиллаж эхлэв. SVM(1963,1993), Санамсаргүй ой (1995) AdaBoost (2003),... Тэр жилүүдийн гарааны бизнесүүд нь үндсэндээ бүтэцлэгдсэн өгөгдлийг автоматаар боловсруулахтай холбоотой байдаг: кассын машин, хэрэглэгчид, зар сурталчилгаа гэх мэт.

    Энэхүү эхний долгионы дериватив нь XGBoost, CatBoost, LightGBM гэх мэт олон тооны хүрээ юм.

  2. 2011-2012 онд эргэлтийн мэдрэлийн сүлжээ зураг таних хэд хэдэн тэмцээнд түрүүлсэн. Тэдний бодит хэрэглээ бага зэрэг хойшлогдсон. 2014 оноос асар их ач холбогдолтой стартапууд болон шийдлүүд гарч эхэлсэн гэж би хэлмээр байна. Нейронууд ажиллаж байгааг шингээж, боломжийн хугацаанд суулгаж, ажиллуулж болохуйц тохиромжтой хүрээг бий болгож, нэгдэх хугацааг тогтворжуулж, хурдасгах аргуудыг боловсруулахад хоёр жил зарцуулсан.

    Эвлэлийн сүлжээнүүд нь компьютерийн харааны асуудлыг шийдвэрлэх боломжийг олгосон: зураг дээрх зураг, объектыг ангилах, объект илрүүлэх, объект, хүмүүсийг таних, дүрсийг сайжруулах гэх мэт.

  3. 2015-2017 он. Тогтмол сүлжээнүүд эсвэл тэдгээрийн аналогууд (LSTM, GRU, TransformerNet гэх мэт) дээр суурилсан алгоритм ба төслүүдийн өсөлт. Сайн ажилладаг ярианаас текст рүү шилжих алгоритмууд болон машин орчуулгын системүүд гарч ирэв. Эдгээр нь үндсэн шинж чанаруудыг гаргаж авахын тулд хэсэгчлэн эвхэгддэг сүлжээн дээр суурилдаг. Бид үнэхээр том, сайн мэдээллийн багц цуглуулж сурсантай холбоотой.

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

"Хөөс хагарсан уу? Хэт их шуугиан тарьж байна уу? Тэд блокчлон болж үхсэн үү?"
Үгүй бол! Маргааш Сири таны утсан дээр ажиллахаа больж, маргааш нь Тесла эргэлт ба имж хоёрын ялгааг мэдэхгүй.

Мэдрэлийн сүлжээнүүд аль хэдийн ажиллаж байна. Тэд олон арван төхөөрөмжид байдаг. Тэд үнэхээр мөнгө олох, зах зээл болон эргэн тойрныхоо ертөнцийг өөрчлөх боломжийг олгодог. Hype арай өөр харагдаж байна:

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

Зүгээр л мэдрэлийн сүлжээ шинэ зүйл байхаа больсон. Тийм ээ, олон хүмүүс өндөр хүлээлттэй байдаг. Гэвч маш олон компани нейроныг ашиглаж, түүн дээр суурилсан бүтээгдэхүүн үйлдвэрлэж сурсан. Нейронууд нь шинэ функцээр хангаж, ажлын байрыг цомхотгох, үйлчилгээний үнийг бууруулах боломжийг олгодог.

  • Үйлдвэрлэгч компаниуд үйлдвэрлэлийн шугамын согогийг шинжлэхийн тулд алгоритмуудыг нэгтгэж байна.
  • Малын фермүүд үнээ хянах системийг худалдаж авдаг.
  • Автомат комбайнууд.
  • Автомат дуудлагын төвүүд.
  • SnapChat дахь шүүлтүүрүүд. (за, ядаж хэрэгтэй зүйл!)

Гэхдээ хамгийн гол зүйл бол хамгийн тод биш: "Шинэ санаа байхгүй, эс тэгвээс тэд шууд хөрөнгө авчрахгүй." Мэдрэлийн сүлжээ нь олон арван асуудлыг шийдэж чадсан. Мөн тэд илүү ихийг шийдэх болно. Оршиж байсан бүх тодорхой санаанууд олон гарааны бизнесийг бий болгосон. Гэхдээ гадаргуу дээр байсан бүх зүйл аль хэдийн цуглуулагдсан байв. Сүүлийн хоёр жилийн хугацаанд би мэдрэлийн сүлжээг ашиглах нэг ч шинэ санаа олж чадаагүй. Ганц ч шинэ арга байхгүй (за яахав, GAN-тай холбоотой хэд хэдэн асуудал байна).

Мөн дараагийн эхлүүлэх бүр илүү төвөгтэй байдаг. Нээлттэй өгөгдөл ашиглан нейроныг сургадаг хоёр залуу шаардлагагүй болсон. Энэ нь програмистууд, сервер, маркеруудын баг, цогц дэмжлэг гэх мэтийг шаарддаг.

Үүний үр дүнд стартапууд цөөрч байна. Гэхдээ илүү их үйлдвэрлэл бий. Автомашины дугаар таних систем нэмэх шаардлагатай юу? Зах зээл дээр холбогдох туршлагатай олон зуун мэргэжилтнүүд байдаг. Та хэн нэгнийг ажилд авч болно, хоёр сарын дараа танай ажилтан системийг бий болгоно. Эсвэл бэлэн худалдаж аваарай. Гэхдээ шинэ гарааны бизнес хийж байна уу?.. Галзуу!

Та зочдыг хянах системийг бий болгох хэрэгтэй - 3-4 сарын дотор өөрөө хийх боломжтой байхад яагаад олон лицензийн төлбөрийг төлж, бизнесээ хурцалж өгөх хэрэгтэй.

Одоо мэдрэлийн сүлжээнүүд өөр хэдэн арван технологийн туулсан замаар явж байна.

1995 оноос хойш "вэбсайт хөгжүүлэгч" гэсэн ойлголт хэрхэн өөрчлөгдсөнийг та санаж байна уу? Зах зээл нь мэргэжилтнүүдээр хараахан ханааагүй байна. Маш цөөхөн мэргэжлийн хүмүүс байна. Гэхдээ 5-10 жилийн дараа Java программист болон мэдрэлийн сүлжээ хөгжүүлэгч хоёрын хооронд тийм ч их ялгаа байхгүй гэдэгт би мөрийцөж чадна. Зах зээл дээр хоёр мэргэжилтэн хангалттай байх болно.

Зүгээр л мэдрэлийн эсүүдээр шийдэж болох нэг төрлийн асуудал байх болно. Даалгавар гарч ирэв - мэргэжилтэн ажилд авна уу.

"Дараа нь юу юм? Амласан хиймэл оюун ухаан хаана байна?”

Гэхдээ энд жижиг боловч сонирхолтой үл ойлголцол байна :)

Өнөөдөр байгаа технологийн стек нь биднийг хиймэл оюун ухаан руу хөтлөхгүй бололтой. Санаанууд болон тэдгээрийн шинэлэг зүйл нь өөрсдийгөө барагдуулсан. Өнөөгийн хөгжлийн төвшинд юу байгаа талаар ярилцъя.

Хязгаарлалтууд

Өөрийгөө жолооддог машинуудаас эхэлье. Өнөөгийн технологиор бүрэн бие даасан машин хийх боломжтой гэдэг нь тодорхой харагдаж байна. Гэхдээ хэдэн жилийн дараа ийм зүйл болох нь тодорхойгүй байна. Энэ нь хэдхэн жилийн дараа болно гэж Тесла итгэж байна.


Өөр олон бий мэргэжилтнүүд, хэн үүнийг 5-10 жил гэж тооцоолж байна.

Миний бодлоор 15 жилийн дараа хотуудын дэд бүтэц өөрөө өөрчлөгдөж, бие даасан автомашин бий болох нь гарцаагүй болж, түүний үргэлжлэл болох байх. Гэхдээ үүнийг оюун ухаан гэж үзэж болохгүй. Орчин үеийн Тесла бол өгөгдлийг шүүх, хайх, давтан сургах маш нарийн төвөгтэй хоолой юм. Эдгээр нь дүрэм-дүрэм-дүрэм, мэдээлэл цуглуулах, тэдгээрийн шүүлтүүр (энд энд Би энэ талаар бага зэрэг бичсэн, эсвэл эндээс үзээрэй энэ нь тэмдэг).

Эхний асуудал

Энэ бол бидний харж байгаа газар юм анхны үндсэн асуудал. Их мэдээлэл. Энэ нь мэдрэлийн сүлжээ, машин сургалтын өнөөгийн давалгааг төрүүлсэн зүйл юм. Өнөө үед ямар нэг нарийн төвөгтэй, автомат зүйл хийхэд маш их өгөгдөл хэрэгтэй. Зөвхөн маш их биш, гэхдээ маш их. Тэдгээрийг цуглуулах, тэмдэглэх, ашиглахад автоматжуулсан алгоритм хэрэгтэй. Бид нарны өөдөөс харсан ачааны машинуудыг машинд харагдуулахыг хүсч байна - бид эхлээд хангалттай тооны цуглуулах ёстой. Бид машиныг их бие рүү бэхэлсэн унадаг дугуйгаар галзуурахгүй байхыг хүсч байна - илүү олон дээж.

Түүнээс гадна нэг жишээ хэлэхэд хангалтгүй. Хэдэн зуун уу? Мянга уу?

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

Хоёр дахь асуудал

Хоёр дахь асуудал - бидний мэдрэлийн сүлжээний ойлгосон зүйлийг дүрслэн харуулах. Энэ бол маш энгийн зүйл биш ажил юм. Өнөөг хүртэл цөөхөн хүн үүнийг хэрхэн төсөөлөхийг ойлгодог. Эдгээр нийтлэлүүд нь маш сүүлийн үеийнх бөгөөд эдгээр нь хол байсан ч цөөн хэдэн жишээ юм:
Дүрслэх бүтэцтэй холбоотой хүсэл эрмэлзэл. Энэ нь нейрон юун дээр төвлөрөх хандлагатай байгааг + эхлэлийн мэдээлэл гэж хүлээн зөвшөөрсөн зүйлийг сайн харуулдаг.

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?
Дүрслэх Анхаарал орчуулгууд. Үнэн хэрэгтээ таталцлыг ихэвчлэн сүлжээний ийм хариу үйлдэл хийснийг харуулахын тулд яг нарийн ашиглаж болно. Би дибаг хийх болон бүтээгдэхүүний шийдлүүдийн аль алинд нь ийм зүйлсийг харсан. Энэ сэдвээр маш олон нийтлэл байдаг. Гэхдээ өгөгдөл нь илүү төвөгтэй байх тусам найдвартай дүрслэлд хэрхэн хүрэхийг ойлгоход хэцүү байдаг.

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

За, тийм ээ, хуучин сайн багц "торон дотор юу байгааг хараарай шүүлтүүрүүд" Эдгээр зургууд нь 3-4 жилийн өмнө алдартай байсан ч хүн бүр зургууд нь үзэсгэлэнтэй гэдгийг хурдан ойлгосон боловч тэдгээр нь тийм ч их ач холбогдолгүй байв.

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

Сүлжээний дотоод байдлыг хэрхэн харуулах талаархи бусад олон арван хэрэгсэл, арга, хакерууд, судалгааны талаар би дурдаагүй. Эдгээр хэрэгслүүд ажилладаг уу? Асуудал юу болохыг хурдан ойлгож, сүлжээг дибаг хийхэд тусалдаг уу?.. Сүүлийн хувийг авах уу? За, энэ нь ойролцоогоор ижил байна:

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

Та Kaggle дээр ямар ч тэмцээн үзэх боломжтой. Мөн хүмүүс эцсийн шийдвэрээ хэрхэн гаргадаг тухай тайлбар. Бид 100-500-800 ширхэг загваруудыг давхарласан бөгөөд энэ нь амжилттай болсон!

Би мэдээж хэтрүүлж байна. Гэхдээ эдгээр аргууд нь хурдан бөгөөд шууд хариулт өгдөггүй.

Хангалттай туршлага хуримтлуулж, янз бүрийн хувилбаруудыг судалж үзсэнийхээ дараа таны систем яагаад ийм шийдвэр гаргасан талаар дүгнэлт хийж болно. Гэхдээ системийн зан үйлийг засахад хэцүү байх болно. Таяг суулгах, босгыг хөдөлгөх, датасет нэмэх, өөр арын сүлжээг авах.

Гурав дахь асуудал

Гурав дахь үндсэн асуудал - тор нь логик биш харин статистикийг заадаг. Статистикийн хувьд энэ нүүр царай:

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

Логикийн хувьд энэ нь тийм ч төстэй биш юм. Мэдрэлийн сүлжээ нь албадаагүй л бол нарийн төвөгтэй зүйлийг сурдаггүй. Тэд үргэлж хамгийн энгийн шинж тэмдгүүдийг заадаг. Чи нүд, хамар, толгойтой юу? Тэгэхээр энэ бол царай! Эсвэл нүд нь царай гэсэн үг биш жишээг өг. Мөн дахин - сая сая жишээ.

Доод талд маш их зай бий

Одоогоор мэдрэлийн сүлжээ болон машин сургалтын хөгжлийг хязгаарлаж байгаа эдгээр гурван дэлхийн асуудал гэж би хэлмээр байна. Эдгээр асуудлууд үүнийг хязгаарлаагүй бол аль хэдийн идэвхтэй ашиглагдаж байна.

Энэ бол төгсгөл? Мэдрэлийн сүлжээ ажиллаж байна уу?

Тодорхойгүй. Гэхдээ мэдээж хүн бүр тийм биш гэж найдаж байна.

Миний дээр онцолсон үндсэн асуудлыг шийдвэрлэх олон арга, чиглэл бий. Гэвч өнөөг хүртэл эдгээр аргуудын аль нь ч зарчмын хувьд шинэ зүйл хийх, шийдэгдээгүй байгаа зүйлийг шийдвэрлэх боломжийг олгосонгүй. Одоогийн байдлаар бүх үндсэн төслүүд тогтвортой арга барил (Tesla) дээр хийгдэж байна, эсвэл институт, корпорацуудын (Google Brain, OpenAI) туршилтын төслүүд хэвээр байна.

Товчхондоо, үндсэн чиглэл нь оролтын өгөгдлийн өндөр түвшний дүрслэлийг бий болгох явдал юм. Нэг ёсондоо "санах ой". Санах ойн хамгийн энгийн жишээ бол янз бүрийн "Суулгах" - зургийн дүрслэл юм. Жишээлбэл, царай таних бүх системүүд. Сүлжээ нь эргэлт, гэрэлтүүлэг, нягтралаас үл хамаарах тогтвортой дүрслэлийг царайнаас олж авч сурдаг. Үндсэндээ сүлжээ нь "өөр өөр царай хол байна" ба "ижил царай ойрхон байна" хэмжигдэхүүнийг багасгадаг.

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

Ийм сургалтанд хэдэн арван, хэдэн зуун мянган жишээ хэрэгтэй. Гэхдээ үр дүн нь "Нэг удаагийн сургалт"-ын зарим үндсэн ойлголтуудыг агуулдаг. Одоо бид хүнийг санахад хэдэн зуун царай хэрэггүй. Зөвхөн нэг нүүр царай, бид ийм л байна олж мэдэцгээе!
Ганц л асуудал байна... Сүлжээ нь маш энгийн объектуудыг л сурдаг. Нүүр царайг нь бус, жишээлбэл "хүмүүсийг хувцасаар нь" ялгах гэж оролдохдоо (даалгавар Дахин таних) - чанар нь хэд хэдэн дарааллаар буурдаг. Мөн сүлжээ нь өнцгийн тодорхой өөрчлөлтийг сурч чадахгүй.

Сая сая жишээнээс суралцах нь бас хөгжилтэй байдаг.

Сонгуулийг нэлээд багасгах ажил бий. Жишээлбэл, анхны бүтээлүүдийн нэгийг тэр даруй санаж болно OneShot суралцах Google-ээс:

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

Жишээ нь, ийм олон бүтээл бий 1 буюу 2 буюу 3.

Зөвхөн нэг хасах зүйл байдаг - ихэвчлэн "MNIST" гэсэн энгийн жишээн дээр сургалт сайн ажилладаг. Мөн нарийн төвөгтэй ажлууд руу шилжихэд танд том мэдээллийн сан, объектын загвар эсвэл ямар нэгэн ид шид хэрэгтэй болно.
Ер нь нэг удаагийн сургалтын ажил бол маш сонирхолтой сэдэв юм. Та маш олон санаа олдог. Гэхдээ ихэнх тохиолдолд миний жагсаасан хоёр асуудал (асар том өгөгдлийн багц дээр бэлтгэл хийх / нарийн төвөгтэй өгөгдөл дээр тогтворгүй байдал) суралцахад ихээхэн саад болдог.

Нөгөөтэйгүүр, GAN-ууд буюу үүсгэгч өрсөлдөгчийн сүлжээнүүд нь Embedding сэдэвт ойртдог. Та энэ сэдвээр Хабрегийн тухай олон нийтлэл уншсан байх. (1, 2,3)
GAN-ийн онцлог нь зарим дотоод төлөвийн орон зай (үндсэндээ ижил Embedding) үүсгэх явдал бөгөөд энэ нь танд зураг зурах боломжийг олгодог. Энэ нь байж болох юм нүүр царай, байж болно үйлдэл.

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

GAN-тай холбоотой асуудал бол үүсгэсэн объект илүү төвөгтэй байх тусам түүнийг "үүсгүүр-ялгаварлагч" логикоор дүрслэх нь илүү хэцүү байдаг. Үүний үр дүнд GAN-ийн цорын ганц бодит хэрэглээ бол DeepFake бөгөөд нүүрний дүрслэлийг дахин өөрчилдөг (үүнд асар их суурь бий).

Би бусад ашигтай хэрэглээг маш цөөхөн харсан. Ихэвчлэн зургуудыг дуусгахтай холбоотой ямар нэгэн заль мэх хийдэг.

Бас дахин. Энэ нь бидэнд хэрхэн гэрэлт ирээдүй рүү шилжих боломжийг олгохыг хэн ч мэдэхгүй. Мэдрэлийн сүлжээнд логик/орон зайг төлөөлөх нь сайн. Гэхдээ бидэнд маш олон жишээ хэрэгтэй, нейрон өөрөө үүнийг хэрхэн төлөөлдөгийг ойлгохгүй байна, нейроныг үнэхээр нарийн төвөгтэй санааг хэрхэн санагдуулахыг бид ойлгохгүй байна.

Арматурын сургалт - Энэ бол огт өөр чиглэлийн хандлага юм. Google Go-д хүн бүрийг хэрхэн ялсныг та санаж байгаа нь лавтай. Starcraft болон Dota-д саяхан ялалт байгуулсан. Гэхдээ энд бүх зүйл тийм ч ягаан, ирээдүйтэй зүйлээс хол байна. Тэрээр RL болон түүний нарийн төвөгтэй байдлын талаар хамгийн сайн ярьдаг энэ нийтлэл.

Зохиогчийн бичсэн зүйлийг товчхон дүгнэвэл:

  • Хайрцагнаас гарсан загварууд ихэнх тохиолдолд таарахгүй / муу ажилладаг
  • Практик асуудлыг өөр аргаар шийдвэрлэхэд хялбар байдаг. Boston Dynamics нь нарийн төвөгтэй/урьдчилан таамаглах боломжгүй/тооцооллын төвөгтэй байдлаас шалтгаалан RL ашигладаггүй.
  • RL ажиллахын тулд танд нарийн төвөгтэй функц хэрэгтэй. Энэ нь ихэвчлэн үүсгэх/бичихэд хэцүү байдаг
  • Загвар өмсөгчдийг сургахад хэцүү. Орон нутгийн оптимагаас гарахын тулд та маш их цаг зарцуулах хэрэгтэй
  • Үүний үр дүнд загварыг давтах нь хэцүү байдаг, загвар нь бага зэрэг өөрчлөлттэй тогтворгүй байдаг
  • Ихэнхдээ санамсаргүй тооны үүсгэгч хүртэл зарим төрлийн зүүн жигүүрийн хэв маягийг хэтрүүлдэг

Хамгийн гол зүйл бол RL нь үйлдвэрлэлд хараахан ажиллаагүй байгаа явдал юм. Google-д зарим туршилтууд байна ( 1, 2 ). Гэхдээ би нэг ч бүтээгдэхүүний системийг хараагүй.

Санах ойн. Дээр дурдсан бүх зүйлийн сул тал нь бүтэц дутагдалтай байдаг. Энэ бүхнийг цэгцлэх арга замуудын нэг бол мэдрэлийн сүлжээг тусдаа санах ойд нэвтрэх боломжийг олгох явдал юм. Ингэснээр тэр алхамынхаа үр дүнг тэмдэглэж, дахин бичих боломжтой болно. Дараа нь мэдрэлийн сүлжээг одоогийн санах ойн төлөвөөр тодорхойлж болно. Энэ нь сонгодог процессорууд болон компьютеруудтай маш төстэй юм.

Хамгийн алдартай, алдартай нийтлэл - DeepMind-аас:

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

Энэ нь оюун ухааныг ойлгох түлхүүр юм шиг санагддаг? Гэхдээ үгүй ​​байх. Систем нь сургалтын хувьд асар их хэмжээний өгөгдөл шаарддаг хэвээр байна. Мөн энэ нь үндсэндээ бүтэцлэгдсэн хүснэгтийн өгөгдөлтэй ажилладаг. Түүнээс гадна, Facebook шийдсэн үүнтэй төстэй асуудал тулгарвал тэд "санах ойг шургуулж, зүгээр л нейроныг илүү төвөгтэй болгож, илүү олон жишээтэй болго, тэгвэл тэр өөрөө сурах болно" гэсэн замыг сонгосон.

Салгах. Утгатай санах ойг бий болгох өөр нэг арга бол ижил суулгацыг авах явдал юм, гэхдээ сургалтын явцад тэдгээрийн "утга" -ыг тодруулах нэмэлт шалгууруудыг оруулаарай. Жишээлбэл, бид дэлгүүрт байгаа хүний ​​зан төлөвийг ялгах мэдрэлийн сүлжээг сургахыг хүсч байна. Хэрэв бид стандарт замаар явсан бол хэдэн арван сүлжээ хийх хэрэгтэй болно. Нэг нь хүн хайж байгаа, хоёр дахь нь юу хийж байгааг нь тодорхойлох, гурав дахь нь нас, дөрөв дэх нь хүйс. Тусдаа логик нь дэлгүүрийн үүнийг хийдэг/сургагдсан хэсгийг хардаг. Гурав дахь нь түүний замнал гэх мэтийг тодорхойлдог.

Эсвэл, хэрэв хязгааргүй тооны өгөгдөл байсан бол бүх боломжит үр дүнд зориулж нэг сүлжээг сургах боломжтой (мэдээжийн хэрэг, ийм массив өгөгдлийг цуглуулах боломжгүй).

Тайлбарлах арга нь бидэнд хэлдэг - сүлжээг өөрөө ухагдахууныг ялгах чадвартай болгохын тулд сургацгаая. Нэг хэсэг нь үйлдлийг тодорхойлж, цаг хугацаанд нь шалан дээр байгаа байрлалыг, нэг хүний ​​өндрийг, нэг нь хүйсийг тодорхойлох видео бичлэг дээр тулгуурлан шигтгээ үүсгэх болно. Үүний зэрэгцээ, сургалт хийхдээ би сүлжээг ийм үндсэн ойлголтоор сурталчлахгүй, харин хэсэг хэсгүүдийг тодруулж, бүлэглэхийг хүсч байна. Ийм цөөн хэдэн нийтлэл байдаг (тэдгээрийн зарим нь 1, 2, 3) ба ерөнхийдөө тэд нэлээд онолын шинж чанартай байдаг.

Гэхдээ энэ чиглэл нь наад зах нь онолын хувьд эхэнд дурдсан асуудлуудыг хамрах ёстой.

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

"хананы өнгө/шалны өнгө/объектын хэлбэр/объектийн өнгө/ гэх мэт" параметрийн дагуу зургийн задрал.

Машин сурах хөөс хагарсан уу, эсвэл шинэ үүрийн эхлэл үү?

"Хэмжээ, хөмсөг, чиг баримжаа, арьсны өнгө гэх мэт" параметрийн дагуу нүүрний задаргаа.

Бусад

Өгөгдлийн санг ямар нэгэн байдлаар багасгах, илүү олон төрлийн бус өгөгдөлтэй ажиллах гэх мэт бусад олон, тийм ч глобал биш газрууд байдаг.

Анхаар. Үүнийг тусдаа арга гэж салгах нь утгагүй байх. Зүгээр л бусдыг сайжруулдаг арга. Олон нийтлэл түүнд зориулагдсан болно (1,2,3). Анхаарах зүйл бол сургалтын явцад чухал объектуудад сүлжээний хариу үйлдлийг сайжруулах явдал юм. Ихэнхдээ ямар нэгэн гадаад зорилтот тэмдэглэгээ, эсвэл жижиг гадаад сүлжээгээр.

3D симуляци. Хэрэв та сайн 3D хөдөлгүүр хийвэл сургалтын өгөгдлийн 90% -ийг бүрхэж болно (Би тэр ч байтугай өгөгдлийн бараг 99% нь сайн хөдөлгүүрт хамрагдсан жишээг харсан). 3D хөдөлгүүр дээр сургагдсан сүлжээг бодит өгөгдөл (нарийн тохируулга, хэв маяг дамжуулах гэх мэт) ашиглан хэрхэн ажиллуулах талаар олон санаа, хакерууд байдаг. Гэхдээ сайн хөдөлгүүр хийх нь мэдээлэл цуглуулахаас хэд хэдэн удаа илүү хэцүү байдаг. Хөдөлгүүр хийсэн үеийн жишээ:
Робот сургалт (Гүүгл, тархины цэцэрлэг)
Сургалтын үеэр хүлээн зөвшөөрөх дэлгүүрт байгаа бараа (гэхдээ бидний хийсэн хоёр төсөлд бид үүнгүйгээр амархан хийсэн).
Тесла дахь сургалт (дахин дээрх видео).

үр дүн нь

Нийтлэл бүхэлдээ нэг ёсондоо дүгнэлт юм. Магадгүй миний хэлэхийг хүссэн гол мессеж бол "үнэгүй зүйлс дууслаа, нейронууд энгийн шийдлүүдийг өгөхөө больсон" гэсэн байсан. Одоо бид цогц шийдвэр гаргахын тулд шаргуу ажиллах хэрэгтэй. Эсвэл шинжлэх ухааны нарийн төвөгтэй судалгаа хийж шаргуу хөдөлмөрлө.

Ерөнхийдөө энэ сэдэв маргаантай байдаг. Магадгүй уншигчдад илүү сонирхолтой жишээнүүд байгаа болов уу?

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх