Том Адрон Коллайдер ба Одноклассники

Habré дээрх машин сургалтын тэмцээний сэдвийг үргэлжлүүлэхийн тулд бид уншигчдад дахин хоёр платформыг танилцуулахыг хүсч байна. Тэд мэдээж kaggle шиг том биш, гэхдээ тэд мэдээж анхаарал хандуулах ёстой.

Том Адрон Коллайдер ба Одноклассники

Би хувьдаа хэд хэдэн шалтгааны улмаас kaggle-д тийм ч их дургүй байдаг:

  • нэгдүгээрт, тэнд тэмцээнүүд ихэвчлэн хэдэн сар үргэлжилдэг бөгөөд идэвхтэй оролцох нь маш их хүчин чармайлт шаарддаг;
  • хоёрдугаарт, нийтийн цөм (нийтийн шийдэл). Kaggle-ийн шүтэн бишрэгчид тэдэнд Төвдийн лам нарын тайван зангаар хандахыг зөвлөдөг ч бодит байдал дээр таны нэг, хоёр сарын турш зүтгэсэн зүйл гэнэт хүн бүрт зориулж мөнгөн таваг дээр тавигдах нь үнэхээр ичмээр юм.

Аз болоход машин сургалтын тэмцээн бусад платформ дээр явагддаг бөгөөд эдгээр тэмцээний хэд хэдэн талаар хэлэлцэх болно.

IDAO SNA Hackathon 2019
Албан ёсны хэл: Англи,
Зохион байгуулагчид: Yandex, Sberbank, HSE
Албан ёсны орос хэл,
Зохион байгуулагчид: Mail.ru групп
Онлайн шат: 15 оны 11-р сарын 2019 - XNUMX-р сарын XNUMX;
Талбай дээрх эцсийн хугацаа: 4 оны 6-р сарын 2019-XNUMX
онлайн - 7-р сарын 15-оос XNUMX-р сарын XNUMX хүртэл;
офлайн - 30-р сарын 1-аас XNUMX-р сарын XNUMX хүртэл.
Том адрон коллайдер дахь бөөмийн тухай тодорхой багц өгөгдлийг (траектор, импульс болон бусад нэлээд төвөгтэй физик үзүүлэлтүүд) ашиглан энэ нь мюон мөн эсэхийг тодорхойлох.
Энэхүү мэдэгдлээс 2 ажлыг тодорхойлсон:
- нэгд та зөвхөн таамаглалаа илгээх ёстой байсан,
- нөгөө талаар - урьдчилан таамаглах бүрэн код, загвар, гүйцэтгэл нь ажиллах хугацаа, санах ойн ашиглалтад нэлээд хатуу хязгаарлалттай байсан.
SNA Hackathon тэмцээний хувьд 2018 оны XNUMX-XNUMX-р саруудад хэрэглэгчийн мэдээний сувгийн нээлттэй бүлгүүдийн агуулгын дэлгэцийн бүртгэлийг цуглуулсан. Туршилтын багц нь XNUMX-р сарын сүүлийн долоо хоног хагасыг агуулдаг. Бүртгэлийн оруулга бүр нь юу үзүүлсэн, хэнд үзүүлсэн, мөн хэрэглэгч энэ контентод хэрхэн хандсан тухай мэдээллийг агуулдаг: үүнийг үнэлж, сэтгэгдэл бичсэн, үл тоомсорлосон эсвэл тэжээлээс нуусан.
SNA Hackathon-ийн даалгаврын мөн чанар нь Одноклассники нийгмийн сүлжээний хэрэглэгч бүрийг өөрийн сувгаар эрэмбэлж, "анги" авах нийтлэлүүдийг аль болох өндөр болгох явдал юм.
Онлайн шатанд даалгаврыг 3 хэсэгт хуваасан.
1. албан тушаалыг хамтын ажиллагааны янз бүрийн шинж чанараар нь эрэмбэлэх
2. нийтлэлүүдийг агуулж буй зургаар нь эрэмблэх
3. бичлэгүүдийг агуулагдаж буй бичвэрийн дагуу эрэмбэлэх
ROC-AUC гэх мэт нарийн төвөгтэй захиалгат хэмжүүр Хэрэглэгчийн дундаж ROC-AUC
Эхний шатны шагнал - N байрын подволк, тэмцээний үеэр байр, хоолыг төлсөн хоёрдугаар шат руу орох
Хоёр дахь үе шат - ??? (Тодорхой шалтгааны улмаас би шагнал гардуулах ёслолд оролцоогүй бөгөөд эцэст нь ямар шагнал авсан талаар олж мэдэх боломжгүй байсан). Тэд ялагч багийн бүх гишүүдэд зөөврийн компьютер амласан
Эхний шатны шагналууд - 100 шилдэг оролцогчийн подволк, хоёрдугаар шатанд шилжих, Москва руу аялах, тэмцээний үеэр байрлах байр, хоолны зардлыг төлсөн. Мөн эхний шатны төгсгөлд 3-р шатанд 1 даалгаврын шилдэгт шалгарсан шагналуудыг зарлав: бүгд RTX 2080 TI видео карт хожлоо!
Хоёрдахь шат нь багийн шат бөгөөд 2-5 хүнээс бүрдсэн багууд, шагналууд:
1-р байр - 300 рубль
2-р байр - 200 рубль
3-р байр - 100 рубль
шүүгчдийн шагнал - 100 рубль
Албан ёсны телеграмын бүлэг, ~190 оролцогч, англи хэлээр харилцах, асуултууд хариултаа хэдэн өдөр хүлээх шаардлагатай байв Telegram дахь албан ёсны бүлэг, ~1500 оролцогч, оролцогчид болон зохион байгуулагчдын хооронд даалгаврын идэвхтэй хэлэлцүүлэг
Зохион байгуулагчид энгийн болон дэвшилтэт хоёр үндсэн шийдлийг гаргаж өгсөн. Энгийн нь 16 ГБ-аас бага RAM шаарддаг бөгөөд дэвшилтэт санах ой нь 16-д багтдаггүй. Үүний зэрэгцээ, бага зэрэг урагшаа харахад оролцогчид дэвшилтэт шийдлээс мэдэгдэхүйц давж чадаагүй байна. Эдгээр шийдлүүдийг эхлүүлэхэд хүндрэл гараагүй. Дэвшилтэт жишээн дээр шийдлийг сайжруулахын тулд хаанаас эхлэх тухай зөвлөмжтэй тайлбар байсан гэдгийг тэмдэглэх нь зүйтэй. Оролцогчид амархан давж гарсан даалгавар тус бүрийн үндсэн энгийн шийдлүүдийг өгсөн. Тэмцээний эхний өдрүүдэд оролцогчид хэд хэдэн бэрхшээлтэй тулгарсан: нэгдүгээрт, өгөгдлийг Apache Parquet форматаар өгсөн бөгөөд Python болон паркетан багцын бүх хослол алдаагүй ажиллаагүй. Хоёрдахь бэрхшээл бол шуудангийн үүлнээс зураг татаж авах явдал байсан бөгөөд одоогоор их хэмжээний өгөгдлийг нэг дор татаж авах хялбар арга байхгүй байна. Үүний үр дүнд эдгээр асуудлууд оролцогчдыг хоёр хоногоор хойшлуулав.

IDAO. Эхний шат

Даалгавар нь мюон/мюон бус бөөмсийг шинж чанараар нь ангилах явдал байв. Энэхүү даалгаврын гол онцлог нь сургалтын мэдээлэлд жингийн багана байгаа нь зохион байгуулагчид өөрсдөө энэ шугамын хариултанд итгэлтэй байна гэж тайлбарлав. Асуудал нь нэлээд хэдэн эгнээ сөрөг жин агуулсан байсан юм.

Том Адрон Коллайдер ба Одноклассники

Сануулга бүхий шугамын талаар хэдэн минут бодсоны дараа (зөвхөн жингийн баганын энэ шинж чанарыг анхаарч үзсэн) энэ графикийг бий болгосны дараа бид 3 сонголтыг шалгахаар шийдсэн:

1) сөрөг жинтэй шугамын зорилтот хэсгийг (түүний дагуу жинг) эргүүлнэ
2) жинг 0-ээс эхлэхийн тулд хамгийн бага утга руу шилжүүлнэ
3) утсан жинг бүү ашигла

Гурав дахь хувилбар нь хамгийн муу нь болсон боловч эхний хоёр нь үр дүнг сайжруулсан, хамгийн сайн нь №1 хувилбар байсан бөгөөд энэ нь биднийг эхний даалгаварт одоогийн хоёрдугаар байранд, хоёрдугаарт нэгдүгээр байранд авав.
Том Адрон Коллайдер ба Одноклассники
Бидний дараагийн алхам бол алга болсон утгуудын өгөгдлийг шалгах явдал байв. Зохион байгуулагчид бидэнд хэд хэдэн дутуу утгууд байсан самнасан өгөгдлийг өгсөн бөгөөд тэдгээрийг -9999-ээр сольсон.

Бид зөвхөн N=2 эсвэл 3 байх үед MatchedHit_{X,Y,Z}[N] болон MatchedHit_D{X,Y,Z}[N] баганад дутуу утгыг олсон. Бидний ойлгож байгаагаар зарим бөөмс олдсонгүй. бүх 4 мэдрэгчийг дамжуулж, 3 эсвэл 4-р хавтан дээр зогссон. Өгөгдөл нь мөн Lextra_{X,Y}[N] багануудыг агуулж байсан бөгөөд тэдгээр нь MatchedHit_{X,Y,Z}[N]-тэй ижил зүйлийг тодорхойлсон боловч зарим төрлийн экстраполяци ашигладаг. Эдгээр өчүүхэн таамаглалууд нь Lextra_{X,Y}[N]-г MatchedHit_{X,Y,Z}[N]-д дутуу утгуудыг (зөвхөн X ба Y координатуудад) орлуулах боломжтой гэж үзсэн. MatchedHit_Z[N] медианаар сайн дүүрсэн. Эдгээр заль мэх нь бидэнд хоёр даалгаврын дунд 1-р байранд орох боломжийг олгосон.

Том Адрон Коллайдер ба Одноклассники

Эхний шатанд ялахын тулд тэд юу ч өгөөгүй гэж үзвэл бид тэнд зогсоож болох байсан, гэхдээ бид үргэлжлүүлж, хэдэн сайхан зураг зурж, шинэ боломжуудыг гаргаж ирэв.

Том Адрон Коллайдер ба Одноклассники

Жишээлбэл, хэрэв бид дөрвөн детекторын хавтан тус бүртэй бөөмийн огтлолцлын цэгүүдийг зурвал хавтан тус бүрийн цэгүүдийг 5-4 харьцаатай 5 тэгш өнцөгт болгон бүлэглэж, төвлөрсөн цэг дээр байрлуулсан болохыг олж мэдсэн. цэг (0,0) ба эхний тэгш өнцөгтийн цэг байхгүй байна.

Хавтангийн дугаар / тэгш өнцөгт хэмжээ 1 2 3 4 5
Хавтан 1 500h625 1000h1250 2000h2500 4000h5000 8000h10000
Хавтан 2 520h650 1040h1300 2080h2600 4160h5200 8320h10400
Хавтан 3 560h700 1120h1400 2240h2800 4480h5600 8960h11200
Хавтан 4 600h750 1200h1500 2400h3000 4800h6000 9600h12000

Эдгээр хэмжээсийг тодорхойлсны дараа бид бөөмс бүрийн хувьд 4 шинэ ангиллын шинж чанарыг нэмсэн - хавтан бүрийг огтолж буй тэгш өнцөгтийн дугаар.

Том Адрон Коллайдер ба Одноклассники

Мөн бөөмс төвөөсөө хажуу тийшээ сарниж байгаа мэт санагдаж, энэ тархалтын "чанар"-ыг ямар нэгэн байдлаар үнэлэх санаа төрсөн гэдгийг бид анзаарсан. Хамгийн тохиромжтой нь хөөрөх цэгээс хамааран ямар нэгэн "хамгийн тохиромжтой" параболыг гаргаж, түүнээс хазайлтыг тооцоолох боломжтой байсан ч бид "хамгийн тохиромжтой" шулуун шугамаар хязгаарлалаа. Оролтын цэг бүрийн хувьд ийм тохиромжтой шулуун шугамуудыг байгуулсны дараа бид энэ шулуун шугамаас бөөмс бүрийн траекторийн стандарт хазайлтыг тооцоолж чадсан. Зорилтот = 1-ийн дундаж хазайлт 152, зорилтот = 0-ийн хувьд 390 байсан тул бид энэ онцлогийг сайн гэж урьдчилсан байдлаар үнэлэв. Үнэн хэрэгтээ энэ функц нь тэр даруйдаа хамгийн хэрэгцээтэй зүйлсийн жагсаалтад орсон.

Бид баяртай байсан бөгөөд бөөмс бүрийн хамгийн тохиромжтой шулуун шугамаас бүх 4 огтлолцлын цэгийн хазайлтыг нэмэлт 4 шинж чанар болгон нэмсэн (мөн тэд бас сайн ажилласан).

Зохион байгуулагчдын бидэнд өгсөн уралдааны сэдвээр шинжлэх ухааны нийтлэлүүдийн холбоосууд нь бид энэ асуудлыг шийдэх анхныхаас хол байгаа бөгөөд магадгүй ямар нэгэн тусгай програм хангамж байдаг гэсэн санааг төрүүлэв. Github дээр IsMuonSimple, IsMuon, IsMuonLoose аргууд хэрэгжсэн репозиторийг олж мэдээд бид тэдгээрийг бага зэргийн өөрчлөлтөөр сайт руугаа шилжүүлсэн. Аргууд нь өөрөө маш энгийн байсан: жишээлбэл, хэрэв энерги нь тодорхой босго хэмжээнээс бага бол энэ нь мюон биш, харин мюон юм. Ийм энгийн функцууд нь градиентийг нэмэгдүүлэх боломжийг нэмэгдүүлэх боломжгүй байсан тул бид босгон дээр өөр нэг чухал "зай" нэмсэн. Эдгээр функцуудыг мөн бага зэрэг сайжруулсан. Магадгүй одоо байгаа аргуудыг илүү нарийвчлан шинжлэх замаар илүү хүчтэй аргуудыг олж, тэмдгүүдэд нэмэх боломжтой байсан байх.

Тэмцээний төгсгөлд бид хоёр дахь асуудлын "хурдан" шийдлийг бага зэрэг өөрчилсөн бөгөөд эцэст нь энэ нь үндсэн хувилбараас дараахь зүйлээр ялгаатай байв.

  1. Сөрөг жинтэй эгнээнд зорилтыг урвуулав
  2. MatchedHit_{X,Y,Z}[N]-д дутуу утгыг бөглөсөн
  3. Гүнийг 7 хүртэл бууруулсан
  4. Сурах хурдыг 0.1 болгон бууруулсан (0.19 байсан)

Үүний үр дүнд бид илүү олон функцуудыг туршиж үзсэн (тийм ч амжилттай биш), параметрүүдийг сонгож, catboost, lightgbm болон xgboost-ыг сургаж, янз бүрийн таамаглалыг хослуулан туршиж үзсэн бөгөөд хувийн тохиргоог нээхээс өмнө бид хоёр дахь даалгавраа итгэлтэйгээр ялж, эхний даалгаврын нэг болсон. удирдагчид.

Хувийн ангиа нээгээд 10-р даалгавраар 1-р байр, 3-р даалгавраар XNUMX-р байранд орсон. Бүх дарга нар хоорондоо холилдож, хувийн тоглолтын хурд нь libboard дээрхээс илүү байв. Өгөгдөл нь муу давхаргатай байсан (эсвэл хувийн мэдээлэлд сөрөг жинтэй мөр байхгүй байсан) бөгөөд энэ нь бага зэрэг урам хугарсан бололтой.

SNA Hackathon 2019 - Текстүүд. Эхний шат

Даалгавар нь Одноклассники нийгмийн сүлжээн дэх хэрэглэгчдийн нийтлэлийг агуулагдаж буй текст дээр үндэслэн эрэмбэлэх явдал байв; текстээс гадна нийтлэлийн хэд хэдэн шинж чанарууд (хэл, эзэмшигч, үүсгэсэн огноо, цаг, үзсэн огноо, цаг) байсан. ).

Тексттэй ажиллах сонгодог арга барилын хувьд би хоёр сонголтыг онцлон тэмдэглэх болно.

  1. Үг бүрийг ижил төстэй векторуудтай байхаар n хэмжээст вектор орон зайд буулгах (дэлгэрэнгүй уншина уу бидний нийтлэл), дараа нь текстийн дундаж үгийг олох эсвэл үгсийн харьцангуй байрлалыг харгалзан үзэх механизмуудыг ашиглах (CNN, LSTM/GRU).
  2. Бүхэл бүтэн өгүүлбэртэй шууд ажиллах боломжтой загваруудыг ашиглах. Жишээлбэл, Берт. Онолын хувьд энэ арга нь илүү сайн ажиллах ёстой.

Энэ бол миний тексттэй анхны туршлага байсан тул хэн нэгэнд заах нь буруу байх тул би өөрөө заах болно. Тэмцээний эхэнд миний өөртөө өгөх зөвлөмжүүд:

  1. Ямар нэгэн зүйл заахаар гүйхээсээ өмнө өгөгдлийг хар! Текстээс гадна өгөгдөл нь хэд хэдэн баганатай байсан бөгөөд тэдгээрээс надаас хамаагүй илүү шахаж авах боломжтой байсан. Хамгийн энгийн зүйл бол зарим баганын хувьд зорилтот кодчилол хийх явдал юм.
  2. Бүх өгөгдлөөс суралцах хэрэггүй! Маш олон өгөгдөл (17 сая орчим мөр) байсан бөгөөд таамаглалыг шалгахын тулд бүгдийг нь ашиглах шаардлагагүй байв. Сургалт, урьдчилсан боловсруулалт нэлээд удаан байсан бөгөөд надад илүү сонирхолтой таамаглалуудыг туршиж үзэх цаг гарах байсан нь ойлгомжтой.
  3. <Маргаантай зөвлөгөө> Алуурчин загвар хайх шаардлагагүй. Би Элмо, Берт хоёрыг нэн даруй өндөр газар аваачна гэж найдан удаан хугацааны туршид олж мэдсэний үр дүнд би FastText-ийг орос хэл дээр урьдчилан бэлтгэсэн суулгацыг ашигласан. Би Элмотой илүү сайн хурдалж чадахгүй байсан бөгөөд Берттэй хамт үүнийг олох цаг байсангүй.
  4. <Маргаантай зөвлөгөө> Нэг алуурчин шинж чанарыг хайх шаардлагагүй. Өгөгдлийг харахад текстийн 1 орчим хувь нь текст агуулаагүй болохыг би анзаарсан! Гэхдээ зарим эх сурвалжуудын холбоосууд байсан бөгөөд би сайтыг нээж, гарчиг, тайлбарыг гаргаж авсан энгийн задлан шинжлэгч бичсэн. Энэ нь сайн санаа юм шиг санагдаж байсан ч дараа нь би сэтгэлээр унасан бөгөөд бүх текстийн бүх холбоосыг задлан шинжлэхээр шийдэж, дахин их цаг алдсан. Энэ бүхэн эцсийн үр дүнд мэдэгдэхүйц ахиц гарсангүй (хэдийгээр би жишээлбэл, гацсан гэж үзсэн).
  5. Сонгодог онцлогууд ажилладаг. Жишээлбэл, бид Google-ийн "текстийн онцлогуудыг kaggle", уншиж, бүгдийг нь нэмдэг. TF-IDF нь текстийн урт, үг, цэг таслал зэрэг статистик үзүүлэлтүүдийг сайжруулсан.
  6. Хэрэв DateTime багана байгаа бол тэдгээрийг хэд хэдэн тусдаа шинж чанарт (цаг, долоо хоногийн өдрүүд гэх мэт) задлах нь зүйтэй. Аль онцлогийг тодруулах ёстойг график/зарим хэмжүүр ашиглан шинжлэх хэрэгтэй. Энд би дураараа бүх зүйлийг зөв хийж, шаардлагатай шинж чанаруудыг онцолсон боловч ердийн дүн шинжилгээ хийх нь гэмтээхгүй байх байсан (жишээлбэл, бид финалд хийсэн шиг).

Том Адрон Коллайдер ба Одноклассники

Тэмцээний үр дүнд би нэг керас загварыг үгийн эргэлттэй, нөгөөг нь LSTM, GRU дээр суурилсан загвараар бэлтгэсэн. Тэд хоёулаа орос хэлэнд зориулж урьдчилан бэлтгэсэн FastText шигтгээг ашигласан (би өөр хэд хэдэн суулгацыг туршиж үзсэн боловч эдгээр нь хамгийн сайн ажилласан). Таамаглалыг дунджилсны дараа би 7 оролцогчоос эцсийн 76-р байрыг эзэлсэн.

Эхний шатны дараа хэвлэгдсэн Николай Анохины нийтлэл, XNUMX-р байр эзэлсэн (тэр өрсөлдөөнөөс гадуур оролцсон) бөгөөд түүний шийдэл нь зарим үе шат хүртэл минийхийг давтсан боловч асуултын түлхүүр-үнэ цэнийн анхаарлын механизмын ачаар цааш явсан.

Хоёр дахь шат OK & IDAO

Тэмцээний хоёр дахь шат дараалсан шахуу явагдсан тул хамтдаа үзэхээр шийдлээ.

Эхлээд би болон шинээр олж авсан баг Mail.ru компанийн гайхалтай оффист ирсэн бөгөөд бидний даалгавар бол текст, зураг, хамтын ажиллагааны эхний шатнаас гурван замын загварыг нэгтгэх явдал байв. Үүнд 2 гаруй хоног зарцуулсан бөгөөд энэ нь маш бага байсан. Үнэн хэрэгтээ бид нэгдлээс ямар ч ашиг авалгүйгээр эхний шатнаас гарсан үр дүнгээ л давтаж чадсан. Эцэст нь бид 5-р байр эзэлсэн ч текстийн загварыг ашиглаж чадаагүй. Бусад оролцогчдын шийдлийг харсны дараа текстүүдийг нэгтгэж, хамтын загварт нэмэхийг оролдох нь зүйтэй болов уу. Энэ үе шатны гаж нөлөө нь шинэ сэтгэгдэл, сайхан оролцогчид, зохион байгуулагчидтай уулзаж, харилцах, мөн нойргүйдэл байсан нь IDAO-ийн эцсийн шатны үр дүнд нөлөөлсөн байж магадгүй юм.

IDAO 2019 тэмцээний эцсийн шатны даалгавар бол нисэх онгоцны буудал дээр Yandex таксины жолооч нарын захиалга хүлээх хугацааг урьдчилан таамаглах явдал байв. 2-р шатанд 3 даалгавар = 3 нисэх онгоцны буудлыг тодорхойлсон. Нисэх онгоцны буудал бүрийн хувьд зургаан сарын хугацаанд таксины захиалгын тоог минут тутамд өгдөг. Туршилтын өгөгдөл болгон сүүлийн 2 долоо хоногийн захиалгын дараагийн сар, минут минутыг өгсөн болно. Цаг бага байсан (1,5 өдөр), даалгавар нь нэлээд тодорхой байсан, багаас ганцхан хүн тэмцээнд ирсэн бөгөөд үүний үр дүнд энэ нь эцэс хүртэл гунигтай газар байв. Сонирхолтой санаанууд нь гадны өгөгдлийг ашиглах оролдлого байсан: цаг агаар, замын түгжрэл, Yandex таксины захиалгын статистик. Зохион байгуулагчид эдгээр нисэх онгоцны буудал гэж юу болохыг хэлээгүй ч олон оролцогчид Шереметьево, Домодедово, Внуково гэж таамаглаж байсан. Тэмцээний дараа энэ таамаглал няцаагдсан ч жишээлбэл, Москвагийн цаг агаарын мэдээллүүд нь баталгаажуулалт болон тэргүүлэгчдийн самбар дээрх үр дүнг сайжруулсан.

дүгнэлт

  1. ML тэмцээнүүд гайхалтай бөгөөд сонирхолтой! Эндээс та өгөгдөлд дүн шинжилгээ хийх чадвар, зальтай загвар, арга техникийг ашиглахыг олж мэдэх бөгөөд зүгээр л эрүүл саруул ухаан хүлээж байна.
  2. ML нь аль хэдийн асар том мэдлэг болж, асар хурдацтай хөгжиж байгаа юм шиг санагддаг. Би өөр өөр газар (дохио, зураг, хүснэгт, текст) танилцах зорилго тавьсан бөгөөд хичнээн их суралцах хэрэгтэйг аль хэдийн ойлгосон. Жишээлбэл, эдгээр тэмцээнүүдийн дараа би кластер хийх алгоритмууд, градиентийг нэмэгдүүлэх номын сангуудтай ажиллах дэвшилтэт техникүүд (ялангуяа GPU дээр CatBoost-тэй ажиллах), капсул сүлжээ, асуулга-үнэ-утга анхаарах механизмыг судлахаар шийдсэн.
  3. Ганцхан kaggle биш! Наад зах нь подволк авах нь илүү хялбар байдаг өөр олон тэмцээн байдаг бөгөөд бусад шагналуудыг авах боломж илүү байдаг.
  4. Харилцах! Машины сургалт, өгөгдөлд дүн шинжилгээ хийх чиглэлээр аль хэдийн томоохон нийгэмлэгүүд байдаг бөгөөд Mail.ru, Yandex болон бусад компаниудын телеграм, сул, ноцтой хүмүүс асуултуудад хариулж, эхлэгчдэд болон энэ чиглэлээр үргэлжлүүлэн ажиллаж буй хүмүүст тусалдаг сэдэвчилсэн бүлгүүд байдаг. мэдлэгийн.
  5. Өмнөх цэгээс урам зориг авсан бүх хүмүүст очиж үзэхийг зөвлөж байна datafest — 10-р сарын 11-XNUMX-нд Москвад болох томоохон чөлөөт чуулган болно.

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх