NeurIPS 2019: د ML رجحانات چې د راتلونکي لسیزې لپاره به زموږ سره وي

NeuroIPS (د عصبي معلوماتو پروسس کولو سیسټمونه) د ماشین زده کړې او مصنوعي استخباراتو په اړه د نړۍ ترټولو لوی کنفرانس او ​​د ژورې زده کړې نړۍ کې اصلي پیښه ده.

ایا موږ، د DS انجنیران به په نوې لسیزه کې د بیولوژي، ژبپوهنې او ارواپوهنې ماسټر هم وکړو؟ موږ به تاسو ته زموږ په بیاکتنه کې ووایو.

NeurIPS 2019: د ML رجحانات چې د راتلونکي لسیزې لپاره به زموږ سره وي

سږکال کنفرانس د کاناډا په وینکوور کې د 13500 هیوادونو څخه 80 څخه ډیر خلک راټول کړل. دا لومړی کال نه دی چې سبربینک په کنفرانس کې د روسیې استازیتوب کوي - د DS ټیم د بانکدارۍ پروسو کې د ML پلي کولو، د ML سیالۍ او د Sberbank DS پلیټ فارم وړتیاو په اړه خبرې وکړې. په ML ټولنه کې د 2019 اصلي رجحانات څه وو؟ د کنفرانس ګډونوال وايي: اندری چرتوک и تاتیانا شاورینا.

سږکال، NeurIPS له 1400 څخه ډیر کاغذونه ومنل — الګوریتمونه، نوي ماډلونه، او نوي ډیټا ته نوي غوښتنلیکونه. د ټولو موادو سره اړیکه

محتويات:

  • رجحانات
    • د ماډل تفسیر
    • څو اړخیزه
    • دليل
    • RL
    • GAN
  • بنسټیزې بلنې خبرې
    • "ټولنیز استخبارات"، بلیس اګویرا او آرکاس (ګوګل)
    • د اعتباري معلوماتو ساینس، بن یو (برکلي)
    • "د ماشین زده کړې سره د انساني چلند ماډلینګ: فرصتونه او ننګونې"، نوریا ایم اولیور، البرټ علي صلاح
    • "له سیسټم 1 څخه سیسټم 2 ته ژوره زده کړه"، یوشوا بینجیو

رجحانات 2019

1. د ماډل تفسیر او د ML نوی میتودولوژي

د کنفرانس اصلي موضوع تفسیر او شواهد دي چې ولې موږ ځینې پایلې ترلاسه کوو. یو څوک کولی شي د "تور بکس" تفسیر د فلسفي اهمیت په اړه د اوږدې مودې لپاره خبرې وکړي، مګر په دې برخه کې ډیر اصلي میتودونه او تخنیکي پرمختګونه شتون درلود.

د ماډلونو د نقل کولو میتودولوژي او له دوی څخه د پوهې استخراج د ساینس لپاره یوه نوې وسیله ده. ماډل کولی شي د نوي پوهې ترلاسه کولو او ازموینې لپاره د یوې وسیلې په توګه کار وکړي، او د ماډل د وړاندې کولو، روزنې او پلي کولو هر پړاو باید د بیا تولید وړ وي.
د خپرونو د پام وړ برخه د موډلونو او وسیلو جوړولو ته نه، بلکې د امنیت، شفافیت او د پایلو د تصدیق کولو ستونزو ته ځانګړې شوې ده. په ځانګړې توګه، په ماډل باندې د بریدونو په اړه یو جلا جریان ښکاره شوی (مخالف بریدونه)، او د روزنې دواړو بریدونو او په غوښتنلیک باندې د بریدونو لپاره اختیارونه په پام کې نیول شوي.

مقالې:

NeurIPS 2019: د ML رجحانات چې د راتلونکي لسیزې لپاره به زموږ سره وي
ExBert.net د متن پروسس کولو دندو لپاره ماډل تشریح ښیې

2. څو اړخیزه

د باور وړ تصدیق کولو او د پوهې تصدیق کولو او پراخولو لپاره میکانیزمونو رامینځته کولو لپاره، موږ په اړونده برخو کې متخصصینو ته اړتیا لرو چې په ورته وخت کې په ML او د موضوع ساحه (طب، ژبپوهنه، نیوروبیولوژي، تعلیم، او نور) کې وړتیا ولري. دا په ځانګړې توګه د پام وړ ارزښت لري چې په عصبي علومو او ادراکي علومو کې د کارونو او ویناوو خورا مهم شتون - د متخصصینو سره یوځای کول او د نظرونو پور اخیستل شتون لري.

د دې موافقت سربیره، د مختلفو سرچینو څخه د معلوماتو په ګډ پروسس کې څو اړخیزه بڼه راڅرګندیږي: متن او عکسونه، متن او لوبې، د ګراف ډیټابیس + متن او عکسونه.

مقالې:

NeurIPS 2019: د ML رجحانات چې د راتلونکي لسیزې لپاره به زموږ سره وي
دوه ماډلونه - ستراتیژیک او اجرایوي - د RL او NLP پر بنسټ آنلاین ستراتیژي لوبوي

3. استدلال کول

د مصنوعي استخباراتو پیاوړتیا د ځان زده کړې سیسټمونو، "شعور"، استدلال او استدلال په لور یو حرکت دی. په ځانګړې توګه، د علت اټکل او د عام احساس استدلال وده کوي. ځینې ​​راپورونه د میټا زده کړې (د زده کړې څرنګوالي په اړه) او د لومړي او دوهم ترتیب منطق سره د DL ټیکنالوژیو ترکیب ته وقف شوي - د مصنوعي عمومي استخباراتو (AGI) اصطلاح د ویناوالو په وینا کې یو عام اصطلاح کیږي.

مقالې:

4. د تقویت زده کړه

ډیری کار د RL - DOTA2، Starcraft، د کمپیوټر لید، NLP، ګراف ډیټابیسونو سره د معمارۍ ترکیب کولو دودیزو ساحو پراختیا ته دوام ورکوي.

د کنفرانس یوه جلا ورځ د RL ورکشاپ ته وقف شوې وه، په کوم کې چې د مثبت اداکار نقاد ماډل جوړښت وړاندې شو، د ټولو پخوانیو څخه غوره، په ځانګړې توګه د نرم اداکار نقاد.

مقالې:

NeurIPS 2019: د ML رجحانات چې د راتلونکي لسیزې لپاره به زموږ سره وي
د سټار کرافټ لوبغاړي د الفاسټار ماډل سره جګړه کوي (ډیپ مائنډ)

5.GAN

تولیدي شبکې لاهم د پام وړ دي: ډیری کارونه د ریاضیکي شواهدو لپاره وینیلا GANs کاروي، او په نوي، غیر معمولي طریقو کې یې هم پلي کوي (ګراف تولیدي ماډلونه، د لړۍ سره کار کول، په ډیټا کې د لاملونو او اغیزو اړیکو لپاره غوښتنلیک، او نور).

مقالې:

ځکه چې نور کارونه ومنل شول 1400 لاندې به موږ د ډیرو مهمو ویناوو په اړه خبرې وکړو.

بلنه شوې خبرې

"ټولنیز استخبارات"، بلیس اګویرا او آرکاس (ګوګل)

مخونه
سلایډونه او ویډیوګانې
خبرې د ماشین زده کړې عمومي میتودولوژي او همدا اوس د صنعت بدلولو امکانات باندې تمرکز کوي - موږ له کومو لارو سره مخ یو؟ دماغ او تکامل څنګه کار کوي، او ولې موږ د هغه څه څخه دومره لږ کار اخلو چې موږ دمخه د طبیعي سیسټمونو د پراختیا په اړه پوهیږو؟

د ML صنعتي پراختیا په پراخه کچه د ګوګل د پراختیا د مرحلې سره سمون لري، کوم چې په کال کې د NeurIPS په اړه خپلې څیړنې خپروي:

  • 1997 - د لټون اسانتیاو پیل کول، لومړی سرورونه، کوچني کمپیوټري ځواک
  • 2010 - جیف ډین د ګوګل دماغ پروژه پیل کړه، په پیل کې د عصبي شبکو بوم
  • 2015 - د عصبي شبکو صنعتي پلي کول ، په مستقیم ډول په محلي وسیله ګړندي مخ پیژندنه ، د ټیټ کچې پروسیسرونه چې د ټینسر کمپیوټري لپاره جوړ شوي - TPU. ګوګل کورل ai په لاره واچوي - د راسبیري پای انالوګ ، په تجربوي تاسیساتو کې د عصبي شبکو معرفي کولو لپاره یو کوچنی کمپیوټر
  • 2017 - ګوګل د غیر متمرکز روزنې رامینځته کول پیل کوي او د مختلف وسیلو څخه د عصبي شبکې روزنې پایلې په یو ماډل کې ترکیب کوي - په Android کې

نن ورځ، ټول صنعت د معلوماتو امنیت، راټولولو، او په محلي وسیلو کې د زده کړې پایلو نقل کولو ته وقف شوی دی.

فدراسیون زده کړه - د ML یو لارښود په کوم کې چې انفرادي ماډلونه له یو بل څخه په خپلواکه توګه زده کوي او بیا په یو واحد ماډل کې یوځای کیږي (پرته له دې چې د سرچینې ډیټا مرکزي کړي) ، د نادر پیښو ، ګډوډي ، شخصي کولو او نورو لپاره تنظیم شوي. ټول اندروید وسایل په اصل کې د ګوګل لپاره یو واحد کمپیوټري سوپر کمپیوټر دي.

د فدرالي زده کړې پراساس تولیدي ماډلونه د ګوګل په وینا د راتلونکي راتلونکي لور ته ژمن دي، کوم چې "د ودې په لومړیو مرحلو کې دی." GANs، د لیکونکي په وینا، د دې وړتیا لري چې د ژوندیو موجوداتو نفوس او د فکر کولو الګوریتمونو ډله ایز چلند بیا تولید زده کړي.

د دوه ساده GAN جوړښتونو مثال په کارولو سره ، دا ښودل شوي چې په دوی کې د اصلاح کولو لارې لټون په دایره کې تیریږي ، پدې معنی چې اصلاح کول داسې نه پیښیږي. په ورته وخت کې، دا ماډلونه د هغو تجربو په سمبالولو کې خورا بریالي دي چې بیولوژیستان د باکتریا نفوس ترسره کوي، دوی مجبوروي چې د خوړو په لټه کې د چلند نوې ستراتیژۍ زده کړي. موږ کولی شو دې پایلې ته ورسیږو چې ژوند د اصلاح کولو فعالیت په پرتله مختلف کار کوي.

NeurIPS 2019: د ML رجحانات چې د راتلونکي لسیزې لپاره به زموږ سره وي
د GAN اصلاح کول

ټول هغه څه چې موږ یې اوس د ماشین زده کړې په چوکاټ کې کوو هغه تنګ او خورا رسمي دندې دي، پداسې حال کې چې دا رسمیتونه ښه عمومي نه دي او د نیوروفیسولوژي او بیولوژي په برخو کې زموږ د موضوع پوهې سره مطابقت نلري.

هغه څه چې واقعیا په نږدې راتلونکي کې د نیوروفیسولوژي له ساحې څخه د پور اخیستلو ارزښت لري د نوي نیورون جوړښتونه او د تیروتنو د بیرته خپریدو میکانیزمونو یو څه بیاکتنه ده.

د انسان مغز پخپله د عصبي شبکې په څیر نه زده کوي:

  • هغه تصادفي لومړني معلومات نلري، پشمول هغه چې د حواسو او ماشومتوب له لارې ایښودل شوي
  • هغه د فطری پرمختګ ارثي لارښوونې لري (له ماشوم څخه د ژبې زده کولو لیوالتیا، په سمه توګه تګ)

د یو فرد مغز روزنه د ټیټې کچې دنده ده؛ شاید موږ باید د ګړندۍ بدلیدونکي اشخاصو "استعمار" په پام کې ونیسو چې یو بل ته پوهه لیږدوي ترڅو د ډله ایز تکامل میکانیزمونه بیا تولید کړي.

هغه څه چې موږ کولی شو اوس په ML الګوریتم کې اختیار کړو:

  • د حجرو نسب ماډلونه پلي کړئ چې د نفوس زده کړه تضمینوي، مګر د فرد لنډ ژوند ("انفرادي دماغ")
  • د لږ شمیر مثالونو په کارولو سره لږ شاټ زده کړه
  • ډیر پیچلي نیورون جوړښتونه، د فعالیت فعالیت یو څه توپیر لري
  • راتلونکو نسلونو ته د "جینوم" لیږدول - د بیک پروپاګیشن الګوریتم
  • یوځل چې موږ نیوروفیسولوژي او عصبي شبکې سره وصل کړو، موږ به زده کړو چې څنګه د ډیری برخو څخه څو اړخیز دماغ جوړ کړو.

له دې نظره، د SOTA حلونو تمرین زیانمنونکی دی او باید د ګډو دندو (معیارونو) د پراختیا لپاره بیاکتنه وشي.

د اعتباري معلوماتو ساینس، بن یو (برکلي)

ویډیوګانې او سلایډونه
راپور د ماشین زده کړې ماډلونو تشریح کولو ستونزې او د دوی مستقیم ازموینې او تصدیق میتودولوژی ته وقف شوی دی. هر روزل شوی ML ماډل د پوهې سرچینې په توګه پیژندل کیدی شي چې له هغې څخه استخراج ته اړتیا لري.

په ډیری برخو کې ، په ځانګړي توګه په طب کې ، د دې پټې پوهې له را ایستلو او د ماډل پایلو تشریح کولو پرته د ماډل کارول ناشونې دي - که نه نو موږ به ډاډه نه یو چې پایلې به مستحکم ، غیر تصادفي ، باوري وي او نه به وژني. ناروغ د کاري میتودولوژي ټوله لار د ژورې زده کړې تمثیل کې وده کوي او د دې حدونو څخه بهر ځي - veridical data science. دا څه شی دی؟

موږ غواړو د ساینسي خپرونو داسې کیفیت ترلاسه کړو او د ماډلونو بیا تولید وړتیا ترلاسه کړو چې دا دي:

  1. د وړاندوینې وړ
  2. د حساب وړ
  3. باثباته

دا درې اصول د نوي میتودولوژي اساس جوړوي. د ML ماډلونه څنګه د دې معیارونو په مقابل کې معاینه کیدی شي؟ ترټولو اسانه لاره د سمدستي تشریح وړ ماډلونو رامینځته کول دي (رجعتونه ، د پریکړې ونې). په هرصورت، موږ هم غواړو چې د ژورې زده کړې سمدستي ګټې ترلاسه کړو.

د ستونزې سره د کار کولو څو شته لارې:

  1. ماډل تشریح کړئ؛
  2. د پاملرنې پر بنسټ میتودونه وکاروئ؛
  3. د روزنې په وخت کې د الګوریتمونو مجموعه وکاروئ، او ډاډ ترلاسه کړئ چې د خطي تشریح وړ ماډلونه د عصبي شبکې په څیر ورته ځوابونو وړاندوینه کول زده کوي، د خطي ماډل څخه ځانګړتیاوې تشریح کوي؛
  4. د روزنې معلومات بدلول او زیاتول. پدې کې شور، مداخله، او د معلوماتو زیاتوالی شامل دي؛
  5. هر هغه میتودونه چې د دې ډاډ ترلاسه کولو کې مرسته کوي چې د ماډل پایلې تصادفي ندي او په کوچني ناغوښتل شوي لاسوهنه (مخالف بریدونه) پورې اړه نلري؛
  6. د حقیقت وروسته ماډل تشریح کړئ، د روزنې وروسته؛
  7. د مطالعې ځانګړتیا وزن په مختلفو لارو؛
  8. د ټولو فرضیو احتمالات مطالعه کړئ، د ټولګي ویش.

NeurIPS 2019: د ML رجحانات چې د راتلونکي لسیزې لپاره به زموږ سره وي
مخالف برید د خنزیر لپاره

د ماډلینګ تېروتنې د هرچا لپاره ګران دي: یو مهم مثال یې د ریین هارټ او روګوف کار دی.د پور په وخت کې وده"د ډیری اروپایی هیوادونو اقتصادي پالیسیو اغیزه وکړه او دوی یې اړ کړل چې د سپما پالیسي تعقیب کړي، مګر د معلوماتو بیاکتنې او د دوی پروسس کولو کلونو وروسته برعکس پایله وښودله!

هر ML ټیکنالوژي د پلي کیدو څخه پلي کیدو پورې د خپل ژوند دوره لري. د نوي میتودولوژي هدف دا دی چې د ماډل د ژوند په هره مرحله کې درې اساسي اصول وڅیړئ.

لنډیز:

  • ډیری پروژې رامینځته کیږي چې د ML ماډل سره به د باور وړ وي. دا، د بیلګې په توګه، ژورتیا (د دې لپاره لینک: github.com/ChrisCummins/paper-end2end-dl);
  • د میتودولوژي د لا پراختیا لپاره، دا اړینه ده چې د ML په ساحه کې د خپرونو کیفیت د پام وړ ښه کړي؛
  • د ماشین زده کړه په تخنیکي او بشري برخو کې د څو اړخیزو زده کړو او تخصص لرونکي مشرانو ته اړتیا لري.

"د ماشین زده کړې سره د انساني چلند ماډلینګ: فرصتونه او ننګونې" نوریا ایم اولیور، البرټ علي صلاح

لیکچر د انساني چلند ماډل کولو لپاره وقف شوی، د هغې تخنیکي بنسټونه او د غوښتنلیک امکانات.

د انساني چلند ماډلینګ په لاندې برخو ویشل کیدی شي:

  • انفرادي چلند
  • د خلکو د یوې کوچنۍ ډلې چلند
  • ډله ایز چلند

د دې ډولونو هر یو د ML په کارولو سره ماډل کیدی شي ، مګر د بشپړ مختلف معلوماتو او ځانګړتیاو سره. هر ډول خپل اخالقي مسلې هم لري چې هره پروژه یې پرمخ ځي:

  • انفرادي چلند - د هویت غلا، ژور جعلي؛
  • د خلکو د ډلو چلند - د نوم نه خلاصول، د حرکتونو په اړه د معلوماتو ترلاسه کول، تلیفونونه، او داسې نور؛

انفرادي چلند

ډیری د کمپیوټر لید موضوع پورې اړه لري - د انساني احساساتو او عکس العملونو پیژندل. شاید یوازې په شرایطو کې، په وخت کې، یا د هغه د احساساتو د خپل بدلون د نسبي پیمانه سره. سلایډ د مونا لیزا د احساساتو پیژندنه ښیې چې د مدیترانې میرمنو احساساتي سپیکٹرم څخه د شرایطو په کارولو سره. پایله: د خوښۍ موسکا، مګر د توهین او کرکې سره. دلیل ډیری احتمال د "بې طرفه" احساساتو تعریف کولو تخنیکي لاره کې دی.

د خلکو د یوې کوچنۍ ډلې چلند

تر دې دمه ترټولو خراب ماډل د ناکافي معلوماتو له امله دی. د مثال په توګه، د 2018 - 2019 کارونه ښودل شوي. په لسګونو خلکو X په لسګونو ویډیوګانې (cf. 100k++ عکس ډیټاسیټونه). د دې دندې غوره ماډل کولو لپاره، ملټي موډل معلوماتو ته اړتیا ده، په غوره توګه د سینسرونو څخه د بدن الټیمیټر، ترمامیتر، مایکروفون ریکارډ، او داسې نور.

ډله ایز چلند

ترټولو پرمختللې سیمه، ځکه چې پیرودونکي ملګري ملتونه او ډیری ایالتونه دي. د بهرنۍ څارنې کیمرې، د تلیفون له برجونو څخه ډاټا - بلینګ، SMS، تلیفونونه، د دولت د سرحدونو تر منځ د حرکت په اړه معلومات - دا ټول د خلکو د حرکت او ټولنیز بې ثباتۍ خورا معتبر انځور وړاندې کوي. د ټیکنالوژۍ احتمالي غوښتنلیکونه: د بیړني حالت په جریان کې د ژغورنې عملیات، مرستې او په وخت سره د خلکو ایستل. کارول شوي ماډلونه په عمده توګه لاهم په خراب ډول تشریح شوي - دا مختلف LSTMs او قانع کونکي شبکې دي. دلته یوه لنډه تبصره وه چې ملګري ملتونه د نوي قانون لپاره لابی کوي چې اروپایی سوداګرۍ به دې ته اړ کړي چې د هرې څیړنې لپاره اړین نامعلوم معلومات شریک کړي.

"له سیسټم 1 څخه سیسټم 2 ته ژوره زده کړه"، یوشوا بینجیو

سلایډونه
د جوشوا بینجیو په لیکچر کې، ژوره زده کړه د هدف ترتیب په کچه د نیورو ساینس سره مل کیږي.
بنجیو د نوبل جایزې ګټونکي ډینیل کاهمن د میتودولوژي له مخې د ستونزو دوه اصلي ډولونه پیژني (کتاب "سست فکر وکړئ، چټک پریکړه وکړئ")
ډول 1 - سیسټم 1، بې شعوره کړنې چې موږ یې "په اتوماتيک ډول" کوو (لرغونی دماغ): په پیژندل شوي ځایونو کې د موټر چلول، چلول، د مخونو پیژندل.
ټایپ 2 - سیسټم 2، شعوري کړنې (دماغي کورټیکس)، د هدف ترتیب، تحلیل، فکر، جامع دندې.

AI تر دې دمه یوازې د لومړي ډول په دندو کې کافي لوړوالی ته رسیدلی ، پداسې حال کې چې زموږ دنده دا ده چې دا دوهم ته راوړو ، د څو ډیسپلینري عملیاتو ترسره کولو او د منطق او لوړې کچې ادراکي مهارتونو سره کار کولو ښوونه.

دې هدف ته د رسیدو لپاره دا وړاندیز کیږي:

  1. په NLP دندو کې، پاملرنه د موډل کولو فکر کولو لپاره د کلیدي میکانیزم په توګه وکاروئ
  2. د غوره ماډل ځانګړتیاو لپاره د میټا زده کړې او نمایندګي زده کړې وکاروئ چې شعور او د دوی ځایی کولو اغیزه کوي - او د دوی پر بنسټ د لوړې کچې مفکورو سره کار کولو ته ځي.

د یوې پایلې پرځای، دلته یو بلنه شوی خبرې دي: بنګیو یو له ډیرو ساینس پوهانو څخه دی چې هڅه کوي د ML ساحه پراخه کړي د اصلاح کولو ستونزو، SOTA او نوي جوړښتونو هاخوا.
دا پوښتنه خلاصه ده چې د شعور د ستونزو ترکیب، په فکر، نیوروبیولوژي او الګوریتمونو باندې د ژبې نفوذ تر کومه حده هغه څه دي چې موږ ته په راتلونکي کې انتظار کوي او موږ ته اجازه راکوي چې ماشینونو ته لاړ شو چې د خلکو په څیر "فکر" کوي.

ساپی!



سرچینه: www.habr.com

Add a comment