むリダ・セガロノィッチにちなんで名付けられた賞。 コンピュヌタヌ サむ゚ンスず出版物の創刊に関する話

むリダ・セガロノィッチにちなんで名付けられた賞。 コンピュヌタヌ サむ゚ンスず出版物の創刊に関する話

本日、私たちはむリダ・セガロビッチにちなんで名付けられた科孊賞を立ち䞊げたす。 むセグ。 コンピュヌタヌサむ゚ンスの分野での業瞟に察しお授䞎されたす。 孊郚生および倧孊院生 自分自身で賞に応募するこずができたす たたは科孊的監督者を指名する。 受賞者は孊術コミュニティず Yandex の代衚者によっお遞出されたす。 䞻な遞考基準は、出版物や孊䌚でのプレれンテヌション、コミュニティの発展ぞの貢献です。

最初の授賞匏は350月に行われる予定。 賞の䞀環ずしお、若手科孊者には700䞇ルヌブルが䞎えられるほか、囜際䌚議に参加したり、指導者の䞋で働いたり、Yandex研究郚門でむンタヌンシップを受けるこずができる。 科孊監督者にはXNUMX䞇ルヌブルが䞎えられる。

この賞の創蚭を機に、私たちはコンピュヌタ サむ゚ンスの䞖界での成功の基準に぀いおハブレに぀いお話すこずにしたした。 Habr 読者の䞭には、すでにこれらの基準に粟通しおいる人もいれば、それらに぀いお誀った印象を持っおいる人もいるかもしれたせん。 今日、私たちはこのギャップを埋めたす。蚘事、䌚議、デヌタセット、科孊的アむデアのサヌビスぞの移行など、䞻芁なトピックすべおに觊れたす。

コンピュヌタヌ サむ゚ンスの分野の科孊者にずっお、成功の䞻な基準は、䞀流の囜際䌚議の XNUMX ぀で科孊的成果を発衚するこずです。 これが研究者の仕事を評䟡するための最初の「チェックポむント」です。 たずえば、機械孊習䞀般の分野では、機械孊習に関する囜際䌚議 (ICML) ず神経情報凊理システム䌚議 (NeurIPS、旧 NIPS) が区別されたす。 コンピュヌタヌ ビゞョン、情報怜玢、音声技術、機械翻蚳など、ML の特定の分野に関するカンファレンスが倚数ありたす。

あなたのアむデアを公開する理由

コンピュヌタヌ サむ゚ンスに瞁遠い人は、最も䟡倀のあるアむデアは秘密にし、その独自性から利益を埗ようず努めたほうが良いずいう誀解を抱いおいるかもしれたせん。 しかし、私たちの分野の実際の状況はたったく逆です。 科孊者の暩嚁は、その研究の重芁性ず、その論文が他の科孊者によっお匕甚される頻床 (匕甚指数) によっお刀断されたす。 これは圌のキャリアの重芁な特城です。 研究者は、継続的に優れた研究を発衚し、出版され、有名になり、他の科孊者の研究の基瀎を圢成する堎合にのみ、専門的な階段を䞊っおコミュニティ内でより尊敬されるようになりたす。

トップ蚘事の倚くおそらくほずんどは、䞖界䞭のさたざたな倧孊や䌁業の研究者間の共同䜜業の結果です。 研究者のキャリアにおいお重芁か぀非垞に貎重な瞬間は、自分の経隓に基づいお自分でアむデアを芋぀け、遞別する機䌚を埗られるずきです。しかし、この埌も、同僚は圌に貎重な支揎を提䟛し続けたす。 科孊者は互いにアむデアを出し合い、協力しお論文を執筆したす。科孊ぞの貢献が倧きいほど、同じ考えを持぀人々を芋぀けるのが容易になりたす。

最埌に、情報の密床ず入手可胜性が非垞に高くなっおいるため、さたざたな研究者が非垞に䌌た (そしお真に䟡倀のある) 科孊的アむデアを同時に思い぀きたす。 あなたが自分のアむデアを公開しなくおも、ほが確実に他の誰かがあなたのアむデアを公開しおくれるでしょう。 倚くの堎合、「勝者」は、むノベヌションを少し早く思い぀いた人ではなく、少し早く公開した人です。 たたは、アむデアをできるだけ完党に、明確に、説埗力を持っお明らかにした人。

むリダ・セガロノィッチにちなんで名付けられた賞。 コンピュヌタヌ サむ゚ンスず出版物の創刊に関する話

蚘事ずデヌタセット

したがっお、科孊論文は研究者が提案する䞻芁なアむデアを䞭心に構築されたす。 このアむデアは圌のコンピュヌタ サむ゚ンスぞの貢献です。 この蚘事は、数文でたずめられたアむデアの説明から始たりたす。 これに続いお、提案されたむノベヌションの助けを借りお解決されるさたざたな問題に぀いお説明する導入郚が続きたす。 説明ず玹介は通垞、幅広い聎衆が理解できる簡単な蚀葉で曞かれおいたす。 導入埌は、数孊的蚀語で提瀺された問題を圢匏化し、厳密な衚蚘法を導入する必芁がありたす。 次に、導入した衚蚘法を䜿甚しお、提案されたむノベヌションの本質を明確か぀包括的に蚘述し、以前の同様の手法ずの違いを特定する必芁がありたす。 すべおの理論的蚘述は、以前にたずめられた蚌拠ぞの参照によっお裏付けられるか、独立しお蚌明される必芁がありたす。 これは、いく぀かの仮定の䞋で行われる堎合がありたす。 たずえば、トレヌニング デヌタが無限にある堎合 (明らかに達成䞍可胜な状況)、たたはそれらが互いに完党に独立しおいる堎合の蚌明を行うこずができたす。 蚘事の終わりの方で、科孊者は埗られた実隓結果に぀いお語りたす。

むリダ・セガロノィッチにちなんで名付けられた賞。 コンピュヌタヌ サむ゚ンスず出版物の創刊に関する話

䌚議䞻催者が採甚した査読者が論文を承認する可胜性を高めるには、論文に XNUMX ぀以䞊の属性が必芁です。 承認の可胜性を高める重芁な芁玠は、提案されたアむデアの科孊的新芏性です。 倚くの堎合、新芏性は既存のアむデアずの関連で評䟡されたすが、その評䟡䜜業は査読者ではなく、蚘事の著者自身によっお行われたす。 理想的には、著者は蚘事の䞭で既存の手法に぀いお詳现に説明し、可胜であればそれらを自分の手法の特殊なケヌスずしお提瀺する必芁がありたす。 したがっお、科孊者は、受け入れられおいるアプロヌチが垞に機胜するずは限らず、それらを䞀般化しお、より広範でより柔軟で、したがっおより効果的な理論的定匏化を提案したこずを瀺しおいたす。 新芏性が吊定できない堎合、そうでない堎合、査読者は蚘事をそれほど厳しく評䟡したせん。たずえば、英語が䞋手であるこずに目を぀ぶるかもしれたせん。

新芏性を匷化するには、XNUMX ぀以䞊のデヌタセットに関する既存の手法ずの比范を含めるず䟿利です。 それらはそれぞれオヌプンであり、孊術環境で受け入れられるべきです。 たずえば、ImageNet 画像リポゞトリや、修正囜立暙準技術研究所 (MNIST) や CIFAR (カナダ高等研究所) などの機関のデヌタベヌスがありたす。 難しいのは、このような「孊術」デヌタセットは、業界が扱う実際のデヌタずは内容構造が異なるこずが倚いずいうこずです。 デヌタが異なれば、提案手法の結果も異なりたす。 この業界で郚分的に働いおいる科孊者は、これを考慮に入れようずしおおり、「私たちのデヌタでは結果はこれこれですが、公開デヌタセットではこれこれ」ずいった免責事項を挿入するこずがありたす。

たたたた、提案された方法がオヌプン デヌタベヌスに完党に「調敎」されおおり、実際のデヌタでは機胜したせん。 新しい、より代衚的なデヌタセットを開くこずで、この䞀般的な問題に察凊できたすが、倚くの堎合、䌁業が単に開く暩利を持たないプラむベヌト コンテンツに぀いお話されたす。 堎合によっおは、時には耇雑で骚の折れるデヌタの匿名化が実行され、特定の個人を瀺す断片がすべお削陀されたす。 たずえば、写真の顔や数字が消去されたり、刀読できなくなったりしたす。 さらに、デヌタセットを誰でも利甚できるようにするだけでなく、科孊者の間でアむデアを比范するのに䟿利な暙準にするためには、デヌタセットを公開するだけでなく、それに぀いお別の匕甚論文を曞く必芁もありたす。それずその利点。

研究察象のトピックにオヌプンなデヌタセットがない堎合はさらに悪いこずになりたす。 その堎合、査読者は著者が提瀺した結果を信頌しお受け入れるこずしかできたせん。 理論的には、著者がそれらを過倧評䟡しお怜出されないたたにするこずもできたすが、孊術環境では、科孊を発展させたいずいう倧倚数の科孊者の願望に反するため、これは起こりそうにありたせん。

コンピュヌタヌ ビゞョンを含む ML の倚くの分野では、蚘事ずずもにコヌド (通垞は GitHub) ぞのリンクを添付するこずも䞀般的です。 蚘事自䜓にはコヌドがほずんど含たれおいないか、疑䌌コヌドが含たれおいたす。 そしおここでも、論文が倧孊ではなく䌁業の研究者によっお曞かれた堎合に問題が生じたす。 デフォルトでは、䌁業たたは新興䌁業で䜜成されたコヌドには NDA ずいうラベルが付けられたす。 研究者ずその同僚は、説明されおいるアむデアに関連するコヌドを、内郚の確実に閉鎖されたリポゞトリから分離するために懞呜に努力する必芁がありたす。

出版される可胜性は、遞択したトピックの関連性によっおも異なりたす。 関連性は䞻に補品ずサヌビスによっお決たりたす。䌁業や新興䌁業が、蚘事のアむデアに基づいお新しいサヌビスを構築したり、既存のサヌビスを改善したりするこずに興味がある堎合、それはプラスずなりたす。

むリダ・セガロノィッチにちなんで名付けられた賞。 コンピュヌタヌ サむ゚ンスず出版物の創刊に関する話

すでに述べたように、コンピュヌタヌ サむ゚ンスの論文が単独で曞かれるこずはほずんどありたせん。 しかし、原則ずしお、著者の XNUMX 人は他の著者よりもはるかに倚くの時間ず劎力を費やしたす。 科孊の新しさに察する圌の貢献は最倧のものです。 著者のリストでは、そのような人が最初に瀺されたす - そしお将来、蚘事に蚀及するずき、圌らは圌にのみ蚀及するこずができたすたずえば、「むワノフら」-ラテン語から翻蚳された「むワノフずその他」。 ただし、他の人の貢献も非垞に䟡倀があり、そうでなければ著者のリストに茉るこずは䞍可胜です。

レビュヌプロセス

通垞、論文は䌚議の数か月前に受理されなくなりたす。 論文が投皿された埌、査読者は 3  5 週間以内に論文を読み、評䟡し、コメントするこずができたす。 これは、著者が査読者の名前を芋おいない堎合にはシングルブラむンドシステム、たたは査読者自身が著者の名前を芋おいない堎合にはダブルブラむンドシステムに埓っお発生したす。 XNUMX 番目のオプションは、より公平であるず考えられおいたす。いく぀かの科孊論文は、著者の人気が査読者の決定に圱響を䞎えるこずを瀺しおいたす。 たずえば、すでに倚数の論文を発衚しおいる科孊者は、挔繹的により高い評䟡に倀するず考えるかもしれたせん。

さらに、二重盲怜の堎合でも、同じ分野の研究者であれば、おそらく査読者は著者を掚枬するでしょう。 さらに、レビュヌの時点で、論文は科孊論文の最倧のリポゞトリである arXiv デヌタベヌスにすでに公開されおいる可胜性がありたす。 カンファレンスの䞻催者はこれを犁止しおいたせんが、arXiv の出版物では異なるタむトルず異なる芁玄を䜿甚するこずを掚奚しおいたす。 しかし、蚘事がそこに投皿されたずしおも、それを芋぀けるのは難しくありたせん。

垞に耇数の査読者が蚘事を評䟡したす。 そのうちの XNUMX 人にはメタレビュヌ担圓者の圹割が割り圓おられおおり、同僚の評決のみをレビュヌしお最終決定を䞋す必芁がありたす。 査読者が蚘事に同意しない堎合、メタ査読者も完党性を確認するために蚘事を読むこずができたす。

堎合によっおは、評䟡ずコメントを確認した埌、著者は査読者ずディスカッションを開始する機䌚がありたす。 決定を倉えるよう圌を説埗するチャンスさえあるただし、そのようなシステムはすべおの䌚議で機胜するわけではなく、評決に重倧な圱響を䞎える可胜性はさらに䜎い。 議論では、蚘事内ですでに参照されおいるものを陀き、他の科孊的著䜜に蚀及するこずはできたせん。 あなたができるのは、査読者が蚘事の内容をよりよく理解できるように「支揎」するこずだけです。

むリダ・セガロノィッチにちなんで名付けられた賞。 コンピュヌタヌ サむ゚ンスず出版物の創刊に関する話

カンファレンスず雑誌

コンピュヌタヌ サむ゚ンスの論文は、科孊雑誌よりも䌚議に投皿されるこずが倚くなりたす。 これは、ゞャヌナル出版物には満たすのがより難しい芁件があり、査読プロセスには数か月、堎合によっおは数幎かかる堎合があるためです。 コンピュヌタヌ サむ゚ンスは非垞に進歩の速い分野なので、通垞、著者は出版たでにそれほど長く埅ちたがりたせん。 ただし、すでに䌚議に受理された論文を補足したずえば、より詳现な結果を提瀺するこずによっお、スペヌス制限がそれほど厳しくないゞャヌナルに掲茉するこずができたす。

カンファレンスでのむベント

承認された論文の著者が䌚議に出垭する圢匏は、査読者によっお決定されたす。 蚘事にゎヌサむンが出た堎合、ほずんどの堎合、ポスタヌスタンドが割り圓おられたす。 ポスタヌは、蚘事の抂芁ずむラストを含む静的なスラむドです。 䌚議宀によっおは、ポスタヌスタンドが長く䞊んでいる堎合もありたす。 著者は時間のかなりの郚分をポスタヌの近くで過ごし、その論文に興味を持぀科孊者ずコミュニケヌションをずりたす。

むリダ・セガロノィッチにちなんで名付けられた賞。 コンピュヌタヌ サむ゚ンスず出版物の創刊に関する話

むリダ・セガロノィッチにちなんで名付けられた賞。 コンピュヌタヌ サむ゚ンスず出版物の創刊に関する話

参加のためのもう少し名誉あるオプションは、ラむトニング トヌクです。 査読者がその蚘事が簡単なレポヌトに倀するず刀断した堎合、著者には幅広い聎衆の前で話すために玄 XNUMX 分間の時間が䞎えられたす。 䞀方で、ラむトニング トヌクは、自分からポスタヌに興味を持った人だけでなく、自分のアむデアを䌝える良い機䌚でもありたす。 䞀方、積極的なポスタヌ蚪問者は、䌚堎の平均的な聎衆よりも準備ができおおり、特定のトピックに没頭したす。 したがっお、簡単なレポヌトの堎合でも、人々に最新の情報を䌝える時間が必芁です。

むリダ・セガロノィッチにちなんで名付けられた賞。 コンピュヌタヌ サむ゚ンスず出版物の創刊に関する話

通垞、ラむトニング トヌクの最埌に、リスナヌが芋぀けお蚘事をよりよく理解できるように、著者は投皿者番号に名前を付けたす。

むリダ・セガロノィッチにちなんで名付けられた賞。 コンピュヌタヌ サむ゚ンスず出版物の創刊に関する話

最埌の最も名誉あるオプションは、ストヌリヌを急いで䌝える必芁がなくなった堎合、ポスタヌずアむデアの本栌的なプレれンテヌションです。

むリダ・セガロノィッチにちなんで名付けられた賞。 コンピュヌタヌ サむ゚ンスず出版物の創刊に関する話

しかしもちろん、承認された論文の著者を含む科孊者たちは、自慢するためだけではなく次の䌚議に来たす。 たず、明らかな理由から、圌らは自分の分野に関連したポスタヌを芋぀ける傟向がありたす。 そしお第二に、将来の共同孊術研究を目的ずしお、連絡先のリストを拡倧するこずが重芁です。 これは狩猟ではありたせん。少なくずもその最初の段階では、少なくずもその埌に、盞互に有益なアむデアの亀換、開発、および XNUMX ぀以䞊の論文に関する共同䜜業が続きたす。

同時に、自由時間が完党に䞍足しおいるため、トップカンファレンスで生産的なネットワヌキングを行うこずは困難です。 プレれンテヌションやポスタヌでのディスカッションに䞞䞀日費やした埌、科孊者が䜓力を維持し、すでに時差ボケを克服しおいる堎合、圌は数倚くのパヌティヌのいずれかに行きたす。 䌁業が䞻催するため、パヌティヌは狩猟的な性栌を持぀こずが倚くなりたす。 同時に、倚くのゲストは新しい仕事を芋぀けるためではなく、やはりネットワヌキングのためにそれらを利甚しおいたす。 倕方にはレポヌトやポスタヌがなくなり、興味のある専門家を「捕たえる」のが簡単になりたす。

むリダ・セガロノィッチにちなんで名付けられた賞。 コンピュヌタヌ サむ゚ンスず出版物の創刊に関する話

アむデアから制䜜たで

コンピュヌタヌ サむ゚ンスは、䌁業や新興䌁業の利益が孊術環境ず匷く結び぀いおいる数少ない産業の XNUMX ぀です。 NIPS、ICML、その他同様のカンファレンスには、倧孊だけでなく産業界からも倚くの人々が集たりたす。 これはコンピュヌタ サむ゚ンスの分野では䞀般的ですが、他のほずんどの科孊ではその逆です。

䞀方で、蚘事で玹介されたすべおのアむデアがすぐにサヌビスの䜜成や改善に぀ながるわけではありたせん。 XNUMX ぀の䌁業内であっおも、研究者が科孊的基準から芋お画​​期的なアむデアをサヌビスから同僚に提案しおも、さたざたな理由でその実装を拒吊されるこずがありたす。 そのうちの XNUMX ぀はここですでに述べたした。これは、蚘事が曞かれた「孊術」デヌタセットず実際のデヌタセットの違いです。 さらに、アむデアの実装が遅れたり、倧量のリ゜ヌスが必芁になったり、他の指暙を悪化させお XNUMX ぀の指暙だけを改善したりする可胜性がありたす。

むリダ・セガロノィッチにちなんで名付けられた賞。 コンピュヌタヌ サむ゚ンスず出版物の創刊に関する話

この状況は、倚くの開発者自身が研究者であるずいう事実によっお救われおいたす。 圌らは䌚議に出垭し、孊者ず同じ蚀葉を話し、アむデアを提案し、時には蚘事の䜜成に参加し (コヌドを曞くなど)、さらには自ら著者ずしお行動するこずもありたす。 開発者が孊術的なプロセスに没頭し、研究郚門で起こっおいるこずに埓っおいる堎合、぀たり、科孊者に察しお反察運動を瀺しおいる堎合、科孊的なアむデアを新しいサヌビス機胜に倉えるサむクルは短瞮されたす。

若い研究者の皆様の幞運ず研究成果をお祈り申し䞊げたす。 この投皿で䜕も新しいこずが分からなかった堎合は、すでにトップカンファレンスで発衚しおいるかもしれたせん。 登録したす 賞品 自分自身で科孊的監督者を指名するこずもできたす。

出所 habr.com

コメントを远加したす