Ilya Segalovich'in adını taşıyan ödül. Bilgisayar bilimi ve lansman yayınları hakkında bir hikaye

Ilya Segalovich'in adını taşıyan ödül. Bilgisayar bilimi ve lansman yayınları hakkında bir hikaye

Bugün Ilya Segalovich'in adını taşıyan bilimsel bir ödül başlatıyoruz iseg. Bilgisayar bilimleri alanındaki başarılara verilecek. Lisans ve lisansüstü öğrencileri ödül için kendi başvurularını yapabilirler veya bilimsel denetçileri atayın. Ödül kazananlar akademik topluluğun ve Yandex'in temsilcileri tarafından seçilecek. Ana seçim kriterleri: konferanslardaki yayınlar ve sunumların yanı sıra toplumun gelişimine katkı.

İlk ödül töreni nisan ayında gerçekleşecek. Ödül kapsamında genç bilim adamlarına 350 bin ruble verilecek, ayrıca uluslararası bir konferansa gidebilecek, bir mentorla çalışabilecek ve Yandex araştırma bölümünde staj yapabilecekler. Bilimsel denetçiler 700 bin ruble alacak.

Ödülün lansmanı vesilesiyle, Habré'de bilgisayar bilimi dünyasındaki başarı kriterleri hakkında konuşmaya karar verdik. Bazı Habr okuyucuları bu kriterleri zaten biliyor, bazıları ise bunlar hakkında yanlış bir izlenime sahip olabilir. Bugün bu boşluğu dolduracağız; makaleler, konferanslar, veri kümeleri ve bilimsel fikirlerin hizmetlere aktarılması dahil tüm ana konulara değineceğiz.

Bilgisayar bilimi alanındaki bilim adamları için başarının ana kriteri, bilimsel çalışmalarının en iyi uluslararası konferanslardan birinde yayınlanmasıdır. Bu, araştırmacının çalışmasının tanınması için ilk “kontrol noktasıdır”. Örneğin, genel olarak makine öğrenimi alanında, Uluslararası Makine Öğrenimi Konferansı (ICML) ve Sinir Bilgi İşleme Sistemleri Konferansı (NeurIPS, eski adıyla NIPS) birbirinden ayrılır. Bilgisayarlı görme, bilgi erişimi, konuşma teknolojisi, makine çevirisi vb. gibi makine öğreniminin belirli alanları hakkında birçok konferans vardır.

Fikirlerinizi neden yayınlıyorsunuz?

Bilgisayar biliminden uzak insanlar, en değerli fikirleri gizli tutmanın ve onların benzersizliğinden kâr elde etmeye çalışmanın daha iyi olduğu gibi bir yanılgıya sahip olabilirler. Ancak bizim alanımızda gerçek durum tam tersidir. Bir bilim insanının otoritesi, çalışmalarının önemine ve makalelerine diğer bilim adamları tarafından ne sıklıkla atıfta bulunulduğuna (alıntı indeksi) göre değerlendirilir. Bu onun kariyerinin önemli bir özelliğidir. Bir araştırmacı, ancak sürekli olarak yayınlanan, ünlü olan ve diğer bilim adamlarının çalışmalarının temelini oluşturan güçlü çalışmalar ürettiğinde, kendi toplumunda daha fazla saygı duyularak profesyonel basamakları tırmanabilir.

En iyi makalelerin çoğu (belki de çoğu), dünya çapındaki farklı üniversitelerdeki ve şirketlerdeki araştırmacılar arasındaki işbirliğinin sonucudur. Bir araştırmacının kariyerinde önemli ve çok değerli bir an, deneyimlerine dayanarak kendi başına fikir bulma ve eleme fırsatını yakaladığı zamandır - ancak bundan sonra bile meslektaşları ona paha biçilmez yardım sağlamaya devam eder. Bilim adamları birbirlerine fikir geliştirmede yardımcı olur, işbirliği içinde makaleler yazar ve bilim adamının bilime katkısı ne kadar büyük olursa, benzer düşünen insanları bulması o kadar kolay olur.

Son olarak, bilginin yoğunluğu ve kullanılabilirliği artık o kadar büyük ki, farklı araştırmacılar aynı anda çok benzer (ve gerçekten değerli) bilimsel fikirler ortaya koyuyor. Fikrinizi yayınlamazsanız, başka birinin onu sizin adınıza yayınlaması neredeyse kesindir. "Kazanan" genellikle yeniliği biraz daha erken bulan değil, onu biraz daha önce yayınlayan kişidir. Veya - fikri olabildiğince eksiksiz, açık ve ikna edici bir şekilde ortaya koymayı başaran kişi.

Ilya Segalovich'in adını taşıyan ödül. Bilgisayar bilimi ve lansman yayınları hakkında bir hikaye

Makaleler ve veri kümeleri

Böylece bilimsel bir makale araştırmacının önerdiği ana fikir etrafında inşa edilir. Bu fikir onun bilgisayar bilimine katkısıdır. Makale, fikrin birkaç cümleyle formüle edilmiş bir açıklamasıyla başlıyor. Bunu, önerilen yeniliğin yardımıyla çözülen çeşitli sorunları açıklayan bir giriş takip etmektedir. Açıklama ve giriş genellikle geniş bir kitlenin anlayabileceği basit bir dille yazılır. Girişten sonra matematiksel dille sunulan problemlerin resmileştirilmesi ve kesin notasyonun tanıtılması gerekir. Daha sonra, tanıtılan gösterimleri kullanarak, önerilen yeniliğin özüne ilişkin açık ve kapsamlı bir açıklama oluşturmanız ve önceki benzer yöntemlerden farkları belirlemeniz gerekir. Tüm teorik ifadeler ya önceden derlenmiş kanıtlara yapılan referanslarla desteklenmeli ya da bağımsız olarak kanıtlanmalıdır. Bu bazı varsayımlarla yapılabilir. Örneğin, sonsuz miktarda eğitim verisinin olduğu (açıkça ulaşılamaz bir durum) veya bunların birbirlerinden tamamen bağımsız olduğu durum için bir kanıt verebilirsiniz. Makalenin sonuna doğru bilim insanı elde edebildiği deneysel sonuçlardan bahsediyor.

Ilya Segalovich'in adını taşıyan ödül. Bilgisayar bilimi ve lansman yayınları hakkında bir hikaye

Konferans organizatörleri tarafından görevlendirilen hakemlerin bir makaleyi onaylama olasılıklarının daha yüksek olması için makalenin bir veya daha fazla özelliğe sahip olması gerekir. Onay şansını artıran önemli bir faktör, önerilen fikrin bilimsel yeniliğidir. Çoğu zaman, yenilik halihazırda var olan fikirlerle ilişkili olarak değerlendirilir ve bunu değerlendirme işi hakem tarafından değil, makalenin yazarı tarafından gerçekleştirilir. İdeal olarak yazar, makalede mevcut yöntemleri ayrıntılı olarak anlatmalı ve mümkünse bunları kendi yönteminin özel durumları olarak sunmalıdır. Böylece bilim insanı, kabul edilen yaklaşımların her zaman işe yaramadığını, bunları genelleştirdiğini ve daha geniş, daha esnek ve dolayısıyla daha etkili bir teorik formülasyon önerdiğini gösteriyor. Yenilik inkar edilemezse, aksi halde hakemler makaleyi o kadar seçici değerlendirmezler - örneğin, zayıf İngilizceyi görmezden gelebilirler.

Yeniliği güçlendirmek için bir veya daha fazla veri kümesinde mevcut yöntemlerle bir karşılaştırmanın dahil edilmesi yararlı olacaktır. Her birinin açık olması ve akademik ortamda kabul görmesi gerekiyor. Örneğin, Değiştirilmiş Ulusal Standartlar ve Teknoloji Enstitüsü (MNIST) ve CIFAR (Kanada İleri Araştırma Enstitüsü) gibi kurumların ImageNet görüntü deposu ve veritabanları bulunmaktadır. Buradaki zorluk, böyle bir "akademik" veri kümesinin içerik yapısı açısından endüstrinin ele aldığı gerçek verilerden genellikle farklı olmasıdır. Farklı veriler, önerilen yöntemin farklı sonuçları anlamına gelir. Kısmen sektör için çalışan bilim insanları bunu hesaba katmaya çalışıyor ve bazen "verilerimizde sonuç şöyle şöyle, ancak halka açık veri setinde şöyle şöyle" gibi sorumluluk reddi beyanları ekliyorlar.

Önerilen yöntemin tamamen açık bir veritabanına "özelleştirilmiş" olduğu ve gerçek veriler üzerinde çalışmadığı görülmektedir. Yeni, daha temsili veri kümeleri açarak bu yaygın sorunla mücadele edebilirsiniz, ancak çoğu zaman şirketlerin açma hakkına sahip olmadığı özel içeriklerden bahsediyoruz. Bazı durumlarda, verilerin (bazen karmaşık ve özenli) anonimleştirilmesini gerçekleştirirler; belirli bir kişiye işaret eden tüm parçaları kaldırırlar. Örneğin fotoğraflardaki yüzler ve sayılar siliniyor veya okunmaz hale getiriliyor. Ayrıca veri setinin sadece herkesin kullanımına açık olması değil, aynı zamanda bilim adamları arasında fikirleri karşılaştırmanın uygun olduğu bir standart haline gelmesi için, sadece yayınlamak değil, aynı zamanda hakkında ayrı bir alıntı makale yazmak da gereklidir. o ve avantajları.

Çalışılan konuda açık veri kümelerinin olmaması daha da kötüdür. O zaman incelemeci yalnızca yazar tarafından sunulan sonuçları inançla kabul edebilir. Teorik olarak yazar bunları abartıp fark edilmeden kalabilir, ancak akademik ortamda bu pek olası değildir, çünkü bilim adamlarının büyük çoğunluğunun bilimi geliştirme arzusuna aykırıdır.

Bilgisayarla görme de dahil olmak üzere makine öğreniminin bazı alanlarında, makalelerle koda (genellikle GitHub'a) bağlantılar eklemek de yaygındır. Makalelerin kendisi ya çok az kod içeriyor ya da sahte kod. Ve burada, makalenin bir üniversiteden değil de bir şirketten bir araştırmacı tarafından yazılması durumunda yine zorluklar ortaya çıkar. Varsayılan olarak bir şirkette veya startupta yazılan kod NDA olarak etiketlenir. Araştırmacılar ve meslektaşları, anlatılan fikirle ilgili kodu dahili ve kesinlikle kapalı depolardan ayırmak için çok çalışmak zorundalar.

Yayınlanma şansı aynı zamanda seçilen konunun alaka düzeyine de bağlıdır. Uygunluk büyük ölçüde ürün ve hizmetlere göre belirlenir: Bir şirket veya startup, bir makaledeki bir fikre dayanarak yeni bir hizmet oluşturmak veya mevcut bir hizmeti geliştirmekle ilgileniyorsa, bu bir artıdır.

Ilya Segalovich'in adını taşıyan ödül. Bilgisayar bilimi ve lansman yayınları hakkında bir hikaye

Daha önce de belirtildiği gibi, bilgisayar bilimi makaleleri nadiren tek başına yazılır. Ancak kural olarak yazarlardan biri diğerlerinden çok daha fazla zaman ve çaba harcıyor. Bilimsel yeniliğe katkısı en büyüktür. Yazarlar listesinde böyle bir kişi ilk önce belirtilir - ve gelecekte bir makaleye atıfta bulunurken yalnızca ondan bahsedebilirler (örneğin, Latince'den çevrilmiş "Ivanov ve diğerleri" - "Ivanov ve diğerleri"). Ancak başkalarının katkıları da son derece değerlidir; aksi halde yazar listesinde yer almak imkansızdır.

İnceleme süreci

Bildirilerin kabulü genellikle konferanstan birkaç ay önce durdurulur. Bir makale gönderildikten sonra hakemlerin makaleyi okuması, değerlendirmesi ve yorum yapması için 3-5 hafta süresi vardır. Bu, yazarların hakemlerin isimlerini görmediği tek kör sisteme veya hakemlerin yazarların isimlerini görmediği çift kör sisteme göre gerçekleşir. İkinci seçeneğin daha tarafsız olduğu düşünülmektedir: Birçok bilimsel makale, yazarın popülaritesinin hakemin kararını etkilediğini göstermiştir. Örneğin, halihazırda yayınlanmış çok sayıda makalesi olan bir bilim insanının daha yüksek bir derecelendirmeye öncelikli olarak layık olduğunu düşünebilir.

Dahası, çift körleme durumunda bile, hakem aynı alanda çalışıyorsa muhtemelen yazarı tahmin edecektir. Ayrıca, inceleme sırasında makale, bilimsel makalelerin en büyük deposu olan arXiv veri tabanında zaten yayınlanmış olabilir. Konferans organizatörleri bunu yasaklamıyor ancak arXiv yayınlarında farklı bir başlık ve farklı bir özet kullanılmasını öneriyorlar. Ancak makale orada yayınlanmışsa onu bulmak yine de zor olmayacaktır.

Bir makaleyi değerlendiren her zaman birden fazla hakem vardır. Bunlardan birine, yalnızca meslektaşlarının kararlarını gözden geçirip nihai kararı vermesi gereken meta-inceleyici rolü atanıyor. Eğer hakemler makale üzerinde aynı fikirde değilse, meta-inceleyici de makalenin tamamını okuyabilir.

Bazen, derecelendirmeyi ve yorumları inceledikten sonra yazarın, hakemle tartışmaya girme fırsatı olur; Hatta onu kararını değiştirmeye ikna etme şansı bile var (ancak böyle bir sistem tüm konferanslar için işe yaramıyor ve kararı ciddi şekilde etkilemek daha da az mümkün). Tartışmada, makalede zaten atıfta bulunulanlar dışında başka bilimsel çalışmalara atıfta bulunamazsınız. Yalnızca incelemecinin makalenin içeriğini daha iyi anlamasına “yardımcı olabilirsiniz”.

Ilya Segalovich'in adını taşıyan ödül. Bilgisayar bilimi ve lansman yayınları hakkında bir hikaye

Konferanslar ve dergiler

Bilgisayar bilimi makaleleri bilimsel dergilerden çok konferanslara gönderilmektedir. Bunun nedeni, dergi yayınlarının karşılanması daha zor gereksinimlere sahip olması ve hakem değerlendirme sürecinin aylar hatta yıllar sürebilmesidir. Bilgisayar bilimi çok hızlı gelişen bir alan olduğundan yazarlar genellikle yayın için bu kadar uzun süre beklemeye istekli değildir. Ancak, konferans için kabul edilmiş olan bir makaleye daha sonra ekleme yapılabilir (örneğin, daha ayrıntılı sonuçlar sunularak) ve yer kısıtlamalarının bu kadar katı olmadığı bir dergide yayınlanabilir.

Konferanstaki etkinlikler

Onaylanan makalelerin yazarlarının konferansta bulunma formatı hakemler tarafından belirlenir. Makaleye yeşil ışık yakılırsa, çoğunlukla size bir poster standı tahsis edilir. Poster, makalenin ve resimlerin özetini içeren statik bir slayttır. Bazı konferans salonları uzun sıra sıra poster stantlarıyla doludur. Yazar, zamanının önemli bir bölümünü posterinin yanında, makaleyle ilgilenen bilim insanlarıyla iletişim kurarak geçiriyor.

Ilya Segalovich'in adını taşıyan ödül. Bilgisayar bilimi ve lansman yayınları hakkında bir hikaye

Ilya Segalovich'in adını taşıyan ödül. Bilgisayar bilimi ve lansman yayınları hakkında bir hikaye

Katılım için biraz daha prestijli bir seçenek, yıldırım konuşmasıdır. Eğer hakemler makaleyi hızlı bir rapora layık görürlerse, yazara geniş bir dinleyici kitlesine konuşma yapması için yaklaşık üç dakika süre verilir. Bir yandan, yıldırım bir konuşma, fikrinizi yalnızca posterle kendi inisiyatifiyle ilgilenenlere anlatmak için iyi bir fırsattır. Öte yandan proaktif poster ziyaretçileri, salondaki ortalama dinleyiciye göre daha hazırlıklı ve spesifik konunuza daha fazla dalmış durumdadır. Bu nedenle, hızlı bir raporda insanları güncel bilgilerle buluşturmak için hâlâ zamana ihtiyacınız var.

Ilya Segalovich'in adını taşıyan ödül. Bilgisayar bilimi ve lansman yayınları hakkında bir hikaye

Genellikle, yıldırım konuşmalarının sonunda yazarlar poster numarasını söylerler, böylece dinleyiciler onu bulabilir ve makaleyi daha iyi anlayabilirler.

Ilya Segalovich'in adını taşıyan ödül. Bilgisayar bilimi ve lansman yayınları hakkında bir hikaye

Son ve en prestijli seçenek, artık hikayeyi anlatmak için acele etmeye gerek olmadığında, bir poster artı fikrin tam teşekküllü bir sunumudur.

Ilya Segalovich'in adını taşıyan ödül. Bilgisayar bilimi ve lansman yayınları hakkında bir hikaye

Ancak elbette bilim adamları - onaylanmış makalelerin yazarları da dahil - bir sonraki konferansa sadece gösteriş yapmak için gelmiyorlar. Birincisi, bariz sebeplerden dolayı kendi alanlarıyla ilgili poster bulma eğilimindeler. İkincisi, gelecekte ortak akademik çalışmalar yapmak amacıyla irtibat listelerini genişletmeleri onlar için önemli. Bu, bir avlanma değil - ya da en azından, karşılıklı yarar sağlayan fikir alışverişinin, geliştirmelerin ve bir veya daha fazla makale üzerinde ortak çalışmanın takip ettiği ilk aşaması değil.

Aynı zamanda, boş zamanın olmaması nedeniyle üst düzey bir konferansta verimli ağ oluşturmak zordur. Sunumlarda ve posterlerdeki tartışmalarda geçen bütün bir günün ardından, bilim adamı gücünü koruduysa ve jet lag'ın üstesinden gelmişse, o zaman birçok partiden birine gider. Şirketler tarafından barındırılıyorlar ve sonuç olarak partiler genellikle daha avcı bir karaktere sahip oluyor. Aynı zamanda, pek çok misafir bunları yeni bir iş bulmak için değil, yine ağ oluşturmak için kullanıyor. Akşamları artık rapor ve poster yok - ilgilendiğiniz uzmanı "yakalamak" daha kolay.

Ilya Segalovich'in adını taşıyan ödül. Bilgisayar bilimi ve lansman yayınları hakkında bir hikaye

Fikirden üretime

Bilgisayar bilimi, şirketlerin ve yeni kurulan şirketlerin çıkarlarının akademik ortamla güçlü bir şekilde bağlantılı olduğu birkaç sektörden biridir. NIPS, ICML ve diğer benzer konferanslar sadece üniversitelerden değil sektörden de birçok insanı çekiyor. Bu, bilgisayar bilimi alanı için tipiktir, ancak diğer bilimlerin çoğu için bunun tersi de geçerlidir.

Öte yandan, makalelerde sunulan fikirlerin tümü hemen hizmet yaratmaya veya iyileştirmeye yönelik değildir. Tek bir şirket içinde bile bir araştırmacı, hizmetteki meslektaşlarına bilimsel standartlara göre çığır açan bir fikir önerebilir ve bunun uygulanması çeşitli nedenlerden dolayı reddedilebilir. Bunlardan birinden daha önce burada bahsetmiştik - bu, makalenin yazıldığı "akademik" veri seti ile gerçek veri seti arasındaki farktır. Ayrıca, bir fikrin uygulanması gecikebilir, büyük miktarda kaynak gerektirebilir veya diğer ölçütlerin bozulması pahasına yalnızca bir göstergeyi iyileştirebilir.

Ilya Segalovich'in adını taşıyan ödül. Bilgisayar bilimi ve lansman yayınları hakkında bir hikaye

Durum, birçok geliştiricinin kendisinin de biraz araştırmacı olması gerçeğiyle kurtarılıyor. Konferanslara katılıyorlar, akademisyenlerle aynı dili konuşuyorlar, fikir öneriyorlar, bazen makalelerin oluşturulmasına katılıyorlar (örneğin kod yazma), hatta kendileri yazar olarak hareket ediyorlar. Bir geliştirici akademik sürece dalmışsa, araştırma bölümünde olup bitenleri tek kelimeyle takip ediyorsa - bilim adamlarına karşı bir karşı hareket sergiliyorsa, bilimsel fikirleri yeni hizmet yeteneklerine dönüştürme döngüsü kısalır.

Tüm genç araştırmacılara çalışmalarında başarılar ve başarılar dileriz. Bu yazı size yeni bir şey söylemediyse, o zaman zaten üst düzey bir konferansta yayın yapmış olabilirsiniz. Kayıt ol ödül kendiniz ve bilimsel denetçileri atayın.

Kaynak: habr.com

Yorum ekle