امروز ما در حال راه اندازی یک جایزه علمی به نام ایلیا سگالویچ هستیم
اولین مراسم اهدای جوایز در ماه آوریل برگزار می شود. به عنوان بخشی از این جایزه، دانشمندان جوان 350 هزار روبل دریافت می کنند و علاوه بر این، می توانند به یک کنفرانس بین المللی بروند، با یک مربی کار کنند و دوره کارآموزی را در بخش تحقیقات Yandex بگذرانند. سرپرستان علمی 700 هزار روبل دریافت خواهند کرد.
به مناسبت راه اندازی این جایزه، تصمیم گرفتیم در اینجا در Habré در مورد معیارهای موفقیت در دنیای علوم کامپیوتر صحبت کنیم. برخی از خوانندگان Habr از قبل با این معیارها آشنا هستند، در حالی که برخی دیگر ممکن است تصور نادرستی در مورد آنها داشته باشند. امروز ما این شکاف را پر خواهیم کرد - همه موضوعات اصلی از جمله مقالات، کنفرانس ها، مجموعه داده ها و انتقال ایده های علمی به خدمات را لمس خواهیم کرد.
چرا ایده های خود را منتشر کنید
افرادی که از علم کامپیوتر دور هستند ممکن است این تصور غلط را داشته باشند که بهتر است با ارزش ترین ایده ها را مخفی نگه دارند و از منحصر به فرد بودن آنها سود ببرند. با این حال، وضعیت واقعی در حوزه ما دقیقا برعکس است. اقتدار یک دانشمند بر اساس اهمیت آثار او، بر اساس تعداد دفعات استناد به مقالات او توسط دانشمندان دیگر (نمایه استنادی) قضاوت می شود. این یک ویژگی مهم حرفه ای او است. یک محقق از نردبان حرفهای بالا میرود و در جامعه خود مورد احترام قرار میگیرد، تنها در صورتی که به طور مداوم آثار قوی تولید کند که منتشر شود، مشهور شود و اساس کار دانشمندان دیگر را تشکیل دهد.
بسیاری از مقالات برتر (شاید اکثر آنها) نتیجه همکاری بین محققان دانشگاه ها و شرکت های مختلف در سراسر جهان است. یک لحظه مهم و بسیار با ارزش در حرفه یک محقق زمانی است که او این فرصت را پیدا می کند که بر اساس تجربیات خود به تنهایی ایده ها را بیابد و از بین ببرد - اما حتی پس از آن، همکارانش همچنان به او کمک های ارزشمندی می کنند. دانشمندان به یکدیگر کمک می کنند تا ایده ها را توسعه دهند، مقالاتی را با همکاری بنویسند - و هر چه سهم دانشمند در علم بیشتر باشد، پیدا کردن افراد همفکر برای او آسان تر است.
در نهایت، تراکم و در دسترس بودن اطلاعات در حال حاضر به حدی است که محققان مختلف به طور همزمان ایده های علمی بسیار مشابه (و واقعاً ارزشمند) را ارائه می دهند. اگر ایده خود را منتشر نکنید، مطمئناً شخص دیگری آن را برای شما منتشر خواهد کرد. "برنده" اغلب کسی نیست که کمی زودتر به این نوآوری رسیده است، بلکه کسی است که آن را کمی زودتر منتشر کرده است. یا - کسی که موفق شد ایده را تا حد امکان به طور کامل، واضح و متقاعدکننده نشان دهد.
مقالات و مجموعه داده ها
بنابراین، یک مقاله علمی حول ایده اصلی که محقق پیشنهاد می کند ساخته می شود. این ایده سهم او در علم کامپیوتر است. مقاله با شرح ایده آغاز می شود که در چند جمله تنظیم شده است. این با مقدمه ای دنبال می شود که طیفی از مشکلات حل شده با کمک نوآوری پیشنهادی را توصیف می کند. شرح و مقدمه معمولاً به زبان ساده و قابل فهم برای مخاطبان گسترده نوشته می شود. پس از مقدمه، لازم است مسائل ارائه شده به زبان ریاضی رسمیت داده شود و علامت گذاری دقیق ارائه شود. سپس، با استفاده از نمادهای معرفی شده، باید بیانی واضح و جامع از ماهیت نوآوری پیشنهادی ایجاد کنید و تفاوتهای روشهای مشابه قبلی را شناسایی کنید. همه اظهارات نظری یا باید با ارجاع به شواهدی که قبلاً گردآوری شده است پشتیبانی شوند یا به طور مستقل اثبات شوند. این ممکن است با برخی فرضیات انجام شود. به عنوان مثال، شما می توانید برای موردی که تعداد نامحدودی از داده های آموزشی وجود دارد (یک موقعیت آشکارا دست نیافتنی) یا کاملاً مستقل از یکدیگر هستند، اثبات کنید. در پایان مقاله، دانشمند در مورد نتایج تجربی که توانست به دست آورد صحبت می کند.
برای اینکه داورانی که توسط برگزارکنندگان کنفرانس استخدام می شوند احتمال بیشتری برای تایید مقاله داشته باشند، باید یک یا چند ویژگی داشته باشد. یک عامل کلیدی که شانس تایید را افزایش می دهد، جدید بودن علمی ایده پیشنهادی است. اغلب، تازگی در رابطه با ایده های موجود ارزیابی می شود - و کار ارزیابی آن توسط بازبین انجام نمی شود، بلکه توسط خود نویسنده مقاله انجام می شود. در حالت ایده آل، نویسنده باید در مقاله به تفصیل از روش های موجود بگوید و در صورت امکان آنها را به عنوان موارد خاص روش خود ارائه دهد. بنابراین، دانشمند نشان می دهد که رویکردهای پذیرفته شده همیشه کار نمی کنند، او آنها را تعمیم داد و فرمول نظری گسترده تر، انعطاف پذیرتر و در نتیجه مؤثرتر را پیشنهاد کرد. اگر تازگی غیرقابل انکار است، در غیر این صورت، داوران مقاله را نه چندان دقیق ارزیابی می کنند - به عنوان مثال، ممکن است چشم خود را بر زبان انگلیسی ضعیف ببندند.
برای تقویت تازگی، گنجاندن مقایسه با روشهای موجود در یک یا چند مجموعه داده مفید است. هر کدام از آنها باید در محیط دانشگاهی باز و پذیرفته شوند. برای مثال، مخزن تصویر ImageNet و پایگاههای داده مؤسسههایی مانند مؤسسه ملی استاندارد و فناوری اصلاحشده (MNIST) و CIFAR (موسسه تحقیقات پیشرفته کانادا) وجود دارد. مشکل این است که چنین مجموعه داده "آکادمیک" اغلب در ساختار محتوا با داده های واقعی که صنعت با آنها سروکار دارد متفاوت است. داده های مختلف به معنای نتایج متفاوت روش پیشنهادی است. دانشمندانی که تا حدی برای صنعت کار می کنند سعی می کنند این را در نظر بگیرند و گاهی اوقات عباراتی مانند "در داده های ما نتیجه چنین و چنان است، اما در مجموعه داده های عمومی - چنین و چنان" درج می کنند.
این اتفاق می افتد که روش پیشنهادی کاملاً برای یک پایگاه داده باز "تناسب" است و روی داده های واقعی کار نمی کند. میتوانید با باز کردن مجموعه دادههای جدید و نمایندهتر با این مشکل رایج مبارزه کنید، اما اغلب ما در مورد محتوای خصوصی صحبت میکنیم که شرکتها به سادگی حق باز کردن آن را ندارند. در برخی موارد، آنها (گاهی اوقات پیچیده و پر زحمت) ناشناس سازی داده ها را انجام می دهند - آنها هر قطعه ای را که به یک شخص خاص اشاره می کند حذف می کنند. به عنوان مثال، چهره ها و اعداد در عکس ها پاک یا ناخوانا می شوند. علاوه بر این، برای اینکه مجموعه داده نه تنها برای همه در دسترس باشد، بلکه به استانداردی در بین دانشمندان تبدیل شود که در آن ایدهها با هم مقایسه شوند، لازم است نه تنها آن را منتشر کنید، بلکه یک مقاله ذکر شده جداگانه نیز در مورد آن بنویسید. آن و مزایای آن
زمانی بدتر است که هیچ مجموعه داده باز در موضوع مورد مطالعه وجود نداشته باشد. سپس داور فقط می تواند نتایج ارائه شده توسط نویسنده در مورد ایمان را بپذیرد. از لحاظ نظری، نویسنده حتی میتواند آنها را دستکم بگیرد و کشف نشود، اما در یک محیط دانشگاهی این امر بعید است، زیرا برخلاف میل اکثریت قریب به اتفاق دانشمندان برای توسعه علم است.
در تعدادی از زمینه های ML، از جمله بینایی کامپیوتر، پیوستن پیوندها به کد (معمولاً به GitHub) با مقالات نیز رایج است. خود مقالات یا حاوی کد بسیار کمی هستند یا شبه کد هستند. و در اینجا، دوباره، اگر مقاله توسط محققی از یک شرکت نوشته شده باشد، و نه از یک دانشگاه، مشکلات پیش می آید. به طور پیشفرض، کدی که در یک شرکت یا استارتآپ نوشته میشود، NDA نامیده میشود. محققان و همکارانشان باید سخت کار کنند تا کد مربوط به ایده ای که توضیح داده می شود را از مخازن داخلی و قطعاً بسته جدا کنند.
شانس انتشار به ارتباط موضوع انتخابی نیز بستگی دارد. ارتباط تا حد زیادی توسط محصولات و خدمات دیکته می شود: اگر یک شرکت یا استارتاپ علاقه مند به ایجاد یک سرویس جدید یا بهبود سرویس موجود بر اساس ایده ای از یک مقاله باشد، این یک امتیاز مثبت است.
همانطور که قبلا ذکر شد، مقالات علوم کامپیوتر به ندرت به تنهایی نوشته می شوند. اما به عنوان یک قاعده، یکی از نویسندگان زمان و تلاش بسیار بیشتری نسبت به دیگران صرف می کند. سهم او در نوآوری علمی بزرگترین است. در فهرست نویسندگان، ابتدا چنین شخصی ذکر شده است - و در آینده، هنگام مراجعه به مقاله، فقط می توانند از او نام ببرند (به عنوان مثال، "ایوانف و همکاران" - "ایوانف و دیگران" ترجمه شده از لاتین). با این حال، کمک های دیگران نیز بسیار ارزشمند است - در غیر این صورت نمی توان در لیست نویسندگان قرار گرفت.
روند بررسی
معمولا چندین ماه قبل از کنفرانس پذیرش مقالات متوقف می شود. پس از ارسال مقاله، داوران 3 تا 5 هفته فرصت دارند تا آن را مطالعه، ارزیابی و نظر دهند. این بر اساس سیستم یک سوکور، زمانی اتفاق میافتد که نویسندگان نام داوران را نمیبینند، یا دو سوکور، زمانی که خود داوران نام نویسندگان را نمیبینند. گزینه دوم بی طرفانه تر در نظر گرفته می شود: چندین مقاله علمی نشان داده اند که محبوبیت نویسنده بر تصمیم داور تأثیر می گذارد. به عنوان مثال، او ممکن است در نظر بگیرد که دانشمندی با تعداد زیادی مقاله قبلاً منتشر شده، به طور پیشینی شایسته امتیاز بالاتر است.
علاوه بر این، حتی در مورد دابل کور، بازبین احتمالاً نویسنده را حدس میزند اگر در همان زمینه کار کنند. علاوه بر این، در زمان بررسی، مقاله ممکن است قبلاً در پایگاه داده arXiv، بزرگترین مخزن مقالات علمی، منتشر شده باشد. برگزارکنندگان کنفرانس این را منع نمی کنند، اما توصیه می کنند از عنوانی متفاوت و چکیده ای متفاوت در نشریات برای arXiv استفاده کنید. اما اگر مقاله در آنجا پست شده باشد، باز هم یافتن آن دشوار نخواهد بود.
همیشه چندین داور در حال ارزیابی یک مقاله هستند. به یکی از آنها نقش متا بازنگری داده می شود که فقط باید احکام همکارانش را بررسی کند و تصمیم نهایی را بگیرد. اگر داوران در مورد مقاله موافق نباشند، متا داور نیز می تواند آن را برای کامل شدن مطالعه کند.
گاهی اوقات نویسنده پس از بررسی رتبه و نظرات، این فرصت را پیدا می کند که با داور وارد بحث شود. حتی فرصتی برای متقاعد کردن او برای تغییر تصمیم وجود دارد (با این حال، چنین سیستمی برای همه کنفرانس ها کار نمی کند و حتی کمتر ممکن است به طور جدی بر حکم تأثیر بگذارد). در بحث، به استثنای مواردی که قبلاً در مقاله به آنها اشاره شده است، نمی توانید به سایر آثار علمی مراجعه کنید. شما فقط می توانید به بازبین کمک کنید تا محتوای مقاله را بهتر درک کند.
کنفرانس ها و مجلات
مقالات علوم کامپیوتر بیشتر به کنفرانس ها ارسال می شوند تا مجلات علمی. این به این دلیل است که انتشارات مجلات دارای الزاماتی هستند که برآورده کردن آنها دشوارتر است و فرآیند بررسی همتایان ممکن است ماه ها یا حتی سال ها طول بکشد. علوم کامپیوتر یک زمینه بسیار سریع در حال حرکت است، بنابراین نویسندگان معمولاً مایل نیستند تا این مدت برای انتشار منتظر بمانند. با این حال، مقالهای که قبلاً برای کنفرانس پذیرفته شده است، میتواند تکمیل شود (مثلاً با ارائه نتایج دقیقتر) و در مجلهای منتشر شود که محدودیتهای فضایی چندان سختگیرانه نیست.
رویدادهای کنفرانس
فرمت حضور نویسندگان مقالات تایید شده در کنفرانس توسط داوران تعیین می شود. اگر به مقاله چراغ سبز داده شود، اغلب به شما یک پوستر اختصاص داده می شود. پوستر یک اسلاید ثابت با خلاصه ای از مقاله و تصاویر است. برخی از اتاق های کنفرانس با ردیف های طولانی از غرفه های پوستر پر شده است. نویسنده بخش قابل توجهی از وقت خود را در نزدیکی پوستر خود می گذراند و با دانشمندان علاقه مند به مقاله ارتباط برقرار می کند.
یک گزینه کمی معتبرتر برای مشارکت، بحث برق آسا است. اگر داوران مقاله را شایسته گزارش سریع بدانند، حدود سه دقیقه به نویسنده فرصت داده می شود تا با مخاطبان گسترده صحبت کند. از یک طرف، یک گفتگوی برق آسا فرصت خوبی است تا در مورد ایده خود نه تنها برای کسانی که به ابتکار خود به پوستر علاقه مند شده اند بگویید. از طرف دیگر، بازدیدکنندگان فعال پوستر نسبت به شنوندگان معمولی در سالن آمادگی بیشتری دارند و در موضوع خاص شما غرق می شوند. بنابراین، در یک گزارش سریع، هنوز باید زمان داشته باشید تا افراد را به روز کنید.
معمولاً نویسندگان در پایان سخنرانی برق آسای خود، شماره پوستر را نام میبرند تا شنوندگان بتوانند آن را پیدا کنند و مقاله را بهتر درک کنند.
آخرین و معتبرترین گزینه یک پوستر به علاوه ارائه کامل ایده است، زمانی که دیگر نیازی به عجله برای بیان داستان نیست.
اما مسلماً دانشمندان - از جمله نویسندگان مقالات تأیید شده - به کنفرانس بعدی می آیند نه فقط برای خودنمایی. اول، آنها به دلایل واضح تمایل دارند پوسترهای مرتبط با رشته خود را پیدا کنند. و ثانیاً، برای آنها مهم است که فهرست تماس های خود را برای کار مشترک دانشگاهی در آینده گسترش دهند. این شکار نیست - یا، حداقل، اولین مرحله آن، که حداقل با تبادل نظر سودمند متقابل از ایده ها، پیشرفت ها و کار مشترک بر روی یک یا چند مقاله دنبال می شود.
در عین حال، شبکه سازی سازنده در یک کنفرانس برتر به دلیل کمبود کلی وقت آزاد دشوار است. اگر دانشمند پس از یک روز کامل در سخنرانی ها و بحث در پوسترها قدرت خود را حفظ کرده و از قبل بر جت لگ غلبه کرده باشد، به یکی از مهمانی های متعدد می رود. آنها توسط شرکت ها میزبانی می شوند - در نتیجه، احزاب اغلب شخصیت شکارتری دارند. در عین حال، بسیاری از مهمانان اصلاً از آنها برای یافتن شغل جدید استفاده نمی کنند، بلکه دوباره برای شبکه سازی استفاده می کنند. در عصر دیگر هیچ گزارش و پوستری وجود ندارد - "گرفتن" متخصصی که به آن علاقه دارید آسان تر است.
از ایده تا تولید
علوم کامپیوتر یکی از معدود صنایعی است که منافع شرکت ها و استارت آپ ها به شدت با محیط دانشگاهی مرتبط است. NIPS، ICML و سایر کنفرانسهای مشابه، افراد زیادی را از صنعت، نه فقط دانشگاهها، جذب میکنند. این برای رشته علوم کامپیوتر معمول است، اما برعکس برای بسیاری از علوم دیگر.
از سوی دیگر، همه ایده های ارائه شده در مقالات بلافاصله به سمت ایجاد یا بهبود خدمات نمی روند. حتی در یک شرکت، یک محقق میتواند به همکاران این سرویس ایدهای را پیشنهاد کند که با استانداردهای علمی پیشرفتکننده است و به دلایلی از اجرای آن امتناع میکند. یکی از آنها قبلاً در اینجا ذکر شده است - این تفاوت بین مجموعه داده های "آکادمیک" که مقاله روی آن نوشته شده است و مجموعه داده های واقعی است. علاوه بر این، اجرای یک ایده ممکن است به تأخیر بیفتد، به منابع زیادی نیاز داشته باشد، یا تنها یک شاخص را به قیمت زوال معیارهای دیگر بهبود بخشد.
وضعیت با این واقعیت نجات پیدا می کند که بسیاری از توسعه دهندگان خود کمی محقق هستند. آنها در کنفرانسها شرکت میکنند، با دانشگاهیان به یک زبان صحبت میکنند، ایدههایی را پیشنهاد میکنند، گاهی اوقات در ایجاد مقالهها (مثلاً نوشتن کد) شرکت میکنند یا حتی خودشان به عنوان نویسنده عمل میکنند. اگر یک توسعهدهنده در فرآیند آکادمیک غوطهور شود، در یک کلام، آنچه را که در بخش تحقیقاتی اتفاق میافتد دنبال کند - اگر حرکت متقابلی نسبت به دانشمندان نشان دهد، چرخه تبدیل ایدههای علمی به قابلیتهای خدماتی جدید کوتاه میشود.
برای همه محققان جوان آرزوی موفقیت و موفقیت های بزرگ در کارشان داریم. اگر این پست چیز جدیدی به شما نمی گوید، ممکن است قبلاً در یک کنفرانس برتر منتشر کرده باشید. ثبت نام برای
منبع: www.habr.com