NVIDIA په موزیلا کامن غږ پروژه کې 1.5 ملیون ډالر پانګونه کوي

NVIDIA د Mozilla Common Voice پروژه کې 1.5 ملیون ډالر پانګونه کوي. د وینا پیژندنې سیسټمونو کې علاقه د دې وړاندوینې څخه رامینځته کیږي چې په راتلونکو لسو کلونو کې به د غږ ټیکنالوژي یو له اصلي لارو څخه وي چې خلک د کمپیوټرونو او تلیفونونو څخه نیولې ډیجیټل معاونینو او کیوسک پورې وسیلو سره اړیکه ونیسي.

د غږ سیسټمونو فعالیت په پراخه کچه د ماشین زده کړې ماډلونو لپاره د غږ ډیټا حجم او ډول پورې اړه لري. د نن ورځې غږ ټیکنالوژي اساسا د انګلیسي ژبې پیژندلو باندې تمرکز کوي او د ژبو ، تلفظونو او وینا نمونو پراخه لړۍ نه پوښي. پانګه اچونه به د عامه غږ ډیټا وده ګړندۍ کولو کې مرسته وکړي، ډیرې ټولنې او رضاکاران ښکیل کړي، او د پروژې بشپړ وخت کارمندانو شمیر پراخ کړي.

راځئ چې تاسو ته یادونه وکړو چې د ګډ غږ پروژه موخه د غږ نمونو ډیټابیس راټولولو لپاره د ګډ کار تنظیم کول دي چې د غږونو تنوع او د وینا سټایلونه په پام کې نیسي. کاروونکو ته بلنه ورکول کیږي چې غږیز جملې په سکرین کې ښودل شوي یا د نورو کاروونکو لخوا اضافه شوي ډیټا کیفیت ارزونه وکړي. راټول شوي ډیټابیس د انساني وینا د عادي جملو مختلف تلفظونو ریکارډونو سره د ماشین زده کړې سیسټمونو او څیړنیزو پروژو کې پرته له کوم محدودیت څخه کارول کیدی شي.

د عام غږ سیټ اوس مهال د 164 خلکو څخه د تلفظ مثالونه شامل دي. شاوخوا 9 زره ساعته غږیز ډیټا په 60 مختلفو ژبو کې راټول شوي. د روسي ژبې لپاره مجموعه 1412 برخه اخیستونکي او د 111 ساعتونو د وینا مواد پوښي، او د اوکراین ژبې لپاره - 459 ګډون کوونکي او 30 ساعته. د پرتله کولو لپاره، له 66 زرو څخه زیاتو خلکو په انګلیسي ژبه د موادو په چمتو کولو کې برخه اخیستې وه، چې د 1686 ساعتونو تایید شوې وینا یې ترتیب کړه. وړاندیز شوي سیټونه د ماشین زده کړې سیسټمونو کې د وینا پیژندنې او ترکیب ماډلونو جوړولو لپاره کارول کیدی شي. معلومات د عامه ډومین (CC0) په توګه خپاره شوي.

د ووسک پرله پسې وینا پیژندنې کتابتون د لیکوال په وینا، د ګډ غږ سیسټم نیمګړتیاوې د غږ موادو یو طرفه والی دی (د نارینه وو غالبیت د 20-30 کلونو عمر، او د ښځو غږ سره د موادو نشتوالی. ، ماشومان او لویان)، په لغت کې د تغیر نشتوالی (د ورته جملو تکرار) او د MP3 په شکل کې د ریکارډونو ویش.

سرچینه: opennet.ru

Add a comment