Mozilla tana haɓaka kayan aikin gane magana mai ruɗi

Mozilla tana haɓaka kayan aikin tantance magana na Whisperfile, wanda ya haɗa da mai zaman kansa, aiwatar da babban aiki na ƙirar koyo na injin Whisper wanda OpenAI ya ɓullo da tushe. Kayan aikin yana dogara ne akan whisper.cpp, aiwatar da C/C++ na samfurin Whisper wanda Georgy Gerganov (marubucin llama.cpp) ya kirkira. An rubuta lambar a cikin C++ kuma ana rarraba ta ƙarƙashin lasisin MIT.

Ƙungiyar Mozilla Ocho ce ke haɓaka Whisperfile kuma tana ƙara wa aikin llamafile, wanda aka tsara don ƙirƙirar abubuwan aiwatarwa na duniya don gudanar da manyan samfuran harshen koyon injin (LLM). Kamar llamafile, aikin whisperfile yana ba ku damar ƙirƙirar fayil mai aiwatarwa bisa ga fayil ɗin GGUF tare da sigogin samfurin koyon injin wanda zai iya gudana akan tsarin aiki daban-daban akan kayan aiki tare da masu sarrafawa na AMD64 da ARM64. Lambar da aka tattara za ta iya haɗawa da ɗakin karatu na C Cosmopolitan na yau da kullun, yana ba ku damar ƙirƙirar gina aikace-aikacen da ke gudana a ciki. Linux, FreeBSD, macOS, OpenBSD, NetBSD da kuma Windows.

Lokacin da kake gudanar da fayil mai aiwatarwa, fayil mai sautin magana a wav, mp3, ogg ko tsarin flac ana wucewa azaman sigar shigarwa, kuma an adana rubutun da aka gane azaman fitarwa. A aikace, ana iya amfani da aikin don magance matsaloli kamar samar da rubutun rubutu don bidiyo, ƙirƙirar rikodin murya da kiran bidiyo, canza kayan murya da aka yi rikodin zuwa rubutu, da tsara shigar da murya. Yin amfani da Whisperfile, ana iya magance irin waɗannan ayyuka akan tsarin gida ba tare da yin amfani da sabis na waje ba.

Bugu da ƙari, yana goyan bayan aiki azaman sabar HTTP wanda ke aiwatar da buƙatun tantance magana ta hanyar API ɗin Yanar Gizo. GPU da umarnin AVX za a iya amfani da su don hanzarta aiki tare da samfurin. Kayan aikin na iya fitar da makin amintuwa, yana ba ku damar canza kalmomin da aka gane daidai da yadda kuka gane su daidai.

Mozilla tana haɓaka kayan aikin gane magana mai ruɗi

An horar da samfurin Whisper da aka yi amfani da shi akan bayanan sa'o'i dubu 680 na bayanan magana, wanda ya shafi fannoni daban-daban da harsuna (bayanan 2/3 cikin Ingilishi). Samfurin yana da kyau a gane lafazin magana, gano jargon fasaha, tallafawa gano harshe ta atomatik, kuma yana iya aiki a gaban amo. Don magana a cikin Ingilishi, tsarin yana nuna matakin dogaro da daidaiton fitarwa ta atomatik kusa da sanin ɗan adam. Baya ga rubuta magana zuwa rubutu, ana iya amfani da samfurin don fassara magana zuwa wani harshe.

source: budenet.ru

Sayi amintaccen masauki don shafuka tare da kariyar DDoS, sabar VPS VDS 🔥 Sayi ingantaccen masaukin yanar gizo tare da kariyar DDoS, sabar VPS VDS | ProHoster