Codex ad cognitionem sermonis et interpretationis ratio aperta est

Consilium OpenAI, quod publica opera in campo intellegentiae artificialis evolvit, explicationes evulgavit quae ad systematis recognitionis susurri sermonis pertinentia. Asseritur systema sermonis Anglice praebet gradus certae et accuratae recognitionis automaticae proximae cognitioni humano. Codex ad exsecutionem referentiae in compage PyTorch fundata et ad exempla iam instituti, ad usum parata, apertus est. Codex sub licentia MIT aperta est.

Ad exemplar instituendi, 680 mille horae datae locutionis adhibitae sunt, collectae ex pluribus collectionibus diversis linguis et locis subiecti. Circiter 1/3 in oratione data quam exercendo implicatum est in linguis praeter linguam Latinam. Systema propositum recte condiciones tractat ut pronuntiationem acui, sonum background, usum technicae linguae. Praeter orationem in textum transcribenda, ratio etiam sermonis ex quavis lingua in linguam Anglicam transferre potest et speciem orationis in flumine audio deprehendere.

Exemplaria in duabus repraesentationibus formantur: exemplar linguae Anglicanae et exemplar multilinguale, quod etiam linguas Russicae, Ucrainae et Belarusianae sustinet. Rursus, quaelibet repraesentatio in 5 optiones divisa est, magnitudine ac numero parametrorum diversarum, quae in exemplari obductae sunt. Maior magnitudo, maior subtilitas et qualitas cognitionis, sed etiam superiora requisita pro magnitudine video memoria GPU et inferiora facere. Exempli gratia, minima optio includit 39 miliones parametrorum et 1 GB ipsius memoriae video requirit, et maximus 1550 decies parametri includit et 10 GB ipsius memoriae video requirit. Optionem minimam 32 times velocior quam maximus.

Codex ad cognitionem sermonis et interpretationis ratio aperta est

Systema retis neuralis Transformer utitur architectura, quae encoder et decoder inter se inter se cohaeret. Audius in 30 secundos chunkis dissipatus est, qui in spectrogrammum-Mel spectrogrammatum convertuntur et ad encoder mittuntur. Exitus encoder ad decoder mittitur, qui textum repraesentativum cum specialibus signis praedicat, quae permittit, in uno generali exemplari quaestiones solvendas ut lingua detecta, ratio chronologiae pronunciationis phrasium, sermonis transcriptio in. variis linguis, et translationem in Anglicam.

Source: opennet.ru