Dh'fhoillsich Amazon stòr-dàta airson tuigse fhaighinn air cainnt ann an 51 cànan

Tha Amazon air an stòr-dàta “MASSIVE” (Ioma-chànanach Amazon SLURP airson Lìonadh Slot, Seòrsachadh Rùin, agus Measadh Neach-taic Mas-fhìor) fhoillseachadh fo chead CC BY 4.0, modalan airson siostaman ionnsachaidh innealan, agus innealan airson na modalan agad fhèin a thrèanadh a ghabhas cleachdadh gus fiosrachadh a thuigsinn mu chànan nàdarra (NLU, Natural Language Understanding). Tha an seata a’ toirt a-steach còrr air millean abairt teacsa le notaichean agus seòrsaichte a chaidh ullachadh airson 51 cànan.

Chaidh an cruinneachadh SLURP, a bha ri fhaighinn airson Beurla an toiseach, a chleachdadh mar iomradh airson an seata MASSIVE a thogail, a chaidh a roinn ann an 50 cànan eile a’ cleachdadh eadar-theangairean proifeasanta. Bidh teicneòlas tuigse cànain nàdarra Alexa (NLU) an-toiseach ag atharrachadh cainnt gu teacsa, an uairsin a’ cur grunn mhodalan NLU an sàs san teacsa a nì sgrùdadh air làthaireachd prìomh fhaclan gus brìgh ceist an neach-cleachdaidh a dhearbhadh.

Is e aon de na h-amasan ann a bhith a’ cruthachadh agus a’ foillseachadh an t-seata luchd-cuideachaidh guth atharrachadh gus fiosrachadh a phròiseasadh ann an grunn chànanan aig an aon àm, a bharrachd air luchd-leasachaidh treas-phàrtaidh a bhrosnachadh gus tagraidhean agus seirbheisean a chruthachadh a leudaicheas comasan luchd-cuideachaidh guth. Gus aire luchd-leasachaidh a tharraing, chuir Amazon farpais air bhog gus am modal coitcheann as fheàrr a chruthachadh a’ cleachdadh seata dàta foillsichte.

An-dràsta, chan eil luchd-cuideachaidh guth a’ toirt taic ach do ghrunn chànanan agus a’ cleachdadh mhodalan ionnsachaidh inneal ceangailte ri cànan sònraichte. Tha am pròiseact MASSIVE ag amas air cuir às don easbhaidh seo le bhith a’ cruthachadh mhodalan uile-choitcheann agus siostaman ionnsachaidh inneal a tha comasach air fiosrachadh a pharsadh agus a ghiullachd ann an diofar chànanan.

Source: fosgailtenet.ru

Cuir beachd ann