Foilsíodh OpenChatKit, foireann uirlisí chun chatbots a chruthú

Cuirtear an fhoireann uirlisí foinse oscailte OpenChatKit i láthair, atá dírithe ar chruthú chatbots le haghaidh úsáide speisialaithe agus ginearálta a shimpliú. Cuirtear an córas in oiriúint chun tascanna a dhéanamh ar nós ceisteanna a fhreagairt, idirphlé ilchéime a dhéanamh, achoimre a dhéanamh, faisnéis a bhaint amach agus téacs a rangú. Tá an cód scríofa i Python agus a dháileadh faoi cheadúnas Apache 2.0. Cuimsíonn an tionscadal múnla réamhdhéanta, cód chun do mhúnla a oiliúint, fóntais chun torthaí na samhla a thástáil, uirlisí chun an tsamhail a fhorlíonadh le comhthéacs ó innéacs seachtrach agus chun an bonnsamhail a oiriúnú chun do chuid fadhbanna féin a réiteach.

Tá an bot bunaithe ar mhúnla bunúsach foghlama meaisín (GPT-NeoXT-Chat-Base-20B), a tógadh ag baint úsáide as múnla teanga a chlúdaíonn thart ar 20 billiún paraiméadair agus atá optamaithe le haghaidh cumarsáide comhrá. Chun an tsamhail a oiliúint, baineadh úsáid as sonraí a fuarthas ó bhailiúcháin tionscadail LAION, Together agus Ontocord.ai.

Chun an bonn eolais atá ann faoi láthair a mhéadú, tá córas á bheartú lenar féidir faisnéis bhreise a aisghabháil ó stórtha seachtracha, ó APInna agus ó fhoinsí eile. Mar shampla, is féidir faisnéis a nuashonrú ag baint úsáide as sonraí ó Vicipéid agus fothaí nuachta. Tá múnla modhnóireachta roghnach ar fáil, oilte ar 6 billiún paraiméadair agus bunaithe ar an tsamhail GPT-JT, chun ceisteanna míchuí a scagadh nó chun plé a theorannú go topaicí ar leith.

Ar leithligh, is féidir linn an tionscadal ChatLLaMA a lua, a thairgeann leabharlann chun cúntóirí cliste a chruthú cosúil le ChatGPT. Tá an tionscadal á fhorbairt le súil a chaitheamh ar do threalamh féin agus réitigh phearsantaithe a chruthú atá deartha chun réimsí cúnga eolais a chlúdach (mar shampla, leigheas, dlí, cluichí, taighde eolaíoch, etc.). Tá cód ChatLLaMA ceadúnaithe faoi GPLv3.

Tacaíonn an tionscadal le húsáid samhlacha atá bunaithe ar ailtireacht LLaMA (Samhail Mhór Teanga Meta AI) atá molta ag Meta. Clúdaíonn an tsamhail LLaMA iomlán 65 billiún paraiméadair, ach do ChatLLaMA moltar roghanna a úsáid le 7 agus 13 billiún paraiméadair nó an GPTJ (6 billiún), GPTNeoX (1.3 billiún), 20BOPT (13 billiún), BLOOM (7.1 billiún) agus Galactica (6.7 billiún) samhlacha ). Ar dtús, níor soláthraíodh samhlacha LLaMA ach do thaighdeoirí ar iarratas speisialta, ach ós rud é gur úsáideadh torrents chun sonraí a sheachadadh, d'ullmhaigh díograiseoirí script a thug deis do dhuine ar bith an tsamhail a íoslódáil.

Foinse: oscailtenet.ru

Ceannaigh óstáil iontaofa do shuímh le cosaint DDoS, freastalaithe VPS VDS 🔥 Ceannaigh óstáil gréasáin iontaofa le cosaint DDoS, freastalaithe VPS VDS | ProHoster