Google-k Gemma AI eredua aurkitu du, Gemini chatbot-aren ohiko teknologietan oinarrituta

Google-k Gemma argitaratu du, Gemini chatbot eredua eraikitzeko erabiltzen diren teknologien bidez eraikitako makina ikasteko hizkuntza eredu handi bat, ChatGPT-ekin lehiatzen saiatzen dena. Eredua lau aldaeratan dago eskuragarri, 2 eta 7 milioi parametro dituena, oinarrizko ikuspegietan eta elkarrizketa-koadroetan optimizatutako ikuspegietan. 2 milioi parametro dituzten aukerak egokiak dira kontsumo-aplikazioetan erabiltzeko eta prozesatzeko nahikoa CPU dute. 7 milioi parametro dituzten aukerek hardware indartsuagoa eta GPU edo TPU bat behar dituzte.

Gemma ereduaren aplikazio-eremuen artean, elkarrizketa-sistemak eta laguntzaile birtualak sortzea, testuak sortzea, hizkuntza naturalean egindako galderei erantzunak sortzea, edukien laburpena eta orokortzea, kontzeptuen eta terminoen funtsaren azalpena, akatsen zuzenketa. testuan, hizkuntzak ikasteko laguntza. Hainbat motatako testu-datuak sortzea onartzen du, besteak beste, poesia, programazio-lengoaietako kodea, lanak berridaztea eta txantiloi baten bidez letrak sortzea. Gainera, ereduak tamaina txiki samarra du, eta baliabide mugatuekin zure ekipoetan erabiltzeko aukera ematen du, adibidez, ordenagailu eramangarri arruntetan eta ordenagailuetan.

Lizentzia ereduak doako erabilera eta banaketa ahalbidetzen du ikerketa eta proiektu pertsonaletan ez ezik, produktu komertzialetan ere. Ereduaren bertsio aldatuak sortzea eta argitaratzea ere onartzen da. Aldi berean, erabilera-baldintzek debekatu egiten dute eredua erabiltzea maltzurren ekintzak egiteko eta, ahal den guztietan, zure produktuetan Gemma-ren azken bertsioa erabiltzea eskatzen dute.

Gemma ereduekin lan egiteko euskarria gehitu da dagoeneko Transformers tresna-tresnetan eta Responsible Generative AI Toolkit-era. Eredua optimizatzeko, Keras markoa eta backendak erabil ditzakezu TensorFlow, JAX eta PyTorch-en. Gemma MaxText, NVIDIA NeMo eta TensorRT-LLM esparruekin ere erabil daiteke.

Gemma ereduak kontuan hartzen duen testuinguruaren tamaina 8 mila token da (ereduak testua sortzerakoan prozesatu eta gogoratu dezakeen token kopurua). Konparazio baterako, Gemini eta GPT-4 modeloen testuinguruaren tamaina 32 mila token da, eta GPT-4 Turbo ereduaren 128 mila. Ereduak ingelesa soilik onartzen du. Errendimenduari dagokionez, Gemma-7B modeloa LLama 2 70B Chat ereduaren aldean apur bat txikiagoa da eta DeciLM-7B, PHI-2 (2.7B) eta Mistral-7B-v0.1 modeloen apur bat aurretik. Google-ren konparazioan, Gemma-7B eredua LLama 2 7B/13B eta Mistral-7B baino zertxobait aurreratu da.

Google-k Gemma AI eredua aurkitu du, Gemini chatbot-aren ohiko teknologietan oinarrituta


Iturria: opennet.ru

Gehitu iruzkin berria