Mae cewri technoleg a chwmnïau newydd yn symud i fodelau deallusrwydd artiffisial llai a mwy effeithlon mewn ymdrech i dorri costau a gwella perfformiad. Gellir hyfforddi'r modelau hyn, yn wahanol i'w "brodyr mawr" fel GPT-4, ar symiau llai o ddata ac maent yn arbenigo i ddatrys problemau penodol.

Mae Microsoft, Google, Apple, a chwmnïau newydd fel Mistral, Anthropic, a Cohere yn troi fwyfwy at fodelau iaith bach a chanolig ar gyfer deallusrwydd artiffisial. Yn wahanol i fodelau ar raddfa fawr (LLMs) fel GPT-4 OpenAI, sy'n defnyddio dros driliwn o baramedrau ac yn costio ymhell dros $100 miliwn i'w datblygu, mae modelau cryno yn cael eu hyfforddi ar setiau data culach a gallant gostio llai na $10 miliwn, tra'n defnyddio llai na 10 biliwn o baramedrau.
Mae Microsoft, cwmni blaenllaw mewn deallusrwydd artiffisial, wedi cyflwyno teulu o fodelau bach o'r enw Phi. Yn ôl y Prif Swyddog Gweithredol Satya Nadella, mae'r modelau hyn 100 gwaith yn llai na'r fersiwn am ddim o ChatGPT, ond maent yn perfformio bron yr un mor effeithiol ar lawer o dasgau. Nododd Yusuf Mehdi, prif swyddog masnachol Microsoft, fod y cwmni wedi sylweddoli'n gyflym bod rhedeg modelau deallusrwydd artiffisial mawr yn ddrytach nag a ragwelwyd yn wreiddiol, gan annog Microsoft i chwilio am atebion mwy cost-effeithiol.
Mae cewri technoleg eraill hefyd wedi neidio ar y bandwagon. Mae Google, Apple, yn ogystal â Mistral, Anthropic, a Cohere, i gyd wedi rhyddhau eu fersiynau eu hunain o fodelau bach a chanolig. Mae Apple, yn benodol, yn bwriadu defnyddio'r modelau hyn i redeg AI yn lleol, yn uniongyrchol ar ffonau clyfar, a ddylai wella perfformiad a diogelwch. Bydd y defnydd o adnoddau ar ffonau clyfar hefyd yn fach iawn.
Mae arbenigwyr yn nodi y gallai modelau mawr fod yn ormod ar gyfer llawer o dasgau, fel crynhoi dogfennau neu gynhyrchu delweddau. Cymharodd Ilya Polosukhin, un o awduron papur arloesol Google yn 2017 ar ddeallusrwydd artiffisial, yn ffigurol ddefnyddio modelau mawr ar gyfer tasgau syml â gyrru tanc i'r archfarchnad. "Ni ddylai cyfrifo 2 + 2 fod angen cwadriliynau o weithrediadau," pwysleisiodd.
Mae cwmnïau a defnyddwyr hefyd yn chwilio am ffyrdd o leihau cost gweithredu technolegau AI cynhyrchiol. Yn ôl Yoav Shoham, cyd-sylfaenydd y cwmni AI AI21 Labs sydd wedi'i leoli yn Tel Aviv, gall modelau bach ateb cwestiynau am ddim ond un rhan o chwech o gost modelau iaith mawr.
Yn ddiddorol, un o brif fantais modelau bach yw eu gallu i gael eu mireinio ar gyfer tasgau a setiau data penodol. Mae hyn yn caniatáu iddynt weithio'n effeithiol mewn meysydd arbenigol am gost is, er enghraifft, yn y diwydiant cyfreithiol yn unig.
Fodd bynnag, mae arbenigwyr yn nodi nad yw cwmnïau'n bwriadu rhoi'r gorau i LLM yn gyfan gwbl. Er enghraifft, cyhoeddodd Apple integreiddio ChatGPT i Siri ar gyfer tasgau cymhleth, ac mae Microsoft yn bwriadu defnyddio'r model OpenAI diweddaraf yn y fersiwn nesaf o Windows. Mae cwmnïau fel Experian (Iwerddon) a Salesforce (UDA) eisoes wedi newid i ddefnyddio modelau AI cryno ar gyfer chatbots ac wedi canfod eu bod yn cyflawni'r un perfformiad â modelau mwy, ond am gostau sylweddol is a chyda llai o oedi prosesu.
Mae'r newid i fodelau bach yn dod yng nghanol arafwch mewn cynnydd mewn modelau AI mawr, sydd ar gael yn gyhoeddus. Mae arbenigwyr yn priodoli hyn i brinder data hyfforddi newydd o ansawdd uchel ac, yn gyffredinol, yn tynnu sylw at gam newydd a phwysig yn esblygiad y diwydiant.
Ffynhonnell:
Ffynhonnell: 3dnewyddion.ru
