IBM waxay u furaysaa CodeNet nidaamyada barashada mishiinada kuwaas oo tarjuma oo xaqiijiya koodka

IBM waxa ay daaha ka rogtay hindiseheeda CodeNet, kaas oo ujeedadiisu tahay in ay cilmi-baarayaasha siiyaan xog-ururin u oggolaanaysa in ay tijaabiyaan adeegsiga farsamooyinka barashada mashiinka si ay u abuuraan turjumaannada luqadaha barnaamijyada, koodhka dhaliyaha iyo falanqeeyayaasha. CodeNet waxa ku jira ururinta 14 milyan oo tusaalayaal kood ah kuwaas oo xaliya 4053 mashaakil barnaamijyada caadiga ah. Isku soo wada duuboo, ururintu waxay ka kooban tahay 500 milyan oo khad oo code ah waxayna dabooshaa 55 luqadaha barnaamijyada, labadaba luqadaha casriga ah sida C++, Java, Python iyo Go, iyo luqadaha dhaxalka ah oo ay ku jiraan COBOL, Pascal iyo FORTRAN. Horumarka mashruuca waxaa lagu qaybiyaa shatiga Apache 2.0, xogta xogta waxaa la qorsheeyay in loo qaybiyo qaab goob dadweyne.

Tusaalooyinka waa la sharraxay oo hirgeliyay algorithms isku mid ah oo ku qoran luqado kala duwan oo barnaamij ah. Waxaa la filayaa in qaabka la soo jeediyay uu gacan ka geysan doono tababarida nidaamyada barashada mashiinka iyo horumarinta hal-abuurnimada goobta tarjumaada iyo koodka mashiinka, oo la mid ah sida xogta sawirka ImageNet sharraxay ay u caawisay horumarinta aqoonsiga qaabka iyo hababka aragga kombiyuutarka. Tartamo kala duwan oo barnaamijyo ah ayaa lagu tilmaamaa mid ka mid ah ilaha ugu muhiimsan ee ururinta.

Si ka duwan turjubaano dhaqameed, kuwaas oo lagu fuliyo ku salaysan qawaaniinta tarjumaadda, hababka barashada mishiinku waxay qabsan karaan oo ku xisaabtami karaan macnaha guud ee isticmaalka koodka. Marka laga beddelayo hal luuqad barnaamij oo loo beddelayo mid kale, macnaha guud waa muhiim sida marka laga tarjumayo luqadda aadanaha oo kale. Tixgelin la'aantan macnaha guud ayaa ah waxa ka hortagaya koodka in laga beddelo luqadaha dhaxalka ah sida COBOL.

Haysashada xog badan oo ku saabsan hirgelinta algorithm ee luqadaha kala duwan waxay gacan ka geysan doontaa abuurista nidaamyada barashada mashiinka caalamiga ah, beddelka turjumaadda tooska ah ee u dhexeeya luqadaha gaarka ah, maareeyaan matalaad badan oo aan la taaban karin oo koodka ah, oo ka madax bannaan luqadaha barnaamijyada gaarka ah. Nidaamkan oo kale waxaa loo isticmaali karaa turjumaan ahaan, isagoo u turjumaya koodka la gudbiyay mid ka mid ah luqadaha la taageeray ee matalaadda gudaha, kaas oo koodka laga soo saari karo luqado badan.

Nidaamku wuxuu sidoo kale awood u yeelan doonaa inuu sameeyo isbeddellada laba jiho. Tusaale ahaan, bangiyada iyo hay'adaha dawladdu waxay sii wadaan adeegsiga mashaariicda afkii COBOL ee duugoobay. Turjubaanka ku salaysan barashada mashiinka wuxuu awoodi doonaa inuu u rogo koodka COBOL inuu noqdo matalaad Java ah, iyo, haddii loo baahdo, jajabka Java dib ugu turjumo koodka COBOL.

Marka lagu daro turjumaada udhaxeysa luqadaha, meelaha nooca codsiga ah ee CodeNet sida abuurista nidaamyada koodka smart iyo automation ee ogaanshaha clone, iyo sidoo kale horumarinta optimizers iyo nidaamyada sixitaan toos ah ayaa lagu xusay. Gaar ahaan, tusaalooyinka lagu soo bandhigay CodeNet waxay ku qalabaysan yihiin metadata oo qeexaya natiijooyinka imtixaanka waxqabadka, cabbirka barnaamijka natiijada, isticmaalka xusuusta iyo gobolka, taas oo noo ogolaanaysa inaan kala saarno koodka saxda ah ee koodka khaladaadka leh (si loo kala saaro koodka saxda ah ee koodka khaldan, ururinta gaar ahaan waxaa ku jira tusaalayaal leh khaladaad, saamiga kaas oo ah 29.5%). Nidaamka barashada mashiinka ayaa xisaabta ku darsan kara xogtan badan si uu u soo saaro koodka ugu fiican ama si loo aqoonsado dib-u-celinta koodka la falanqeeyay (nidaamka wuxuu fahmi karaa in algorithm ee koodka la gudbiyay aan si fiican loo hirgelin ama uu ku jiro khaladaad).

Source: opennet.ru

Add a comment