Osclaíonn IBM CodeNet do chórais mheaisínfhoghlama a aistríonn agus a fhíoraíonn cód

Nocht IBM a thionscnamh CodeNet, a bhfuil sé mar aidhm aige tacar sonraí a sholáthar do thaighdeoirí a ligeann dóibh triail a bhaint as teicnící meaisínfhoghlama chun aistritheoirí teanga ríomhchlárúcháin, gineadóirí cóid agus anailíseoirí a chruthú. Áirítear ar CodeNet bailiúchán de 14 milliún sampla cód a réitíonn 4053 comhfhadhbanna ríomhchlárúcháin. San iomlán, tá thart ar 500 milliún líne de chód sa bhailiúchán agus clúdaíonn sé 55 teanga ríomhchlárúcháin, idir nuatheangacha ar nós C++, Java, Python agus Go, agus teangacha oidhreachta lena n-áirítear COBOL, Pascal agus FORTRAN. Déantar forbairtí an tionscadail a dháileadh faoi cheadúnas Apache 2.0, agus tá sé beartaithe na tacair sonraí a dháileadh i bhfoirm fearainn phoiblí.

Tá nótaí curtha leis na samplaí agus cuireann siad algartaim chomhionanna i bhfeidhm i dteangacha ríomhchlárúcháin éagsúla. Táthar ag súil go gcabhróidh an tacar atá beartaithe le córais mheaisínfhoghlama a oiliúint agus nuálaíochtaí a fhorbairt i réimse an aistriúcháin agus na meaisín-pharsála cód, cosúil leis an gcaoi ar chuidigh bunachar sonraí íomhánna anótáilte ImageNet le córais aitheantais patrún agus fís ríomhaireachta a fhorbairt. Luaitear comórtais cláir éagsúla mar cheann de na príomhfhoinsí a bhaineann le foirmiú bailiúcháin.

Murab ionann agus aistritheoirí traidisiúnta, a chuirtear i bhfeidhm bunaithe ar rialacha aistriúcháin, is féidir le córais mheaisínfhoghlama comhthéacs úsáide cód a ghabháil agus a chur san áireamh. Nuair a bhíonn comhthéacs á thiontú ó theanga ríomhchlárúcháin amháin go teanga eile, tá comhthéacs chomh tábhachtach céanna agus a bhíonn aistriúchán ó theanga dhaonna amháin go teanga eile. Is é an easpa breithniúcháin comhthéacs seo a chuireann cosc ​​ar chód a thiontú ó theangacha oidhreachta ar nós COBOL.

Cabhróidh bunachar sonraí mór de chur i bhfeidhm algartam i dteangacha éagsúla le córais uathfhoghlama meaisín a chruthú a ionramhálann, in ionad aistriúchán díreach idir teangacha sonracha, léiriú níos teibí ar an gcód, neamhspleách ar theangacha sonracha ríomhchláraithe. Is féidir córas den sórt sin a úsáid mar aistritheoir, ag aistriú an chóid tarchurtha in aon cheann de na teangacha a fhaigheann tacaíocht go dtí a léiriú teibí inmheánach, ónar féidir cód a ghiniúint ansin i dteangacha iolracha.

Beidh an córas in ann claochluithe déthreocha a dhéanamh freisin. Mar shampla, leanann bainc agus gníomhaireachtaí rialtais ag baint úsáide as tionscadail sa teanga COBOL as dáta. Beidh aistritheoir meaisín-bhunaithe in ann cód COBOL a thiontú ina léiriú Java, agus, más gá, an blúire Java a aistriú ar ais go cód COBOL.

Chomh maith le haistriúchán idir teangacha, luaitear réimsí den sórt sin a bhaineann le CodeNet mar chruthú córais chuardaigh cód cliste agus uathoibriú braite clón, chomh maith le forbairt optimizers agus córais uathcheartaithe cód. Go háirithe, tá na samplaí a chuirtear i láthair i CodeNet feistithe le meiteashonraí a chuireann síos ar thorthaí tástála feidhmíochta, méid an chláir mar thoradh air, tomhaltas cuimhne agus staid, a ligeann dúinn idirdhealú a dhéanamh idir cód ceart ó chód le hearráidí (cód ceart a idirdhealú ó chód mícheart, an Áirítear go sonrach sa bhailiúchán samplaí le hearráidí, arb é 29.5% an sciar díobh. Is féidir le córas meaisínfhoghlama na meiteashonraí seo a chur san áireamh chun an cód is fearr a ghiniúint nó chun aischéimnithí a aithint sa chód a ndearnadh anailís air (is féidir leis an gcóras a thuiscint nach bhfuil an algartam sa chód a cuireadh isteach curtha i bhfeidhm go barrmhaith nó go bhfuil earráidí ann).

Foinse: oscailtenet.ru

Add a comment