Déanann an teicneolaíocht is déanaí Microsoft atá ag teacht ar Azure AI cur síos ar íomhánna chomh maith le daoine


Chruthaigh taighdeoirí Microsoft córas hintleachta saorga ar féidir leo fortheidil íomhánna a ghiniúint atá, i go leor cásanna, níos cruinne ná tuairiscí daonna. Is cloch mhíle mhór é seo i dtiomantas Microsoft a chuid táirgí agus seirbhísí a dhéanamh cuimsitheach agus inrochtana do gach úsáideoir.

“Tá cur síos ar an íomhá ar cheann de phríomhfheidhmeanna fís ríomhaire, a chuireann ar chumas raon leathan seirbhísí,” a dúirt Xuedong Huang (Xuedong Huang), comhalta teicniúil Microsoft agus príomhoifigeach teicneolaíochta de chuid Azure AI Cognitive Services i Redmond, Washington.

Tá an tsamhail nua ar fáil anois do thomhaltóirí trí Computer Vision ag Seirbhísí Cognaíoch Azure, atá mar chuid de Azure AI, agus ligeann d'fhorbróirí an cumas seo a úsáid chun infhaighteacht a gcuid seirbhísí a fheabhsú. Tá sé san áireamh freisin san aip Seeing AI agus seolfar é níos déanaí i mbliana i Microsoft Word agus Outlook do Windows agus Mac, chomh maith le PowerPoint do Windows, Mac agus an ngréasán.

Cuidíonn cur síos uathoibríoch le húsáideoirí rochtain a fháil ar ábhar tábhachtach aon íomhá, cibé an grianghraf é a cuireadh ar ais i dtoradh cuardaigh nó léiriú le haghaidh cur i láthair.

“Tá úsáid na bhfotheideal a chuireann síos ar ábhar na n-íomhánna (ar a dtugtar téacs malartach nó alt) ar leathanaigh ghréasáin agus ar dhoiciméid thar a bheith tábhachtach do dhaoine atá dall nó a bhfuil lagamhairc orthu,” a dúirt Saqib Sheikh.Saqib Shaikh), bainisteoir bogearraí sa ghrúpa AI Platforms de chuid Microsoft i Redmond.

Mar shampla, tá a fhoireann ag baint úsáide as gné cur síos íomhá feabhsaithe san aip do dhaoine dalla agus lagamhairc AI a fheiceáil, a aithníonn a bhfuil á scannánú ag an gceamara agus a labhraíonn faoi. Úsáideann an aip fortheidil ghinte chun cur síos a dhéanamh ar ghrianghraif, lena n-áirítear ar líonraí sóisialta.

“Go hidéalach, ba cheart do gach duine téacs alt a chur le gach íomhá i ndoiciméid, ar líne, agus ar na meáin shóisialta, mar go gceadaíonn sé seo do dhaoine dalla rochtain a fháil ar ábhar agus páirt a ghlacadh i gcomhrá. Ach, faraor, ní dhéanann daoine é seo,” a deir Sheikh. “Mar sin féin, tá roinnt aipeanna ann a úsáideann an ghné cur síos ar an íomhá chun téacs eile a chur leis nuair nach bhfuil aon cheann ar fáil.”
  
Déanann an teicneolaíocht is déanaí Microsoft atá ag teacht ar Azure AI cur síos ar íomhánna chomh maith le daoine

Bhí Lijuan Wang, bainisteoir taighde sinsearach ag saotharlann Redmond Microsoft, i gceannas ar fhoireann taighde a bhain torthaí cosúil le daoine agus torthaí níos fearr amach. Grianghraf: Dan DeLong.

Cur síos ar rudaí nua

“Tá cur síos ar an íomhá ar cheann de na príomhthascanna a bhaineann le fís ríomhaire, a éilíonn córas hintleachta saorga chun an príomhábhar nó an gníomh a léirítear san íomhá a thuiscint agus cur síos a dhéanamh air,” a mhínigh Lijuan Wang.Lijuan Wang), bainisteoir taighde sinsearach ag saotharlann Redmond de chuid Microsoft.

“Caithfidh tú a thuiscint cad atá ar siúl, a dhéanamh amach cad iad na gaolmhaireachtaí idir rudaí agus gníomhartha, agus ansin achoimre agus cur síos a dhéanamh air in abairt i dteanga atá intuigthe ag an duine,” a dúirt sí.

Bhí Wang i gceannas ar an bhfoireann taighde a rinne tagarmharcáil nocaps (ceannteideal ar réad núíosach ar scála, cur síos ar mhórscála ar réada nua) torthaí a bhaint amach a bhí inchomparáide leis na cinn daonna agus sháraigh siad iad. Déanann an tástáil seo measúnú ar cé chomh maith agus a ghineann córais AI cur síos ar réada léirithe nach cuid den tacar sonraí ar a ndearnadh an tsamhail a oiliúint.

Go hiondúil, cuirtear oiliúint ar chórais tuairiscithe íomhá ar thacair sonraí ina bhfuil íomhánna in éineacht le tuairiscí téacsúla ar na híomhánna seo, is é sin, ar thacair d’íomhánna lipéadaithe.

“Léiríonn an tástáil nocaps cé chomh maith agus is féidir leis an gcóras cur síos ar rudaí nua nach bhfuil le fáil sna sonraí oiliúna,” a deir Wang.

Chun an fhadhb seo a réiteach, rinne foireann Microsoft réamhoiliúint ar mhúnla mór AI ar thacar sonraí ollmhór ina raibh íomhánna le clibeanna focal, gach ceann acu bainteach le réad sonrach san íomhá.

Bhí sé níos éifeachtaí tacair íomhánna a chruthú le clibeanna focal in ionad fotheidil iomlána, rud a chuir ar chumas fhoireann Wang go leor sonraí a chur isteach ina múnla. Thug an cur chuige seo foclóir amhairc don tsamhail ar a dtugann an fhoireann.

Mar a mhínigh Huang, tá cur chuige réamhtheagaisc an fhoclóra amhairc cosúil le páistí a ullmhú chun léamh: Ar dtús, úsáidtear pictiúrleabhar ina bhfuil baint ag focail aonair le pictiúir, mar shampla, faoi ghrianghraf úll deir sé "úll" agus faoi ​​ghrianghraf de cat an focal "cat".

“Go bunúsach is é an réamhoiliúint seo le foclóir amhairc an t-oideachas tosaigh a theastaíonn chun an córas a oiliúint. Seo mar a dhéanaimid iarracht cineál cuimhne mótair a fhorbairt,” a dúirt Huang.

Déantar an tsamhail réamhoilte a scagadh ansin ag baint úsáide as tacar sonraí a chuimsíonn íomhánna le fotheideal. Ag an gcéim seo den oiliúint, foghlaimíonn an tsamhail abairtí a fhoirmiú. Má fheictear íomhá ina bhfuil réada nua, úsáideann an córas AI foclóir amhairc chun cur síos cruinn a chruthú.

“Chun déileáil le rudaí nua le linn tástála, comhcheanglaíonn an córas an méid a d’fhoghlaim sé le linn na réamh-oiliúna agus le linn na forbartha ina dhiaidh sin,” a deir Wang.
Soglasno rezulтаtam taighdeNuair a rinneadh meastóireacht ar thástálacha nocaps, tháirg an córas AI tuairiscí níos brí agus níos cruinne ná mar a rinne daoine ar na híomhánna céanna.

Aistriú luathaithe go dtí an timpeallacht oibre 

I measc rudaí eile, tá an córas tuairiscithe íomhá nua dhá uair chomh maith leis an tsamhail a úsáidtear i dtáirgí agus seirbhísí Microsoft ó 2015, de réir tagarmharcála tionscail eile.

I bhfianaise na buntáistí a gheobhaidh gach úsáideoir táirgí agus seirbhísí Microsoft ón bhfeabhsúchán seo, tá Huang tar éis luasghéarú a dhéanamh ar chomhtháthú an mhúnla nua i dtimpeallacht deisce Azure.

“Táimid ag tabhairt an teicneolaíocht AI cinn seo chuig Azure mar ardán chun freastal ar raon níos leithne custaiméirí,” a dúirt sé. “Agus is dul chun cinn é seo ní hamháin sa taighde. Ba cheannródaíoch freisin an t-am a thóg sé an ceannródaíocht seo a ionchorprú i dtimpeallacht táirgthe Azure.”

Dúirt Huang freisin go leanann baint amach torthaí cosúil le daoine treocht atá bunaithe cheana féin i gcórais faisnéise chognaíoch Microsoft.

“Le cúig bliana anuas, tá torthaí ar leibhéal an duine bainte amach againn i gcúig mhórréimse: aithint cainte, meaisínaistriúchán, freagra ceisteanna, léamh meaisín agus tuiscint téacs, agus in 2020, in ainneoin COVID-19, cur síos ar an íomhá,” a dúirt Juan.

De réir ábhair

Déan comparáid idir torthaí tuairiscí íomhá a thug an córas roimhe seo agus anois ag baint úsáide as AI

Déanann an teicneolaíocht is déanaí Microsoft atá ag teacht ar Azure AI cur síos ar íomhánna chomh maith le daoine

Grianghraf ó leabharlann Getty Images. Cur síos roimhe seo: Fear ag cócaireacht madra te ar chlár gearrtha. Cur síos nua: Déanann fear arán.

Déanann an teicneolaíocht is déanaí Microsoft atá ag teacht ar Azure AI cur síos ar íomhánna chomh maith le daoine

Grianghraf ó leabharlann Getty Images. Cur síos roimhe seo: Suíonn fear ag luí na gréine. Cur síos nua: Tine chnámh ar an trá.

Déanann an teicneolaíocht is déanaí Microsoft atá ag teacht ar Azure AI cur síos ar íomhánna chomh maith le daoine

Grianghraf ó leabharlann Getty Images. Cur síos roimhe seo: Fear i léine ghorm. Cur síos nua: Roinnt daoine ag caitheamh maisc máinliachta.

Déanann an teicneolaíocht is déanaí Microsoft atá ag teacht ar Azure AI cur síos ar íomhánna chomh maith le daoine

Grianghraf ó leabharlann Getty Images. Cur síos roimhe seo: eitlíonn fear ar chlár scátála suas an balla. Cur síos nua: Gabhann imreoir baseball liathróid.

Foinse: will.com

Add a comment