Технологияи навтарини Microsoft дар Azure AI тасвирҳо ва инчунин одамонро тавсиф мекунад


Муҳаққиқони Microsoft як системаи зеҳни сунъиро сохтанд, ки қодир ба тавлиди сарлавҳаҳои тасвирӣ аст, ки дар бисёр мавридҳо нисбат ба тавсифи одамон дақиқтар мешаванд. Ин пешрафт як марҳалаи муҳим дар ӯҳдадории Microsoft барои фарогир ва дастрас кардани маҳсулот ва хидматҳои худ барои ҳама корбарон буд.

"Тасвири тасвир яке аз вазифаҳои асосии биниши компютер аст, ки доираи васеи хидматҳоро имконпазир месозад" гуфт Сюдонг Хуанг (Сюэдун Хуанг), Корманди техникии Microsoft ва CTO аз Azure AI Cognitive Services дар Редмонд, Вашингтон.

Модели нав ҳоло ба истеъмолкунандагон тавассути Computer Vision дар дастрас аст Хидматҳои маърифатии Azure, ки як қисми Azure AI аст ва ба таҳиягарон имкон медиҳад, ки ин хусусиятро барои беҳтар кардани дастрасии хидматҳои худ истифода баранд. Он инчунин ба барномаи Seeing AI дохил карда шудааст ва дар охири соли ҷорӣ дар Microsoft Word ва Outlook барои Windows ва Mac, инчунин PowerPoint барои Windows, Mac ва дар интернет дастрас хоҳад шуд.

Тавсифи худкор ба корбарон кӯмак мекунад, ки ба мундариҷаи муҳими ҳама гуна тасвир дастрасӣ пайдо кунанд, хоҳ он аксе, ки дар натиҷаи ҷустуҷӯ баргардонида шудааст ё тасвир барои презентатсия.

"Истифодаи сарлавҳаҳое, ки мундариҷаи тасвирҳоро (ба истилоҳ матни алтернативӣ ё алтернативӣ) дар саҳифаҳои интернетӣ ва ҳуҷҷатҳо тавсиф мекунанд, махсусан барои одамони нобино ва заъиф муҳим аст" гуфт Соқиб Шайх (Соқиб Шайх), Менеҷери нармафзор дар Microsoft AI Platform Group дар Редмонд.

Масалан, дастаи ӯ дар барнома барои одамони нобино ва сустбин хусусияти беҳтаршудаи тавсифи тасвирро истифода мебарад. Дидани AI, ки он чизеро, ки камера сабт мекунад, эътироф мекунад ва дар бораи он нақл мекунад. Ин барнома сарлавҳаҳои тавлидшударо барои тавсифи аксҳо, аз ҷумла дар шабакаҳои иҷтимоӣ истифода мебарад.

“Идеалӣ, ҳама бояд ба ҳама тасвирҳо дар ҳуҷҷатҳо, дар интернет ва шабакаҳои иҷтимоӣ матни алтернативӣ илова кунанд, зеро ин ба одамони нобино имкон медиҳад, ки мундариҷаро дастрас кунанд ва дар сӯҳбат иштирок кунанд. Вале афсус, ки мардум ин корро намекунанд, — мегуяд шайх. "Аммо, якчанд барномаҳо мавҷуданд, ки хусусияти тавсифи тасвирро барои илова кардани матни алтернативӣ ҳангоми гум шудани он истифода мебаранд."
  
Технологияи навтарини Microsoft дар Azure AI тасвирҳо ва инчунин одамонро тавсиф мекунад

Лируан Ванг, мудири кулли таҳқиқот дар Лабораторияи Redmond-и Microsoft, як гурӯҳи тадқиқотиро роҳбарӣ кард, ки ба натиҷаҳои инсонӣ ноил ва аз он боло рафт. Сурат: Дэн ДеЛонг.

Тавсифи объектҳои нав

"Тасвир кардани тасвирҳо яке аз вазифаҳои асосии биниши компютерӣ мебошад, ки системаи зеҳни сунъиро барои фаҳмидан ва тавсиф кардани мундариҷа ё амали дар тасвир пешниҳодшуда талаб мекунад" гуфт Лируан Ванг (Лижуан Ванг), мудири кулли тадқиқот дар лабораторияи Microsoft Redmond.

"Шумо бояд бифаҳмед, ки чӣ рӯй дода истодааст, фаҳмед, ки чӣ гуна муносибатҳо байни объектҳо ва амалҳо вуҷуд доранд ва сипас ҳама чизро дар як ҷумла бо забони барои одамон хондан ҷамъбаст ва тавсиф кунед" гуфт ӯ.

Ванг гурӯҳи тадқиқотиро роҳбарӣ кард, ки дар муқоисакунӣ nocaps (сарлавҳаи объекти нав дар миқёс, тавсифи васеъмиқёси объектҳои нав) ба натиҷае ноил гардид, ки бо натиҷаи инсон муқоиса карда шавад ва аз он пеш гузашт. Ин озмоиш ба шумо имкон медиҳад, ки баҳо диҳед, ки то чӣ андоза системаҳои AI тавсифи объектҳои тасвиршударо, ки ба маҷмӯи маълумоте, ки модел таълим дода шудааст, дохил карда нашудаанд, тавлид мекунад.

Одатан, системаҳои тавсифи тасвирҳо дар маҷмӯи додаҳо, ки дорои тасвирҳое мебошанд, ки бо тавсифи матнии ин тасвирҳо, яъне дар маҷмӯи тасвирҳои имзошуда таълим дода мешаванд.

"Санҷиши nocaps нишон медиҳад, ки то чӣ андоза система қодир аст объектҳои наверо, ки дар маълумоти омӯзишӣ мавҷуд нестанд, тавсиф кунад" мегӯяд Ванг.

Барои ҳалли ин мушкилот, гурӯҳи Microsoft як модели бузурги AI-ро дар маҷмӯаи бузурги маълумот, ки дорои тасвирҳои бо калимаҳо, ки ҳар кадоме бо объекти мушаххаси тасвир алоқаманд аст, омӯзонд.

Маҷмӯаҳои тасвирҳо бо барчаспҳои калима ба ҷои сарлавҳаҳои пурра эҷод кардан самараноктаранд ва ба дастаи Ванг имкон медиҳад, ки маълумоти зиёдеро ба модели худ ворид кунанд. Ин равиш ба модел он чизеро дод, ки даста луғати визуалӣ меноманд.

Тавре Хуан тавзеҳ дод, равиши пеш аз омӯзиш бо истифода аз луғати визуалӣ ба омода кардани кӯдакон ба хондан монанд аст: аввал, китоби тасвирӣ истифода мешавад, ки дар он калимаҳои алоҳида бо тасвирҳо алоқаманданд, масалан, дар зери акси себ "себ" навишта шудааст. ва дар зери акси гурба калимаи "гурба" аст.

“Ин омӯзиши пешакӣ бо луғати визуалӣ аслан таҳсилоти ибтидоӣ мебошад, ки барои омӯзиши система зарур аст. Ҳамин тавр мо кӯшиш мекунем, ки як навъ хотираи моториро инкишоф диҳем ”гуфт Хуанг.

Модели қаблан омӯзонидашуда бо маҷмӯи додаҳо, аз ҷумла тасвирҳои нишонгузорӣ такмил дода мешавад. Дар ин марҳилаи омӯзиш модел сохтани ҷумларо ёд мегирад. Агар тасвири дорои объектҳои нав пайдо шавад, системаи AI луғати визуалиро барои эҷод кардани тавсифи дақиқ истифода мебарад.

"Барои кор бо объектҳои нав ҳангоми санҷиш, система он чизеро, ки дар ҷараёни омӯзиш ва такмили минбаъда омӯхтааст, муттаҳид мекунад" мегӯяд Ванг.
Дар натиҷа тадқиқот, вақте ки дар санҷишҳои nocaps арзёбӣ карда шуд, системаи AI нисбат ба одамон барои ҳамон тасвирҳо тавсифи бештар пурмазмун ва дақиқтар дод.

Тезтар гузаштан ба муҳити корӣ 

Дар байни чизҳои дигар, системаи нави тавсифи тасвир нисбат ба моделе, ки дар маҳсулот ва хидматҳои Microsoft аз соли 2015 истифода мешавад, дар муқоиса бо дигар нишондиҳандаи соҳа ду маротиба хубтар аст.

Бо дарназардошти манфиатҳое, ки ҳамаи корбарони маҳсулот ва хидматҳои Microsoft аз ин беҳсозӣ ба даст меоранд, Хуанг ҳамгироии модели навро ба муҳити кории Azure суръат бахшид.

"Мо ин технологияи вайронкунандаи AI-ро ба Azure ҳамчун платформа барои хидмат ба доираи васеътари муштариён мебарем" гуфт ӯ. "Ва ин танҳо як пешрафт дар таҳқиқот нест. Вақт барои ворид кардани ин пешрафт ба муҳити истеҳсолии Azure низ як пешрафт буд."

Хуанг илова кард, ки ноил шудан ба натиҷаҳои ба инсон монанд тамоюли аллакай дар системаҳои зеҳнии маърифатии Microsoft муқарраршударо идома медиҳад.

"Дар панҷ соли охир мо дар панҷ самти асосӣ ба натиҷаҳои инсон монанд ба даст овардем: шинохти нутқ, тарҷумаи мошинӣ, ҷавоб додан ба саволҳо, хондани мошин ва фаҳмиши матн ва дар соли 2020, сарфи назар аз COVID-19, дар тавсифи тасвир. ' гуфт Хуан.

Аз рӯи мавзӯъ

Натиҷаҳои тавсифи тасвирҳоеро, ки система қаблан ва ҳоло бо истифодаи AI дода буд, муқоиса кунед

Технологияи навтарини Microsoft дар Azure AI тасвирҳо ва инчунин одамонро тавсиф мекунад

Акс аз ҷониби Getty Images гирифта шудааст. Тавсифи қаблӣ: Намоиши наздики марде, ки дар тахтаи буридани хот-дог омода мекунад. Тавсифи нав: Одам нон мепазад.

Технологияи навтарини Microsoft дар Azure AI тасвирҳо ва инчунин одамонро тавсиф мекунад

Акс аз ҷониби Getty Images гирифта шудааст. Тавсифи қаблӣ: Марде дар ғуруби офтоб нишастааст. Тавсифи нав: Оташ дар соҳил.

Технологияи навтарини Microsoft дар Azure AI тасвирҳо ва инчунин одамонро тавсиф мекунад

Акс аз ҷониби Getty Images гирифта шудааст. Тавсифи қаблӣ: Марде дар куртаи кабуд. Тавсифи нав: Якчанд одамон ниқобҳои ҷарроҳӣ мепӯшанд.

Технологияи навтарини Microsoft дар Azure AI тасвирҳо ва инчунин одамонро тавсиф мекунад

Акс аз ҷониби Getty Images гирифта шудааст. Тавсифи қаблӣ: Марде дар скейтборд аз болои девор парвоз мекунад. Тавсифи нав: Бозингари бейсбол тӯбро мегирад.

Манбаъ: will.com

Илова Эзоҳ