微軟研究人員創建了一個人工智能係統,能夠生成圖像說明,在許多情況下,這些說明比人類的描述更準確。 這一突破標誌著 Microsoft 致力於使其產品和服務具有包容性並可供所有用戶訪問的一個重要里程碑。
“圖像描述是計算機視覺的主要功能之一,它使廣泛的服務成為可能,”黃學東說(黃學東),Microsoft 技術官兼 Azure AI 認知服務首席技術官,位於華盛頓州雷德蒙德。
新模型現在可以通過 Computer Vision 提供給消費者,網址為 Azure 認知服務,它是 Azure AI 的一部分,並允許開發人員使用此功能來提高其服務的可用性。 它還包含在 Seeing AI 應用程序中,並將於今年晚些時候在 Windows 和 Mac 的 Microsoft Word 和 Outlook 以及 Windows、Mac 和網絡的 PowerPoint 中提供。
自動描述可幫助用戶訪問任何圖像的重要內容,無論是搜索結果中返回的照片還是演示文稿的插圖。
Saqib Sheikh 說:“在網頁和文檔上使用描述圖像內容的字幕(所謂的替代或替代文本)對於盲人或視障人士尤為重要。”薩吉布·謝赫(Saqib Shaikh)),微軟位於雷德蒙德的 AI 平台組的軟件經理。