Misyon Microsoft se bay chak moun ak òganizasyon sou planèt la pouvwa pou reyalize plis. Endistri medya a se yon bon egzanp pou fè misyon sa a yon reyalite. Nou ap viv nan yon epòk kote yo kreye ak konsome plis kontni, nan plis fason ak sou plis aparèy. Nan IBC 2019, nou te pataje dènye inovasyon n ap travay sou yo ak fason yo ka ede transfòme eksperyans medya ou.
Detay anba koupe a!
Paj sa a sou
Videyo Indexer kounye a sipòte animasyon ak kontni plizyè lang
Ane pase a nan IBC nou te fè prim nou genyen
Dènye òf nou yo gen ladann aperçu de karakteristik trè recherché ak différenciés—rekonesans karaktè anime ak transkripsyon lapawòl plizyè lang—ansanm ak plizyè adisyon nan modèl ki egziste deja ki disponib jodi a nan Video Indexer.
Rekonesans karaktè anime
Kontni anime se youn nan kalite kontni ki pi popilè, men modèl estanda vizyon òdinatè ki fèt pou rekonèt figi moun pa travay byen ak li, sitou si kontni an gen karaktè san karakteristik figi imen. Nouvo vèsyon aperçu a konbine Video Indexer ak sèvis Azure Custom Vision Microsoft a, ki bay yon nouvo seri modèl ki otomatikman detekte ak gwoupe karaktè anime epi fè yo fasil pou make ak rekonèt lè l sèvi avèk modèl vizyon koutim entegre.
Modèl yo entegre nan yon sèl tiyo, ki pèmèt nenpòt moun sèvi ak sèvis la san okenn konesans aprantisaj machin. Rezilta yo disponib atravè yon pòtal Video Indexer san kòd oswa atravè yon API REST pou entegrasyon rapid nan pwòp aplikasyon ou yo.
Nou te konstwi modèl sa yo pou travay ak karaktè anime ansanm ak kèk konsomatè ki te bay reyèl kontni anime pou fòmasyon ak tès. Valè nouvo fonksyonalite a te byen rezime pa Andy Gutteridge, direktè siperyè nan teknoloji estidyo ak pòs-pwodiksyon nan Viacom International Media Networks, ki moun ki te youn nan founisè done yo: "Ajisteman nan dekouvèt kontni anime ki solid ak AI pral pèmèt nou jwenn ak katalòg metadata karaktè nan kontni bibliyotèk nou an byen vit ak efikasite.
Sa ki pi enpòtan, li pral bay ekip kreyatif nou yo kapasite pou jwenn kontni yo bezwen imedyatman, minimize tan pase jere medya epi pèmèt yo konsantre sou kreyativite.”
Ou ka kòmanse fè konesans ak rekonesans karaktè anime ak
Idantifikasyon ak transkripsyon kontni nan plizyè lang
Kèk resous medya, tankou nouvèl, kwonik ak entèvyou, genyen anrejistreman moun ki pale diferan lang. Pifò kapasite lapawòl-a-tèks ki egziste deja mande pou yo espesifye langaj rekonesans odyo a davans, sa ki fè li difisil pou transkri videyo ki pale plizyè lang.
Nouvo karakteristik Idantifikasyon otomatik lang pale nou an pou divès kalite kontni sèvi ak teknoloji aprantisaj machin pou idantifye lang yo jwenn nan byen medya yo. Yon fwa yo detekte, chak segman lang otomatikman ale nan yon pwosesis transkripsyon nan lang apwopriye a, epi Lè sa a, tout segman yo konbine nan yon sèl dosye transkripsyon milti-lang.
Transkripsyon ki kapab lakòz yo disponib kòm yon pati nan pwodiksyon JSON nan Video Indexer la ak kòm dosye soutit. Transkripsyon pwodiksyon an entegre ak Azure Search tou, sa ki pèmèt ou imedyatman chèche segman diferan lang nan videyo ou yo. Anplis de sa, transkripsyon plizyè lang disponib lè w ap travay ak pòtal Video Indexer la, konsa ou ka wè transkripsyon an ak lang ki idantifye yo sou tan, oswa ale nan kote espesifik nan videyo a pou chak lang epi wè transkripsyon an plizyè lang kòm tit pandan videyo a ap jwe. Ou ka tradui tèks ou resevwa a tou nan nenpòt nan 54 lang ki disponib atravè pòtal la ak API.
Aprann plis sou nouvo karakteristik rekonesans kontni miltiling ak kijan li itilize nan Video Indexer
Lòt modèl ajou ak amelyore
Nou ap ajoute tou nouvo modèl nan Video Indexer epi amelyore modèl ki deja egziste yo, tankou sa ki dekri anba a.
Ekstrè antite ki asosye ak moun ak kote
Nou te elaji kapasite dekouvèt mak ki egziste deja nou yo pou enkli non ak kote ki byen koni, tankou Tower Eiffel nan Pari ak Big Ben nan Lond. Lè yo parèt nan transkripsyon pwodwi a oswa sou ekran an lè l sèvi avèk rekonesans optik karaktè (OCR), yo ajoute enfòmasyon ki enpòtan yo. Avèk nouvo karakteristik sa a, ou ka fè rechèch pou tout moun, kote, ak mak ki parèt nan yon videyo epi wè detay sou yo, tankou plas tan, deskripsyon, ak lyen ki mennen nan motè rechèch Bing la pou plis enfòmasyon.
Modèl deteksyon ankadreman pou editè
Nouvo karakteristik sa a ajoute yon seri "tag" nan metadata ki tache ak ankadreman endividyèl yo nan detay JSON yo pou reprezante kalite editoryal yo (pa egzanp, piki lajè, piki mwayen, pre-plan, ekstrèm pre-plan, de piki, plizyè moun. , deyò, andedan kay la, elatriye). Karakteristik kalite piki sa yo itil lè w ap modifye videyo pou klip ak trelè, oswa lè w ap chèche yon style piki espesifik pou rezon atistik.
Granularite kat IPTC amelyore
Modèl deteksyon sijè nou an detèmine sijè a nan yon videyo ki baze sou transkripsyon, rekonesans optik karaktè (OCR), ak selebrite detekte, menm si sijè a pa presize klèman. Nou kat sijè sa yo detekte nan kat zòn klasifikasyon: Wikipedia, Bing, IPTC, ak IAB. Amelyorasyon sa a pèmèt nou mete klasifikasyon IPTC dezyèm nivo.
Pran avantaj de amelyorasyon sa yo fasil menm jan ak re-endeks bibliyotèk Videyo Indexer ou ye kounye a.
Nouvo fonksyon difizyon ap viv
Nan aperçu Azure Media Services, nou ap ofri tou de nouvo karakteristik pou difizyon an dirèk.
Transkripsyon an tan reyèl ki mache ak AI mennen difizyon ap viv nan yon nivo pwochen
Sèvi ak Azure Media Services pou difizyon an dirèk, kounye a ou ka resevwa yon kouran pwodiksyon ki gen ladann yon tras tèks otomatikman pwodwi anplis kontni odyo ak videyo. Tèks la kreye lè l sèvi avèk transkripsyon odyo an tan reyèl ki baze sou entèlijans atifisyèl. Teknik koutim yo aplike anvan ak apre konvèsyon lapawòl-a-tèks pou amelyore rezilta yo. Track tèks la pake nan IMSC1, TTML oswa WebVTT, selon si wi ou non li apwovizyone nan DASH, HLS CMAF oswa HLS TS.
An tan reyèl kodaj liy pou 24/7 chanèl OTT
Sèvi ak API v3 nou yo, ou ka kreye, jere ak difize chanèl OTT (over-the-top), epi sèvi ak tout lòt karakteristik Azure Media Services tankou videyo ap viv sou demann (VOD, videyo sou demann), anbalaj ak jesyon dwa dijital ( DRM, jesyon dwa dijital).
Pou wè vèsyon aperçu nan karakteristik sa yo, vizite
Nouvo kapasite jenerasyon pake
Sipò pou tras deskripsyon odyo
Kontni emisyon sou chanèl emisyon yo souvan gen yon tras odyo ak eksplikasyon vèbal sou sa k ap pase sou ekran an anplis siyal odyo regilye a. Sa fè pwogram yo pi aksesib pou telespektatè ki gen pwoblèm vizyon, sitou si kontni an se sitou vizyèl. Nouvo
Mete metadata ID3
Pou siyal ensèsyon an nan piblisite oswa evènman metadata koutim nan jwè kliyan an, difizyon yo souvan itilize metadata kwonometre entegre nan videyo a. Anplis de mòd siyal SCTE-35, kounye a nou sipòte tou
Patnè Microsoft Azure demontre solisyon fen-a-fen
konpayi entènasyonal
Sous: www.habr.com