Майкрософт компанийн эрхэм зорилго бол дэлхий дээрх хүн бүр, байгууллага бүрийг илүү их зүйлд хүрэх боломжийг олгох явдал юм. Хэвлэл мэдээллийн салбар бол энэхүү эрхэм зорилгыг бодитой болгох сайхан жишээ юм. Бид илүү олон контент, илүү олон арга замаар, илүү олон төхөөрөмж дээр бүтээгдэж, хэрэглэж байгаа эрин үед амьдарч байна. IBC 2019 дээр бид ажиллаж байгаа хамгийн сүүлийн үеийн шинэлэг зүйлүүд болон тэдгээр нь таны хэвлэл мэдээллийн туршлагыг өөрчлөхөд хэрхэн тусалж болох талаар хуваалцсан.
Зүсэлтийн доор дэлгэрэнгүй мэдээлэл!
Энэ хуудас идэвхтэй байна
Video Indexer нь хөдөлгөөнт дүрс болон олон хэлний контентыг дэмждэг болсон
Өнгөрсөн жил IBC-д бид шагналын эзэн болсон
Бидний хамгийн сүүлийн үеийн санал болгож буй зүйлсэд маш их эрэлт хэрэгцээтэй, ялгаатай хоёр функц болох хөдөлгөөнт дүрийг таних, олон хэлээр ярьдаг ярианы транскрипцийг урьдчилан үзэх, мөн одоо байгаа видео индекст байгаа загваруудад хэд хэдэн нэмэлтийг оруулсан болно.
Хөдөлгөөнт дүрийг таних
Хөдөлгөөнт контент нь хамгийн түгээмэл контентуудын нэг боловч хүний нүүр царайг таних зориулалттай компьютерийн харааны стандарт загварууд нь үүнтэй сайн ажиллахгүй, ялангуяа контент нь хүний нүүрний онцлоггүй дүрүүдийг агуулж байвал сайн ажилладаггүй. Урьдчилан үзэх шинэ хувилбар нь Video Indexer-ийг Microsoft-ын Azure Custom Vision үйлчилгээтэй хослуулсан бөгөөд хөдөлгөөнт дүрүүдийг автоматаар илрүүлж, бүлэглэж, тусгайлсан харааны загваруудыг ашиглан шошголох, танихад хялбар болгодог шинэ багц загваруудыг хүргэж байна.
Загваруудыг нэг хоолойд нэгтгэсэн бөгөөд хэн ч машин сурах ямар ч мэдлэггүйгээр үйлчилгээг ашиглах боломжийг олгодог. Үр дүнг кодгүй Video Indexer портал эсвэл REST API-ээр дамжуулан өөрийн программд хурдан нэгтгэх боломжтой.
Бид эдгээр загваруудыг сургах, турших зорилгоор бодит хүүхэлдэйн контентоор хангадаг зарим хэрэглэгчдийн хамт хүүхэлдэйн киноны дүрүүдтэй ажиллах зорилгоор бүтээсэн. Шинэ функцын үнэ цэнийг өгөгдөл нийлүүлэгчдийн нэг байсан Viacom International Media Networks-ийн студи технологи, пост-продакшн хариуцсан ахлах захирал Энди Гуттериж сайн дүгнэж: "Хиймэл оюун ухаанаар ажилладаг хүчирхэг хүүхэлдэйн контентыг нээх боломжтой болно. Бид номын сангийн контентоос тэмдэгтийн мета өгөгдлийг хурдан бөгөөд үр дүнтэй хайж олох, каталогжуулах.
Хамгийн гол нь энэ нь манай бүтээлч багуудад хэрэгцээтэй контентоо шууд олох боломжийг олгож, хэвлэл мэдээллийн хэрэгслийг удирдахад зарцуулдаг цаг хугацааг багасгаж, бүтээлч байдалд анхаарлаа төвлөрүүлэх боломжийг олгоно.”
Та хүүхэлдэйн киноны дүрийг танихтай танилцаж эхлэх боломжтой
Олон хэл дээрх агуулгыг тодорхойлох, хуулбарлах
Мэдээ, түүх, ярилцлага зэрэг зарим хэвлэл мэдээллийн эх сурвалжид өөр өөр хэлээр ярьдаг хүмүүсийн бичлэг байдаг. Одоо байгаа ихэнх ярианаас текст рүү шилжих боломжууд нь аудио таних хэлийг урьдчилан зааж өгөхийг шаарддаг бөгөөд энэ нь олон хэл дээрх видеог хуулбарлахад хэцүү болгодог.
Төрөл бүрийн контентод зориулсан ярианы хэлийг автоматаар таних шинэ онцлог нь хэвлэл мэдээллийн хэрэгслээр олдсон хэлийг тодорхойлохын тулд машин сургалтын технологийг ашигладаг. Илрүүлсний дараа хэлний сегмент бүр автоматаар тохирох хэлээр транскрипцийн процессыг дамжиж, дараа нь бүх сегментүүд нэг олон хэлний транскрипцийн файлд нэгтгэгдэнэ.
Үр дүнгийн хуулбарыг Видео индексжүүлэгчийн JSON гаралтын хэсэг болон хадмал орчуулгын файл хэлбэрээр авах боломжтой. Гаралтын хуулбар нь мөн Azure хайлттай нэгтгэгдсэн бөгөөд энэ нь танд видеондоо өөр өөр хэлний сегментүүдийг нэн даруй хайх боломжийг олгоно. Нэмж дурдахад, Video Indexer порталтай ажиллах үед олон хэлний транскрипцийг ашиглах боломжтой бөгөөд ингэснээр та хуулбар болон тодорхойлсон хэлийг цаг хугацааны явцад харах эсвэл хэл бүрийн видеоны тодорхой газар руу очиж, олон хэл дээрх транскрипцийг видео тоглож байх үед тайлбар хэлбэрээр харах боломжтой. Та хүлээн авсан текстийг портал болон API-ээр дамжуулан боломжтой 54 хэл рүү орчуулах боломжтой.
Олон хэл дээрх агуулгыг таних шинэ функц болон үүнийг Video Indexer-д хэрхэн ашигладаг талаар нэмэлт мэдээлэл аваарай
Нэмэлт шинэчлэгдсэн, сайжруулсан загварууд
Бид мөн видео индексжүүлэгчид шинэ загваруудыг нэмж, одоо байгаа загваруудыг, тэр дундаа доор тайлбарласан загваруудыг сайжруулж байна.
Хүмүүс болон газартай холбоотой нэгжүүдийг гаргаж авах
Бид Парис дахь Эйфелийн цамхаг, Лондон дахь Биг Бен зэрэг алдартай нэр, байршлыг багтаахын тулд одоо байгаа брэндийг илрүүлэх боломжоо өргөжүүлсэн. Тэдгээр нь үүсгэсэн хуулбар эсвэл оптик тэмдэгт таних (OCR) ашиглан дэлгэцэн дээр гарч ирэх үед холбогдох мэдээллийг нэмнэ. Энэхүү шинэ функцийг ашигласнаар та видеон дээр гарч ирсэн бүх хүмүүс, газар, брэндүүдийг хайж, тэдгээрийн талаарх дэлгэрэнгүй мэдээлэл, тухайлбал цагийн хуваарь, тайлбар, Bing хайлтын системийн холбоос зэрэг мэдээллийг үзэх боломжтой.
Редакторт зориулсан хүрээ илрүүлэх загвар
Энэхүү шинэ функц нь JSON-н дэлгэрэнгүй мэдээлэлд тус тусын хүрээнүүдэд хавсаргасан мета өгөгдөлд тэдгээрийн редакцийн төрлийг (жишээ нь: өргөн, дунд, ойрын, хэт ойрын зураг, хоёр зураг, олон хүн) төлөөлөх "шошго"-уудыг нэмдэг. , гадаа, дотор гэх мэт). Эдгээр зураг авалтын төрлийн шинж чанарууд нь клип, трэйлерт зориулсан видео засварлах, эсвэл уран сайхны зорилгоор зураг авалтын тодорхой хэв маягийг хайхад хэрэгтэй.
Сайжруулсан IPTC зураглалын нарийвчлал
Манай сэдэв илрүүлэх загвар нь тухайн сэдвийг тодорхой заагаагүй байсан ч транскрипци, оптик тэмдэгт таних (OCR) болон илрүүлсэн алдартнууд дээр үндэслэн видеоны сэдвийг тодорхойлдог. Бид эдгээр илрүүлсэн сэдвүүдийг Wikipedia, Bing, IPTC болон IAB гэсэн дөрвөн ангиллын хэсэгт хуваадаг. Энэхүү сайжруулалт нь хоёр дахь түвшний IPTC ангиллыг оруулах боломжийг бидэнд олгодог.
Эдгээр сайжруулалтын давуу талыг ашиглах нь одоогийн Видео индексжүүлэгч номын санг дахин индексжүүлэхтэй адил хялбар юм.
Шууд дамжуулалтын шинэ функц
Azure Media Services урьдчилан үзэхэд бид мөн шууд дамжуулах хоёр шинэ функцийг санал болгож байна.
Хиймэл оюун ухаанаар ажилладаг бодит цагийн транскрипци нь шууд дамжуулалтыг дараагийн түвшинд хүргэдэг
Шууд дамжуулалтад Azure Media Services-ийг ашигласнаар та аудио болон видео контентоос гадна автоматаар үүсгэгдсэн текст бичлэгийг агуулсан гаралтын урсгалыг хүлээн авах боломжтой боллоо. Текстийг хиймэл оюун ухаанд суурилсан бодит цагийн аудио транскрипцийг ашиглан бүтээжээ. Үр дүнг сайжруулахын тулд яриаг текст рүү хөрвүүлэхийн өмнө болон дараа нь захиалгат техникийг ашигладаг. Текстийг DASH, HLS CMAF эсвэл HLS TS-д нийлүүлсэн эсэхээс хамаарч IMSC1, TTML эсвэл WebVTT хэлбэрээр багцалсан.
24/7 OTT сувгийн бодит цагийн шугам кодчилол
Манай v3 API-г ашигласнаар та OTT (дээд) сувгуудыг үүсгэж, удирдаж, цацах боломжтой ба хүсэлтээр шууд видео (VOD, хүсэлтээр видео), сав баглаа боодол, дижитал эрхийн менежмент () зэрэг Azure Media Services-ийн бусад бүх функцийг ашиглах боломжтой. DRM, дижитал эрхийн менежмент).
Эдгээр функцүүдийн урьдчилан харах хувилбарыг харахын тулд зочилно уу
Шинэ багц үүсгэх боломжууд
Аудио тайлбарыг дэмжих
Өргөн нэвтрүүлгийн сувгуудаар дамжуулж буй контент нь ердийн аудио дохионоос гадна дэлгэцэн дээр юу болж байгааг амаар тайлбарласан аудио замтай байдаг. Энэ нь харааны бэрхшээлтэй үзэгчдэд хөтөлбөрүүдийг илүү хүртээмжтэй болгодог, ялангуяа контент нь үндсэндээ харааны шинж чанартай бол. Шинэ
ID3 мета өгөгдлийг оруулж байна
Үйлчлүүлэгчийн тоглуулагч руу зар сурталчилгаа эсвэл өөрчлөн мета өгөгдлийн үйл явдлуудыг оруулах дохио өгөхийн тулд өргөн нэвтрүүлэгчид видеонд суулгасан цаг хугацааны мета өгөгдлийг ихэвчлэн ашигладаг. SCTE-35 дохионы горимоос гадна бид одоо бас дэмждэг
Microsoft Azure-ийн түншүүд эцсийн шийдлүүдийг харуулдаг
олон улсын компани
Эх сурвалж: www.habr.com