Хиймэл оюун ухаантай 12 шинэ Azure Media Services

Майкрософт компанийн эрхэм зорилго бол дэлхий дээрх хүн бүр, байгууллага бүрийг илүү их зүйлд хүрэх боломжийг олгох явдал юм. Хэвлэл мэдээллийн салбар бол энэхүү эрхэм зорилгыг бодитой болгох сайхан жишээ юм. Бид илүү олон контент, илүү олон арга замаар, илүү олон төхөөрөмж дээр бүтээгдэж, хэрэглэж байгаа эрин үед амьдарч байна. IBC 2019 дээр бид ажиллаж байгаа хамгийн сүүлийн үеийн шинэлэг зүйлүүд болон тэдгээр нь таны хэвлэл мэдээллийн туршлагыг өөрчлөхөд хэрхэн тусалж болох талаар хуваалцсан.
Хиймэл оюун ухаантай 12 шинэ Azure Media Services
Зүсэлтийн доор дэлгэрэнгүй мэдээлэл!

Энэ хуудас идэвхтэй байна манай вэбсайт.

Video Indexer нь хөдөлгөөнт дүрс болон олон хэлний контентыг дэмждэг болсон

Өнгөрсөн жил IBC-д бид шагналын эзэн болсон Azure Media Services Video Indexer, мөн энэ жил бүр илүү сайн болсон. Video Indexer нь ярианы үг, царай, сэтгэл хөдлөл, сэдэв, брэнд зэрэг мэдээлэл, мета өгөгдлийг медиа файлаас автоматаар гаргаж авдаг бөгөөд үүнийг ашиглахын тулд та машин сургалтын мэргэжилтэн байх шаардлагагүй.

Бидний хамгийн сүүлийн үеийн санал болгож буй зүйлсэд маш их эрэлт хэрэгцээтэй, ялгаатай хоёр функц болох хөдөлгөөнт дүрийг таних, олон хэлээр ярьдаг ярианы транскрипцийг урьдчилан үзэх, мөн одоо байгаа видео индекст байгаа загваруудад хэд хэдэн нэмэлтийг оруулсан болно.

Хөдөлгөөнт дүрийг таних

Хиймэл оюун ухаантай 12 шинэ Azure Media Services
Хөдөлгөөнт контент нь хамгийн түгээмэл контентуудын нэг боловч хүний ​​нүүр царайг таних зориулалттай компьютерийн харааны стандарт загварууд нь үүнтэй сайн ажиллахгүй, ялангуяа контент нь хүний ​​нүүрний онцлоггүй дүрүүдийг агуулж байвал сайн ажилладаггүй. Урьдчилан үзэх шинэ хувилбар нь Video Indexer-ийг Microsoft-ын Azure Custom Vision үйлчилгээтэй хослуулсан бөгөөд хөдөлгөөнт дүрүүдийг автоматаар илрүүлж, бүлэглэж, тусгайлсан харааны загваруудыг ашиглан шошголох, танихад хялбар болгодог шинэ багц загваруудыг хүргэж байна.

Загваруудыг нэг хоолойд нэгтгэсэн бөгөөд хэн ч машин сурах ямар ч мэдлэггүйгээр үйлчилгээг ашиглах боломжийг олгодог. Үр дүнг кодгүй Video Indexer портал эсвэл REST API-ээр дамжуулан өөрийн программд хурдан нэгтгэх боломжтой.

Бид эдгээр загваруудыг сургах, турших зорилгоор бодит хүүхэлдэйн контентоор хангадаг зарим хэрэглэгчдийн хамт хүүхэлдэйн киноны дүрүүдтэй ажиллах зорилгоор бүтээсэн. Шинэ функцын үнэ цэнийг өгөгдөл нийлүүлэгчдийн нэг байсан Viacom International Media Networks-ийн студи технологи, пост-продакшн хариуцсан ахлах захирал Энди Гуттериж сайн дүгнэж: "Хиймэл оюун ухаанаар ажилладаг хүчирхэг хүүхэлдэйн контентыг нээх боломжтой болно. Бид номын сангийн контентоос тэмдэгтийн мета өгөгдлийг хурдан бөгөөд үр дүнтэй хайж олох, каталогжуулах.

Хамгийн гол нь энэ нь манай бүтээлч багуудад хэрэгцээтэй контентоо шууд олох боломжийг олгож, хэвлэл мэдээллийн хэрэгслийг удирдахад зарцуулдаг цаг хугацааг багасгаж, бүтээлч байдалд анхаарлаа төвлөрүүлэх боломжийг олгоно.”

Та хүүхэлдэйн киноны дүрийг танихтай танилцаж эхлэх боломжтой баримт бичгийн хуудас.

Олон хэл дээрх агуулгыг тодорхойлох, хуулбарлах

Мэдээ, түүх, ярилцлага зэрэг зарим хэвлэл мэдээллийн эх сурвалжид өөр өөр хэлээр ярьдаг хүмүүсийн бичлэг байдаг. Одоо байгаа ихэнх ярианаас текст рүү шилжих боломжууд нь аудио таних хэлийг урьдчилан зааж өгөхийг шаарддаг бөгөөд энэ нь олон хэл дээрх видеог хуулбарлахад хэцүү болгодог.

Төрөл бүрийн контентод зориулсан ярианы хэлийг автоматаар таних шинэ онцлог нь хэвлэл мэдээллийн хэрэгслээр олдсон хэлийг тодорхойлохын тулд машин сургалтын технологийг ашигладаг. Илрүүлсний дараа хэлний сегмент бүр автоматаар тохирох хэлээр транскрипцийн процессыг дамжиж, дараа нь бүх сегментүүд нэг олон хэлний транскрипцийн файлд нэгтгэгдэнэ.

Хиймэл оюун ухаантай 12 шинэ Azure Media Services

Үр дүнгийн хуулбарыг Видео индексжүүлэгчийн JSON гаралтын хэсэг болон хадмал орчуулгын файл хэлбэрээр авах боломжтой. Гаралтын хуулбар нь мөн Azure хайлттай нэгтгэгдсэн бөгөөд энэ нь танд видеондоо өөр өөр хэлний сегментүүдийг нэн даруй хайх боломжийг олгоно. Нэмж дурдахад, Video Indexer порталтай ажиллах үед олон хэлний транскрипцийг ашиглах боломжтой бөгөөд ингэснээр та хуулбар болон тодорхойлсон хэлийг цаг хугацааны явцад харах эсвэл хэл бүрийн видеоны тодорхой газар руу очиж, олон хэл дээрх транскрипцийг видео тоглож байх үед тайлбар хэлбэрээр харах боломжтой. Та хүлээн авсан текстийг портал болон API-ээр дамжуулан боломжтой 54 хэл рүү орчуулах боломжтой.

Олон хэл дээрх агуулгыг таних шинэ функц болон үүнийг Video Indexer-д хэрхэн ашигладаг талаар нэмэлт мэдээлэл аваарай баримт бичгийг уншина уу.

Нэмэлт шинэчлэгдсэн, сайжруулсан загварууд

Бид мөн видео индексжүүлэгчид шинэ загваруудыг нэмж, одоо байгаа загваруудыг, тэр дундаа доор тайлбарласан загваруудыг сайжруулж байна.

Хүмүүс болон газартай холбоотой нэгжүүдийг гаргаж авах

Бид Парис дахь Эйфелийн цамхаг, Лондон дахь Биг Бен зэрэг алдартай нэр, байршлыг багтаахын тулд одоо байгаа брэндийг илрүүлэх боломжоо өргөжүүлсэн. Тэдгээр нь үүсгэсэн хуулбар эсвэл оптик тэмдэгт таних (OCR) ашиглан дэлгэцэн дээр гарч ирэх үед холбогдох мэдээллийг нэмнэ. Энэхүү шинэ функцийг ашигласнаар та видеон дээр гарч ирсэн бүх хүмүүс, газар, брэндүүдийг хайж, тэдгээрийн талаарх дэлгэрэнгүй мэдээлэл, тухайлбал цагийн хуваарь, тайлбар, Bing хайлтын системийн холбоос зэрэг мэдээллийг үзэх боломжтой.

Хиймэл оюун ухаантай 12 шинэ Azure Media Services

Редакторт зориулсан хүрээ илрүүлэх загвар

Энэхүү шинэ функц нь JSON-н дэлгэрэнгүй мэдээлэлд тус тусын хүрээнүүдэд хавсаргасан мета өгөгдөлд тэдгээрийн редакцийн төрлийг (жишээ нь: өргөн, дунд, ойрын, хэт ойрын зураг, хоёр зураг, олон хүн) төлөөлөх "шошго"-уудыг нэмдэг. , гадаа, дотор гэх мэт). Эдгээр зураг авалтын төрлийн шинж чанарууд нь клип, трэйлерт зориулсан видео засварлах, эсвэл уран сайхны зорилгоор зураг авалтын тодорхой хэв маягийг хайхад хэрэгтэй.

Хиймэл оюун ухаантай 12 шинэ Azure Media Services
Илүү их судла Video Indexer дээр хүрээний төрлийг илрүүлэх.

Сайжруулсан IPTC зураглалын нарийвчлал

Манай сэдэв илрүүлэх загвар нь тухайн сэдвийг тодорхой заагаагүй байсан ч транскрипци, оптик тэмдэгт таних (OCR) болон илрүүлсэн алдартнууд дээр үндэслэн видеоны сэдвийг тодорхойлдог. Бид эдгээр илрүүлсэн сэдвүүдийг Wikipedia, Bing, IPTC болон IAB гэсэн дөрвөн ангиллын хэсэгт хуваадаг. Энэхүү сайжруулалт нь хоёр дахь түвшний IPTC ангиллыг оруулах боломжийг бидэнд олгодог.
Эдгээр сайжруулалтын давуу талыг ашиглах нь одоогийн Видео индексжүүлэгч номын санг дахин индексжүүлэхтэй адил хялбар юм.

Шууд дамжуулалтын шинэ функц

Azure Media Services урьдчилан үзэхэд бид мөн шууд дамжуулах хоёр шинэ функцийг санал болгож байна.

Хиймэл оюун ухаанаар ажилладаг бодит цагийн транскрипци нь шууд дамжуулалтыг дараагийн түвшинд хүргэдэг

Шууд дамжуулалтад Azure Media Services-ийг ашигласнаар та аудио болон видео контентоос гадна автоматаар үүсгэгдсэн текст бичлэгийг агуулсан гаралтын урсгалыг хүлээн авах боломжтой боллоо. Текстийг хиймэл оюун ухаанд суурилсан бодит цагийн аудио транскрипцийг ашиглан бүтээжээ. Үр дүнг сайжруулахын тулд яриаг текст рүү хөрвүүлэхийн өмнө болон дараа нь захиалгат техникийг ашигладаг. Текстийг DASH, HLS CMAF эсвэл HLS TS-д нийлүүлсэн эсэхээс хамаарч IMSC1, TTML эсвэл WebVTT хэлбэрээр багцалсан.

24/7 OTT сувгийн бодит цагийн шугам кодчилол

Манай v3 API-г ашигласнаар та OTT (дээд) сувгуудыг үүсгэж, удирдаж, цацах боломжтой ба хүсэлтээр шууд видео (VOD, хүсэлтээр видео), сав баглаа боодол, дижитал эрхийн менежмент () зэрэг Azure Media Services-ийн бусад бүх функцийг ашиглах боломжтой. DRM, дижитал эрхийн менежмент).
Эдгээр функцүүдийн урьдчилан харах хувилбарыг харахын тулд зочилно уу Azure Media Services нийгэмлэг.

Хиймэл оюун ухаантай 12 шинэ Azure Media Services

Шинэ багц үүсгэх боломжууд

Аудио тайлбарыг дэмжих

Өргөн нэвтрүүлгийн сувгуудаар дамжуулж буй контент нь ердийн аудио дохионоос гадна дэлгэцэн дээр юу болж байгааг амаар тайлбарласан аудио замтай байдаг. Энэ нь харааны бэрхшээлтэй үзэгчдэд хөтөлбөрүүдийг илүү хүртээмжтэй болгодог, ялангуяа контент нь үндсэндээ харааны шинж чанартай бол. Шинэ аудио тайлбар функц Энэ нь танд аудио бичлэгийн аль нэгийг аудио тайлбарын бичлэг (AD, аудио тайлбар) болгон тэмдэглэх боломжийг олгож, тоглогчдод AD замыг үзэгчдэд нээлттэй болгох боломжийг олгоно.

ID3 мета өгөгдлийг оруулж байна

Үйлчлүүлэгчийн тоглуулагч руу зар сурталчилгаа эсвэл өөрчлөн мета өгөгдлийн үйл явдлуудыг оруулах дохио өгөхийн тулд өргөн нэвтрүүлэгчид видеонд суулгасан цаг хугацааны мета өгөгдлийг ихэвчлэн ашигладаг. SCTE-35 дохионы горимоос гадна бид одоо бас дэмждэг ID3v2 болон бусад захиалгат схемүүд, үйлчлүүлэгчийн аппликейшнд ашиглахын тулд програм хөгжүүлэгчийн тодорхойлсон.

Microsoft Azure-ийн түншүүд эцсийн шийдлүүдийг харуулдаг

Битмовин Microsoft Azure-д зориулсан Bitmovin Video Encoding болон Bitmovin Video Player-г танилцуулж байна. Хэрэглэгчид одоо Azure-д эдгээр кодчилол болон тоглуулах шийдлүүдийг ашиглах боломжтой бөгөөд гурван үе шаттай кодчилол, AV1/VC кодлогчийн дэмжлэг, олон хэлний хадмал орчуулга, QoS, зар сурталчилгаа, видео бичлэгийг хянах урьдчилан нэгтгэсэн видео аналитик зэрэг дэвшилтэт боломжуудыг ашиглах боломжтой.

Эвергент Azure дээр хэрэглэгчийн амьдралын мөчлөгийн удирдлагын платформыг харуулж байна. Орлого болон хэрэглэгчийн амьдралын мөчлөгийн удирдлагын шийдлүүдийн тэргүүлэгч нийлүүлэгчийн хувьд Evergent нь Azure AI-г ашиглан дээд зэрэглэлийн энтертайнмент үзүүлэгчдэд үйлчлүүлэгчийн амьдралын мөчлөгийн чухал цэгүүдэд зорилтот үйлчилгээний багц, саналуудыг бий болгосноор үйлчлүүлэгчийг олж авах, хадгалахад тусалдаг.

Haivision Үүлэнд суурилсан медиа чиглүүлэлтийн ухаалаг үйлчилгээ болох SRT Hub-ыг харуулах бөгөөд энэ нь үйлчлүүлэгчдэдээ төгсгөл хүртэлх ажлын урсгалыг өөрчлөхөд тусалдаг. Azure Data Box Edge мөн Avid, Telestream, Wowza, Cinegy болон Make.tv-ийн Hublets-ийн тусламжтайгаар ажлын урсгалыг өөрчлөх.

SES нь хиймэл дагуулын болон удирдлагатай медиа үйлчилгээний хэрэглэгчиддээ зориулан Azure платформ дээр өргөн нэвтрүүлгийн түвшний медиа үйлчилгээний багцыг боловсруулсан. SES нь мастер тоглуулах, нутагшуулсан тоглуулах, зар илрүүлэх, солих, Azure дээр өндөр чанартай бодит цагийн 24x7 олон сувгийн кодчилол зэрэг бүрэн удирддаг тоглуулах үйлчилгээний шийдлүүдийг харуулах болно.

SyncWords нь тохиромжтой үүлэн хэрэгслүүд болон гарын үсгийн автоматжуулалтын технологийг Azure дээр ашиглах боломжтой болгодог. Эдгээр саналууд нь хэвлэл мэдээллийн байгууллагуудад Azure дээрх шууд болон офлайн видео ажлын урсгалдаа хадмал орчуулга, түүний дотор гадаад хэл дээрх хадмал орчуулгыг автоматаар нэмэхэд хялбар болгоно.
олон улсын компани Тата ЭлкссиТехнологийн үйлчилгээний компани нь OTT SaaS платформ TEPlay-ээ Azure Media Services-т нэгтгэж, OTT контентыг үүлэн дээрээс хүргэж байна. Tata Elxsi мөн Microsoft Azure-д Falcon Eye чанарын мониторингийн шийдлийг авчирч, шийдвэр гаргахад аналитик болон хэмжүүрээр хангасан.

Verizon медиа стриминг платформоо Azure дээр бета хувилбар болгон ашиглах боломжтой болгож байна. Verizon Media Platform нь DRM, зар оруулах, ганцаарчилсан сесс, динамик контент солих, видео хүргэх зэргийг багтаасан аж ахуйн нэгжийн түвшний удирдлагатай OTT шийдэл юм. Интеграци нь ажлын урсгал, дэлхийн дэмжлэг, цар хүрээг хялбарчилж, Azure-д олдсон өвөрмөц боломжуудын заримыг нээж өгдөг.

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх