د مایکروسافټ ماموریت دا دی چې په سیار کې هر شخص او سازمان ځواکمن کړي ترڅو ډیر څه ترلاسه کړي. د رسنیو صنعت د دې ماموریت د واقعیت کولو یوه ښه بیلګه ده. موږ په داسې دور کې ژوند کوو چیرې چې ډیر مینځپانګه رامینځته کیږي او مصرف کیږي ، په ډیرو لارو او ډیرو وسیلو کې. په IBC 2019 کې، موږ وروستي نوښتونه شریک کړل چې موږ یې کار کوو او دا څنګه کولی شي ستاسو د رسنیو تجربه بدلولو کې مرسته وکړي.
د کټ لاندې توضیحات!
دا پاڼه روانه ده
د ویډیو انډیکسر اوس د حرکت او څو ژبو مینځپانګې ملاتړ کوي
تیر کال په IBC کې موږ خپله جایزه ګټونکې کړه
زموږ وروستي وړاندیزونو کې د دوه خورا مطلوب او مختلف ځانګړتیاو لیدونه شامل دي — د متحرک کرکټر پیژندنه او د څو ژبو وینا لیږد — او همدارنګه په اوسني ماډلونو کې ډیری اضافه کول چې نن ورځ په ویډیو انډیکسر کې شتون لري.
متحرک کرکټر پیژندنه
متحرک مینځپانګه د مینځپانګې یو له خورا مشهور ډولونو څخه دی ، مګر د کمپیوټر لید معیاري ماډلونه چې د انسان مخونو پیژندلو لپاره ډیزاین شوي د دې سره ښه کار نه کوي ، په ځانګړي توګه که چیرې مینځپانګه د انسان د مخ ځانګړتیاو پرته کرکټرونه ولري. د مخکتنې نوې نسخه د ویډیو انډیکسر د مایکروسافټ د Azure Custom Vision خدمت سره یوځای کوي، د ماډلونو نوې سیټ وړاندې کوي چې په اتوماتيک ډول متحرک کرکټرونه کشف او ګروپ کوي او د مربوط دودیز لید ماډلونو په کارولو سره لیبل کول او پیژندل اسانه کوي.
ماډلونه په یو واحد پایپ لاین کې مدغم شوي، هرچا ته اجازه ورکوي چې د ماشین زده کړې پوهې پرته خدمت وکاروي. پایلې ستاسو په خپلو غوښتنلیکونو کې د ګړندي ادغام لپاره د بې کوډ ویډیو انډیکسر پورټل یا د REST API له لارې شتون لري.
موږ دا ماډلونه د متحرک کرکټرونو سره د ځینې مصرف کونکو سره کار کولو لپاره رامینځته کړي چې د روزنې او ازموینې لپاره ریښتیني متحرک مینځپانګې چمتو کړي. د نوي فعالیت ارزښت د ویاکوم انټرنیشنل میډیا شبکې کې د سټوډیو ټیکنالوژۍ او پوسټ تولید لوړ پوړی رییس انډي ګوټریج لخوا په ښه توګه خلاص شوی و ، څوک چې د ډیټا چمتو کونکو څخه و: "د قوي AI ځواک لرونکي متحرک مینځپانګې کشف اضافه کول به اجازه ورکړي. موږ د خپل کتابتون له منځپانګې څخه د کرکټر میټاډاټا په چټکه او مؤثره توګه موندلو او کتلاګ کړو.
تر ټولو مهم، دا به زموږ تخلیقي ټیمونو ته وړتیا ورکړي چې په سمدستي توګه هغه مینځپانګې ومومي چې دوی ورته اړتیا لري، د رسنیو اداره کولو وخت کم کړي او دوی ته اجازه ورکړي چې په خلاقیت تمرکز وکړي.
تاسو کولی شئ د متحرک کرکټر پیژندنې سره آشنا پیل وکړئ
په څو ژبو کې د منځپانګې پیژندنه او لیږد
د رسنیو ځینې سرچینې، لکه خبرونه، تاریخونه او مرکې، د هغو خلکو ریکارډونه لري چې په مختلفو ژبو خبرې کوي. د وینا څخه متن ته ډیری موجوده وړتیاوې د آډیو پیژندنې ژبه ته اړتیا لري چې دمخه مشخص شي ، دا د څو ژبو ویډیوګانو لیږد ستونزمن کوي.
د مختلفو ډولونو محتوياتو لپاره زموږ د نوي اتوماتیک خبرې ژبې پیژندنې ځانګړتیا د ماشین زده کړې ټیکنالوژي کاروي ترڅو د رسنیو په شتمنیو کې موندل شوي ژبې پیژني. یوځل چې کشف شو، د هرې ژبې برخه په اتوماتيک ډول په مناسبه ژبه کې د لیږد پروسې څخه تیریږي، او بیا ټولې برخې په یو څو ژبو لیږد فایل کې یوځای کیږي.
پایله لرونکی لیږد د ویډیو انډیکسر JSON محصول برخې او د فرعي سرلیک فایلونو په توګه شتون لري. د محصول لیږد هم د Azure لټون سره مدغم شوی ، تاسو ته اجازه درکوي سمدلاسه ستاسو په ویډیوګانو کې د مختلف ژبو برخو لټون وکړئ. سربیره پردې، څو ژبني لیږد شتون لري کله چې د ویډیو انډیکسر پورټل سره کار کوئ، نو تاسو کولی شئ د وخت په تیریدو سره لیږد او پیژندل شوې ژبه وګورئ، یا د هرې ژبې لپاره په ویډیو کې ځانګړي ځایونو ته لاړ شئ او څو ژبني لیږد د سرلیکونو په توګه وګورئ لکه څنګه چې ویډیو پلی کیږي. تاسو کولی شئ ترلاسه شوی متن د پورټل او API له لارې په 54 موجودو ژبو کې وژباړئ.
د نوي څو ژبو مینځپانګې پیژندنې ځانګړتیا او دا چې څنګه په ویډیو انډیکسر کې کارول کیږي په اړه نور معلومات زده کړئ
اضافي تازه شوي او پرمختللي ماډلونه
موږ د ویډیو انډیکسر کې نوي ماډلونه هم اضافه کوو او موجوده موډلونو ته وده ورکوو ، پشمول هغه چې لاندې تشریح شوي.
د خلکو او ځایونو سره تړلې ادارې استخراج
موږ د خپل اوسني برانډ کشف ظرفیتونه پراخه کړي ترڅو مشهور نومونه او ځایونه شامل کړي، لکه په پاریس کې ایفل ټاور او په لندن کې بیګ بین. کله چې دوی په تولید شوي لیږد یا سکرین کې د نظری کرکټر پیژندنې (OCR) په کارولو سره څرګندیږي ، اړوند معلومات اضافه کیږي. د دې نوې بڼې سره، تاسو کولی شئ د ټولو خلکو، ځایونو او برانڈونو لټون وکړئ چې په ویډیو کې ښکاره شوي او د دوی په اړه توضیحات وګورئ، په شمول د وخت سلاټونه، توضیحات، او د نورو معلوماتو لپاره د Bing لټون انجن سره لینکونه.
د مدیر لپاره د چوکاټ کشف ماډل
دا نوې خصوصیت د JSON توضیحاتو کې د انفرادي چوکاټونو سره وصل شوي میټاډاټا ته د "ټاګونو" سیټ اضافه کوي ترڅو د دوی اداری ډول استازیتوب وکړي (د مثال په توګه ، پراخه شاټ ، متوسط شاټ ، نږدې اپ ، خورا نږدې ، دوه شاټونه ، ډیری خلک بهر، کور دننه، او داسې نور). د دې شاټ ډول ځانګړتیاوې ګټورې دي کله چې د کلپونو او ټریلرونو لپاره ویډیو ایډیټ کړئ، یا کله چې د هنري موخو لپاره د ځانګړي شاټ سټایل په لټه کې وي.
د IPTC نقشه کولو ګرانولریت ښه شوی
زموږ د موضوع کشف ماډل د ویډیو موضوع د لیږد پراساس ټاکي، د نظری کرکټر پیژندنه (OCR)، او پیژندل شوي مشهور شخصیتونه، حتی که موضوع په واضح ډول نه وي مشخص شوې. موږ دا کشف شوي موضوعات په څلورو طبقه بندي برخو کې نقشه کوو: ويکيپېډيا، Bing، IPTC، او IAB. دا وده موږ ته اجازه راکوي چې د دویمې کچې IPTC طبقه بندي شامل کړو.
د دې پرمختګونو څخه ګټه پورته کول دومره اسانه دي لکه څنګه چې ستاسو د اوسني ویډیو انډیکسر کتابتون بیا لیست کول.
د نوي ژوندی جریان فعالیت
د Azure میډیا خدماتو مخکتنې کې، موږ د ژوندی خپرونې لپاره دوه نوې بڼې هم وړاندې کوو.
د AI لخوا چلول شوي ریښتیني وخت لیږد راتلونکي کچې ته ژوندی جریان لیږدوي
د ژوندی جریان لپاره د Azure میډیا خدماتو په کارولو سره ، تاسو اوس کولی شئ د محصول جریان ترلاسه کړئ چې پکې د آډیو او ویډیو مینځپانګې سربیره په اوتومات ډول تولید شوي متن ټریک شامل دي. متن د مصنوعي استخباراتو پراساس د ریښتیني وخت آډیو لیږد په کارولو سره رامینځته شوی. دودیز تخنیکونه د پایلو ښه کولو لپاره د وینا څخه متن تبادلې دمخه او وروسته پلي کیږي. د متن ټریک په IMSC1، TTML یا WebVTT کې بسته شوی، په دې پورې اړه لري چې آیا دا په DASH، HLS CMAF یا HLS TS کې چمتو کیږي.
د 24/7 OTT چینلونو لپاره د ریښتیني وخت لاین کوډ کول
زموږ د v3 APIs په کارولو سره، تاسو کولی شئ د OTT (پورته پورته) چینلونه جوړ، اداره او نشر کړئ، او د Azure میډیا خدماتو نور ټول ځانګړتیاوې وکاروئ لکه د غوښتنې په اړه ژوندۍ ویډیو (VOD، ویډیو په غوښتنې)، بسته بندي او د ډیجیټل حقونو مدیریت ( DRM، د ډیجیټل حقونو مدیریت).
د دې ځانګړتیاوو د مخکتنې نسخې لیدلو لپاره، لیدنه وکړئ
د نوي کڅوړې تولید وړتیاوې
د آډیو توضیحاتو ټریکونو لپاره ملاتړ
په نشراتي چینلونو کې نشر شوي مینځپانګې اکثرا د منظم آډیو سیګنال سربیره په سکرین کې څه پیښیږي د لفظي توضیحاتو سره آډیو ټریک لري. دا برنامه د لید ضعیف لیدونکو لپاره د لاسرسي وړ ګرځوي ، په ځانګړي توګه که مینځپانګه اساسا لید وي. نوی
د ID3 میټاډاټا داخلول
د پیرودونکي پلیر ته د اعلاناتو یا دودیز میټاډاټا پیښو داخلولو سیګنال کولو لپاره ، خپرونکي اکثرا په ویډیو کې ځای پرځای شوي وخت شوي میټاډاټا کاروي. د SCTE-35 سیګنلینګ حالتونو سربیره ، موږ اوس هم ملاتړ کوو
د مایکروسافټ Azure ملګري د پای څخه تر پای پورې حلونه ښیې
نړیوال شرکت
سرچینه: www.habr.com