మైక్రోసాఫ్ట్ యొక్క లక్ష్యం భూమిపై ఉన్న ప్రతి వ్యక్తి మరియు సంస్థను మరింత సాధించడానికి శక్తివంతం చేయడం. ఈ మిషన్ను నిజం చేయడానికి మీడియా పరిశ్రమ గొప్ప ఉదాహరణ. మేము మరిన్ని మార్గాల్లో మరియు మరిన్ని పరికరాలలో ఎక్కువ కంటెంట్ సృష్టించబడుతున్న మరియు వినియోగించబడే యుగంలో జీవిస్తున్నాము. IBC 2019లో, మేము పని చేస్తున్న తాజా ఆవిష్కరణలను మరియు మీ మీడియా అనుభవాన్ని మార్చడంలో అవి ఎలా సహాయపడతాయో మేము పంచుకున్నాము.
కట్ కింద వివరాలు!
ఈ పేజీ ఆన్లో ఉంది
వీడియో సూచిక ఇప్పుడు యానిమేషన్ మరియు బహుభాషా కంటెంట్కు మద్దతు ఇస్తుంది
గత సంవత్సరం IBCలో మేము మా అవార్డు గెలుచుకున్నాము
మా తాజా ఆఫర్లలో రెండు అత్యంత డిమాండ్ ఉన్న మరియు విభిన్నమైన ఫీచర్ల ప్రివ్యూలు ఉన్నాయి—యానిమేటెడ్ క్యారెక్టర్ రికగ్నిషన్ మరియు బహుభాషా స్పీచ్ ట్రాన్స్క్రిప్షన్—అలాగే వీడియో ఇండెక్సర్లో ప్రస్తుతం అందుబాటులో ఉన్న మోడల్లకు అనేక జోడింపులు ఉన్నాయి.
యానిమేటెడ్ క్యారెక్టర్ రికగ్నిషన్
యానిమేటెడ్ కంటెంట్ అనేది అత్యంత ప్రజాదరణ పొందిన కంటెంట్ రకాల్లో ఒకటి, అయితే మానవ ముఖాలను గుర్తించడానికి రూపొందించబడిన ప్రామాణిక కంప్యూటర్ విజన్ మోడల్లు దానితో సరిగ్గా పని చేయవు, ప్రత్యేకించి కంటెంట్లో మానవ ముఖ లక్షణాలు లేని అక్షరాలు ఉంటే. కొత్త ప్రివ్యూ వెర్షన్ వీడియో ఇండెక్సర్ను మైక్రోసాఫ్ట్ యొక్క అజూర్ కస్టమ్ విజన్ సేవతో మిళితం చేస్తుంది, యానిమేటెడ్ క్యారెక్టర్లను స్వయంచాలకంగా గుర్తించి మరియు సమూహపరిచే కొత్త మోడల్ల సెట్ను అందిస్తుంది మరియు ఇంటిగ్రేటెడ్ కస్టమ్ విజన్ మోడల్లను ఉపయోగించి వాటిని లేబుల్ చేయడం మరియు గుర్తించడం సులభం చేస్తుంది.
మోడల్లు ఒకే పైప్లైన్లో ఏకీకృతం చేయబడ్డాయి, ఎవరికైనా మెషిన్ లెర్నింగ్ పరిజ్ఞానం లేకుండా సేవను ఉపయోగించడానికి వీలు కల్పిస్తుంది. ఫలితాలు కోడ్ లేని వీడియో ఇండెక్సర్ పోర్టల్ ద్వారా లేదా మీ స్వంత అప్లికేషన్లలో శీఘ్ర అనుసంధానం కోసం REST API ద్వారా అందుబాటులో ఉంటాయి.
శిక్షణ మరియు పరీక్ష కోసం నిజమైన యానిమేటెడ్ కంటెంట్ను అందించిన కొంతమంది వినియోగదారులతో పాటు యానిమేటెడ్ క్యారెక్టర్లతో పని చేయడానికి మేము ఈ మోడల్లను రూపొందించాము. డేటా ప్రొవైడర్లలో ఒకరైన వయాకామ్ ఇంటర్నేషనల్ మీడియా నెట్వర్క్స్లో స్టూడియో టెక్నాలజీ మరియు పోస్ట్-ప్రొడక్షన్ సీనియర్ డైరెక్టర్ ఆండీ గట్టెరిడ్జ్ కొత్త కార్యాచరణ యొక్క విలువను చక్కగా సంగ్రహించారు: “బలమైన AI-శక్తితో కూడిన యానిమేటెడ్ కంటెంట్ డిస్కవరీని జోడించడం అనుమతిస్తుంది. మా లైబ్రరీ కంటెంట్ నుండి క్యారెక్టర్ మెటాడేటాను త్వరగా మరియు సమర్ధవంతంగా కనుగొని, జాబితా చేస్తాము.
మరీ ముఖ్యంగా, ఇది మా సృజనాత్మక బృందాలకు అవసరమైన కంటెంట్ను తక్షణమే కనుగొనే సామర్థ్యాన్ని అందిస్తుంది, మీడియాను నిర్వహించడంలో గడిపే సమయాన్ని తగ్గిస్తుంది మరియు సృజనాత్మకతపై దృష్టి పెట్టడానికి వీలు కల్పిస్తుంది.
మీరు యానిమేటెడ్ క్యారెక్టర్ రికగ్నిషన్తో పరిచయం చేసుకోవడం ప్రారంభించవచ్చు
బహుళ భాషలలో కంటెంట్ యొక్క గుర్తింపు మరియు లిప్యంతరీకరణ
వార్తలు, క్రానికల్స్ మరియు ఇంటర్వ్యూల వంటి కొన్ని మీడియా వనరులు వివిధ భాషలు మాట్లాడే వ్యక్తుల రికార్డింగ్లను కలిగి ఉంటాయి. ఇప్పటికే ఉన్న చాలా స్పీచ్-టు-టెక్స్ట్ సామర్థ్యాలకు ఆడియో రికగ్నిషన్ లాంగ్వేజ్ ముందుగానే పేర్కొనబడాలి, బహుభాషా వీడియోలను లిప్యంతరీకరించడం కష్టతరం చేస్తుంది.
వివిధ రకాల కంటెంట్ కోసం మా కొత్త ఆటోమేటిక్ స్పోకెన్ లాంగ్వేజ్ ఐడెంటిఫికేషన్ ఫీచర్ మీడియా అసెట్లలో కనిపించే భాషలను గుర్తించడానికి మెషిన్ లెర్నింగ్ టెక్నాలజీని ఉపయోగిస్తుంది. గుర్తించిన తర్వాత, ప్రతి భాషా విభాగం స్వయంచాలకంగా తగిన భాషలో ట్రాన్స్క్రిప్షన్ ప్రక్రియ ద్వారా వెళుతుంది, ఆపై అన్ని విభాగాలు ఒకే బహుళ-భాష ట్రాన్స్క్రిప్షన్ ఫైల్గా మిళితం చేయబడతాయి.
ఫలిత లిప్యంతరీకరణ వీడియో ఇండెక్సర్ యొక్క JSON అవుట్పుట్లో భాగంగా మరియు ఉపశీర్షిక ఫైల్లుగా అందుబాటులో ఉంటుంది. అవుట్పుట్ ట్రాన్స్క్రిప్ట్ అజూర్ సెర్చ్తో కూడా ఏకీకృతం చేయబడింది, ఇది మీ వీడియోలలోని వివిధ భాషా విభాగాల కోసం వెంటనే శోధించడానికి మిమ్మల్ని అనుమతిస్తుంది. అదనంగా, వీడియో ఇండెక్సర్ పోర్టల్తో పని చేస్తున్నప్పుడు బహుభాషా లిప్యంతరీకరణ అందుబాటులో ఉంటుంది, కాబట్టి మీరు ట్రాన్స్క్రిప్ట్ మరియు గుర్తించబడిన భాషను కాలక్రమేణా వీక్షించవచ్చు లేదా ప్రతి భాష కోసం వీడియోలోని నిర్దిష్ట ప్రదేశాలకు వెళ్లవచ్చు మరియు వీడియో ప్లే అవుతున్నప్పుడు బహుభాషా లిప్యంతరీకరణను క్యాప్షన్లుగా చూడవచ్చు. మీరు స్వీకరించిన వచనాన్ని పోర్టల్ మరియు API ద్వారా అందుబాటులో ఉన్న 54 భాషలలో దేనికైనా అనువదించవచ్చు.
కొత్త బహుభాషా కంటెంట్ గుర్తింపు ఫీచర్ మరియు వీడియో ఇండెక్సర్లో ఇది ఎలా ఉపయోగించబడుతుందనే దాని గురించి మరింత తెలుసుకోండి
అదనపు నవీకరించబడిన మరియు మెరుగుపరచబడిన నమూనాలు
మేము వీడియో సూచికకు కొత్త మోడల్లను కూడా జోడిస్తున్నాము మరియు దిగువ వివరించిన వాటితో సహా ఇప్పటికే ఉన్న వాటిని మెరుగుపరుస్తాము.
వ్యక్తులు మరియు స్థలాలతో అనుబంధించబడిన ఎంటిటీలను సంగ్రహించడం
ప్యారిస్లోని ఈఫిల్ టవర్ మరియు లండన్లోని బిగ్ బెన్ వంటి ప్రసిద్ధ పేర్లు మరియు స్థానాలను చేర్చడానికి మేము మా ప్రస్తుత బ్రాండ్ ఆవిష్కరణ సామర్థ్యాలను విస్తరించాము. అవి జనరేట్ చేయబడిన ట్రాన్స్క్రిప్ట్లో లేదా ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ (OCR) ఉపయోగించి స్క్రీన్పై కనిపించినప్పుడు, సంబంధిత సమాచారం జోడించబడుతుంది. ఈ కొత్త ఫీచర్తో, మీరు వీడియోలో కనిపించే అన్ని వ్యక్తులు, స్థలాలు మరియు బ్రాండ్ల కోసం శోధించవచ్చు మరియు మరింత సమాచారం కోసం సమయ స్లాట్లు, వివరణలు మరియు Bing శోధన ఇంజిన్కి లింక్లతో సహా వాటి గురించిన వివరాలను వీక్షించవచ్చు.
ఎడిటర్ కోసం ఫ్రేమ్ డిటెక్షన్ మోడల్
ఈ కొత్త ఫీచర్ వారి సంపాదకీయ రకాన్ని (ఉదాహరణకు, వైడ్ షాట్, మీడియం షాట్, క్లోజప్, ఎక్స్ట్రీమ్ క్లోజప్, రెండు షాట్లు, బహుళ వ్యక్తులు) సూచించడానికి JSON వివరాలలోని వ్యక్తిగత ఫ్రేమ్లకు జోడించిన మెటాడేటాకు "ట్యాగ్ల" సమితిని జోడిస్తుంది. , బాహ్య, ఇంటి లోపల, మొదలైనవి). క్లిప్లు మరియు ట్రైలర్ల కోసం వీడియోను సవరించేటప్పుడు లేదా కళాత్మక ప్రయోజనాల కోసం నిర్దిష్ట షాట్ శైలి కోసం చూస్తున్నప్పుడు ఈ షాట్ రకం లక్షణాలు ఉపయోగపడతాయి.
మెరుగైన IPTC మ్యాపింగ్ గ్రాన్యులారిటీ
మా టాపిక్ డిటెక్షన్ మోడల్, టాపిక్ స్పష్టంగా పేర్కొనబడనప్పటికీ, ట్రాన్స్క్రిప్షన్, ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ (OCR) మరియు గుర్తించబడిన ప్రముఖుల ఆధారంగా వీడియో అంశాన్ని నిర్ణయిస్తుంది. మేము ఈ గుర్తించిన అంశాలను నాలుగు వర్గీకరణ ప్రాంతాలకు మ్యాప్ చేస్తాము: వికీపీడియా, బింగ్, IPTC మరియు IAB. ఈ మెరుగుదల మాకు రెండవ-స్థాయి IPTC వర్గీకరణను చేర్చడానికి అనుమతిస్తుంది.
ఈ మెరుగుదలల ప్రయోజనాన్ని పొందడం అనేది మీ ప్రస్తుత వీడియో ఇండెక్సర్ లైబ్రరీని రీ-ఇండెక్సింగ్ చేసినంత సులభం.
కొత్త లైవ్ స్ట్రీమింగ్ ఫంక్షనాలిటీ
Azure Media Services ప్రివ్యూలో, మేము ప్రత్యక్ష ప్రసారం కోసం రెండు కొత్త ఫీచర్లను కూడా అందిస్తున్నాము.
AI-ఆధారిత నిజ-సమయ ట్రాన్స్క్రిప్షన్ ప్రత్యక్ష ప్రసారాన్ని తదుపరి స్థాయికి తీసుకువెళుతుంది
ప్రత్యక్ష ప్రసారం కోసం Azure మీడియా సేవలను ఉపయోగించడం ద్వారా, మీరు ఇప్పుడు ఆడియో మరియు వీడియో కంటెంట్తో పాటు స్వయంచాలకంగా రూపొందించబడిన టెక్స్ట్ ట్రాక్ను కలిగి ఉన్న అవుట్పుట్ స్ట్రీమ్ను అందుకోవచ్చు. ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ ఆధారంగా రియల్ టైమ్ ఆడియో ట్రాన్స్క్రిప్షన్ ఉపయోగించి టెక్స్ట్ సృష్టించబడింది. ఫలితాలను మెరుగుపరచడానికి స్పీచ్-టు-టెక్స్ట్ మార్పిడికి ముందు మరియు తర్వాత అనుకూల పద్ధతులు వర్తించబడతాయి. టెక్స్ట్ ట్రాక్ DASH, HLS CMAF లేదా HLS TSలో సరఫరా చేయబడిందా అనే దానిపై ఆధారపడి, IMSC1, TTML లేదా WebVTTలో ప్యాక్ చేయబడింది.
24/7 OTT ఛానెల్ల కోసం రియల్ టైమ్ లైన్ ఎన్కోడింగ్
మా v3 APIలను ఉపయోగించి, మీరు OTT (ఓవర్-ది-టాప్) ఛానెల్లను సృష్టించవచ్చు, నిర్వహించవచ్చు మరియు ప్రసారం చేయవచ్చు మరియు లైవ్ వీడియో ఆన్ డిమాండ్ (VOD, డిమాండ్ ఆన్ డిమాండ్), ప్యాకేజింగ్ మరియు డిజిటల్ హక్కుల నిర్వహణ వంటి అన్ని ఇతర Azure మీడియా సేవల ఫీచర్లను ఉపయోగించవచ్చు ( DRM, డిజిటల్ హక్కుల నిర్వహణ).
ఈ ఫీచర్ల ప్రివ్యూ వెర్షన్లను చూడటానికి, సందర్శించండి
కొత్త ప్యాకేజీ ఉత్పత్తి సామర్థ్యాలు
ఆడియో వివరణ ట్రాక్లకు మద్దతు
ప్రసార ఛానెల్ల ద్వారా ప్రసారం చేయబడిన కంటెంట్ తరచుగా సాధారణ ఆడియో సిగ్నల్తో పాటు స్క్రీన్పై ఏమి జరుగుతుందో శబ్ద వివరణలతో కూడిన ఆడియో ట్రాక్ను కలిగి ఉంటుంది. ఇది దృష్టి లోపం ఉన్న వీక్షకులకు ప్రోగ్రామ్లను మరింత ప్రాప్యత చేస్తుంది, ప్రత్యేకించి కంటెంట్ ప్రధానంగా దృశ్యమానంగా ఉంటే. కొత్తది
ID3 మెటాడేటాను చొప్పిస్తోంది
క్లయింట్ ప్లేయర్కు ప్రకటనలు లేదా అనుకూల మెటాడేటా ఈవెంట్ల చొప్పించడాన్ని సూచించడానికి, ప్రసారకర్తలు తరచుగా వీడియోలో పొందుపరిచిన టైమ్డ్ మెటాడేటాను ఉపయోగిస్తారు. SCTE-35 సిగ్నలింగ్ మోడ్లతో పాటు, మేము ఇప్పుడు కూడా సపోర్ట్ చేస్తాము
Microsoft Azure భాగస్వాములు ఎండ్-టు-ఎండ్ పరిష్కారాలను ప్రదర్శిస్తారు
అంతర్జాతీయ సంస్థ
మూలం: www.habr.com