Wideokonferencje to obecnie rynek i nowe technologie. Longread, część druga

Wideokonferencje to obecnie rynek i nowe technologie. Longread, część druga

Publikujemy drugą część przeglądu o rynku wideokonferencji. Jakie wydarzenia pojawiły się w ciągu ostatniego roku, jak przenikają do naszego życia i stają się znane. Powyżej znajduje się zrzut ekranu filmu SRI International, który można obejrzeć pod koniec artykułu.

Часть 1:
— Rynek wideokonferencji – przekrój globalny
— Komunikacja wideo sprzętowa i programowa
— Pokoje gościnne — akwaria
— Kto wygrywa: fuzje i przejęcia
– Nie sam film
— Konkurencja czy integracja?
— Kompresja i transmisja danych

Część 2:
- Inteligentne konferencje
- Niezwykłe przypadki. Kontrola robotów i egzekwowanie prawa

Inteligentne konferencje

Branża wideokonferencji jest dość dynamiczna pod względem wprowadzania nowych technologii, co roku pojawia się wiele nowości. Uczenie maszynowe i sztuczna inteligencja znacznie poszerzają możliwości.

Technologia zamiany mowy na tekst stała się najbliższa rzeczywistości i pożądana. Maszyna całkiem skutecznie rozpoznaje wyraźną, wyraźną mowę, ale mowa na żywo z rozpoznawaniem głosu po głosie nie jest jeszcze zbyt dobra. Jednak komunikacja wideo upraszcza procedurę dzięki sekwencyjnym replikom w różnych kanałach, a wielu dostawców ogłosiło już usługi oparte na rozpoznawaniu mowy.

Oprócz napisów na żywo, które są wygodne dla osób niedosłyszących lub przebywających w miejscach publicznych, firmy potrzebują także narzędzi do zarządzania wynikami spotkań. Przeglądanie mnóstwa filmów jest niewygodne; ktoś musi prowadzić protokoły, nagrywać umowy i przekształcać je w plany. Osoba nadal pomaga zaznaczać i sortować odszyfrowany tekst, ale jest to już znacznie wygodniejsze niż samodzielne zapisywanie go w notatniku. W razie potrzeby znacznie łatwiej jest przeszukiwać transkrybowane teksty i utworzone tagi już po fakcie. Integracja z planistami i różnymi usługami zarządzania projektami znacznie zwiększa efektywność narzędzi komunikacji wideo. Na przykład Microsoft i BlueJeans pracują w tym kierunku. W tym celu Cisco kupiło Voiceę.

Wśród popularnych funkcji warto zwrócić uwagę na zamianę tła. Za plecami mówiącego można umieścić dowolny obraz. Ta możliwość jest dostępna dla różnych producentów, w tym rosyjskiego TrueConf, od dłuższego czasu. Wcześniej do jego wdrożenia wymagany był chromakey (zielony baner lub ściana) za głośnikiem. Teraz są już rozwiązania, które mogą się bez tego obejść – na przykład Zoom. Dosłownie w przededniu premiery materiału ogłoszono wymianę tła w Microsoft Teams.

Microsoft jest również dobry w zapewnianiu ludziom przejrzystości. W sierpniu 2019 r. w Teams Rooms wprowadzono inteligentne przechwytywanie. Oprócz aparatu głównego, który przeznaczony jest do fotografowania ludzi, wykorzystywana jest także dodatkowa kamera treściowa, której zadaniem jest nadawanie obrazu zwykłej tablicy markerowej, na której mówiący może coś napisać lub narysować. Jeśli prezenter da się ponieść emocjom i zasłoni to, co jest napisane, system sprawi, że będzie on przezroczysty i przywróci obraz z kamery treści.

Wideokonferencje to obecnie rynek i nowe technologie. Longread, część druga
Inteligentne przechwytywanie, Microsoft

Agora opracowała algorytm rozpoznawania emocji. System oparty na serwerze chmurowym przetwarza dane wideo, identyfikuje na nich twarze i informuje użytkownika, jakie emocje aktualnie pokazuje rozmówca. Wskazanie stopnia dokładności oznaczenia. Na razie rozwiązanie sprawdza się tylko w przypadku komunikacji jeden na jednego, ale w przyszłości planowane jest wdrożenie go w przypadku konferencji z udziałem wielu użytkowników. Produkt opiera się na głębokim uczeniu, w szczególności wykorzystywane są biblioteki Keras i TensorFlow.

Wideokonferencje to obecnie rynek i nowe technologie. Longread, część druga
Rozpoznawanie emocji od Agory

Technologia rozumiejąca język migowy otworzyła całkowicie nowy obszar zastosowań systemów wideokonferencyjnych. Aplikację GnoSys stworzyła firma Evalk z Holandii. Usługa rozpoznaje wszystkie popularne języki migowe. Wystarczy, że podczas rozmowy wideo lub zwykłej rozmowy położysz przed sobą telefon lub tablet. GnoSys przetłumaczy z języka migowego i odtworzy Twoją mowę dla rozmówcy siedzącego naprzeciwko lub po drugiej stronie ekranu. Informacje na temat rozwoju Evalk pojawiły się w lutym 2019 roku. Następnie partnerem projektu było Indyjskie Stowarzyszenie Osób Niesłyszących – Krajowe Stowarzyszenie Głuchych. Dzięki jej pomocy programiści uzyskali dostęp do ogromnej ilości danych na temat języków migowych, dialektów i niuansów użycia, a w Indiach trwały aktywne testy.

W dzisiejszych czasach kwestia wycieku poufnych informacji z negocjacji staje się bardzo aktualna. Zoom ogłosił wprowadzenie podpisu ultradźwiękowego na początku 2019 roku. Każdy film wyposażony jest w specjalny kod ultradźwiękowy, który pozwala na śledzenie źródła wycieku informacji w przypadku, gdy nagranie trafiło do Internetu.

Rzeczywistość wirtualna i rozszerzona wkraczają także do wideokonferencji. Microsoft sugeruje używanie nowych okularów HoloLens 2 w połączeniu z usługą współpracy w chmurze Teams.

Wideokonferencje to obecnie rynek i nowe technologie. Longread, część druga
HoloLens2 firmy Microsoft

Belgijski startup Mimesys poszedł jeszcze dalej. Firma opracowała technologię wirtualnej obecności, która pozwala stworzyć model osoby (awatara) i umieścić go we wspólnej przestrzeni roboczej, co można obserwować za pomocą okularów wirtualnej rzeczywistości. Mimesys został przejęty przez Magic Leap, znanego na całym świecie producenta okularów VR. Eksperci branżowi mocno łączą perspektywy rozwoju technologii wirtualnej i rozszerzonej rzeczywistości z rozwojem sieci mobilnych 5G, gdyż tylko oni będą w stanie zapewnić niezbędną prędkość i niezawodność, aby udostępnić tego typu usługi szerokiemu gronu klientów.

Wideokonferencje to obecnie rynek i nowe technologie. Longread, część druga
Wspólna praca nad projektem w wirtualnej rzeczywistości, fot. Mimesys

Niezwykłe przypadki. Kontrola robotów i egzekwowanie prawa

Na zakończenie trochę o tym jak poszerza się zakres komunikacji wideo. Najbardziej oczywistym jest zdalne sterowanie mechanizmami w obszarach niebezpiecznych i niewygodnych środowiskach, chroniące ludzi przed niebezpieczną lub rutynową pracą. Tematy związane z zarządzaniem pojawiały się w aktualnościach w ciągu ostatniego roku, na przykład: roboty teleobecności w kosmosie, robotycznych asystentów domowych, BIEŁAZ w kopalni węgla. Trwają prace nad rozwiązaniami dla systemów penitencjarnych i organów ścigania.

Niedawno pojawiła się informacja o nowym rozwoju instytutu badawczego SRI International (USA), gdzie problem bezpieczeństwa policji jest dość palący. Według statystyk, co roku agresywni kierowcy dokonują około 4,5 tys. ataków na funkcjonariuszy organów ścigania. Mniej więcej co setny z tych przypadków kończy się śmiercią funkcjonariusza policji.

Opracowanie to złożony system montowany na radiowozie. Jest wyposażony w kamery wysokiej rozdzielczości, wyświetlacz, głośniki i mikrofony. Znajduje się tu także alkomat, skaner do sprawdzania autentyczności dokumentów oraz drukarka do wystawiania kwitów fiskalnych. Ponieważ monitor kompleksu jest dotykowy, można na nim przeprowadzać specjalne testy w celu oceny ogólnego stanu i sprawności kierowcy. Po zatrzymaniu przez policję sprawcy urządzenie wysuwa się w stronę sprawdzanego pojazdu i blokuje jego ruch do czasu zakończenia wszystkich procedur sprawdzających za pomocą specjalnego drążka nabijanego na poziomie koła. System przechodzi już końcowe testy.

Zrobotyzowany system kontroli pojazdów, SRI International

Innym środowiskiem, w którym wykorzystuje się wideokonferencje, są więzienia. Kilka amerykańskich zakładów karnych w stanach Missouri, Indiana i Mississippi zastąpiło regularne krótkie wizyty więźniów komunikacją za pośrednictwem terminala komunikacji wideo.

Wideokonferencje to obecnie rynek i nowe technologie. Longread, część druga
Komunikacja za pośrednictwem terminala wideokonferencyjnego w jednym z amerykańskich więzień, fot. Natasha Haverty, nhpr.org

Więzienia nie tylko zwiększają bezpieczeństwo, ale także obniżają koszty. Przecież, aby dostarczyć więźnia na salę widzeń i z powrotem, konieczne jest zapewnienie całego szeregu zabezpieczeń na całej trasie i w trakcie komunikacji. Ponieważ wizyty w więzieniach w USA są dozwolone raz w tygodniu, w przypadku dużych obiektów z dużą liczbą więźniów proces ten odbywa się niemal w sposób ciągły. Jeśli zastąpisz spotkania osobiste rozmowami wideo, potencjalnych problemów będzie mniej, a liczba osób towarzyszących może zostać zmniejszona.

Obrońcy praw człowieka i sami więźniowie twierdzą, że w obecnej wersji system komunikacji wideo znacznie ustępuje komunikacji osobistej i w żaden sposób jej nie równa, nawet pomimo zwiększonego czasu rozmów. Krewni nie muszą iść do więzienia, komunikację można prowadzić z domu, ale w tym przypadku koszt komunikacji jest znacznie droższy – od kilkudziesięciu centów do dziesięciu dolarów amerykańskich za minutę, w zależności od regionu. Można się bezpłatnie komunikować za pośrednictwem lokalnych terminali na terenie więzienia.

Więzienia, które próbowały wdrożyć takie systemy komunikacji, są bardzo zadowolone z rezultatów i nie planują rezygnować z tej praktyki. Niezależne źródła podają, że administracja może być zainteresowana wdrożeniem technologii ze względu na zlecenie od operatorów wideokonferencji, którzy instalują tam swoje rozwiązania. We wszystkich przypadkach mówimy o specjalnych systemach zamkniętych, których jakość według amerykańskich dziennikarzy jest gorsza od popularnych usług, takich jak Skype.

Rynek wideokonferencji będzie nadal rósł. Jest to szczególnie widoczne teraz, w obliczu epidemii. Wejście do chmury otworzyło możliwości, które nie zostały jeszcze w pełni wykorzystane, a nowe technologie są już w drodze. Wideokonferencje stają się coraz inteligentniejsze, integrują się z ogólną przestrzenią biznesową i stale się udoskonalają.

Dziękujemy Igorowi Kirillovowi za przygotowanie materiału i redaktorom V+K za jego aktualizację.

Źródło: www.habr.com

Dodaj komentarz