La visioconférence est désormais un marché et de nouvelles technologies. Longue lecture, deuxième partie

La visioconférence est désormais un marché et de nouvelles technologies. Longue lecture, deuxième partie

Nous publions la deuxième partie de la revue sur le marché de la visioconférence. Quels développements sont apparus au cours de l'année écoulée, comment ils pénètrent dans nos vies et deviennent familiers. Ci-dessus, une capture d'écran de la vidéo de SRI International, qui peut être visionnée vers la fin de l'article.

Partie 1:
— Marché de la visioconférence – coupe transversale mondiale
— Communication vidéo matérielle ou logicielle
— Salles de réunion — aquariums
— Qui gagne : les fusions et acquisitions
— Pas une vidéo seule
— Concurrence ou intégration ?
— Compression et transmission des données

Partie 2:
- Conférences intelligentes
- Cas inhabituels. Contrôle des robots et application de la loi

Conférences intelligentes

L'industrie de la vidéoconférence est assez dynamique en termes d'introduction de nouvelles technologies ; de nombreux développements apparaissent chaque année. L'apprentissage automatique et l'intelligence artificielle élargissent considérablement les capacités.

La technologie de synthèse vocale est devenue la plus proche de la réalité et la plus demandée. La machine reconnaît assez bien une parole claire et articulée, mais la parole en direct avec reconnaissance voix par voix n'est pas encore très bonne. Cependant, la communication vidéo simplifie la procédure avec des répliques séquentielles sur différents canaux, et de nombreux fournisseurs ont déjà annoncé des services basés sur la reconnaissance vocale.

Outre le sous-titrage en direct, pratique pour les personnes malentendantes ou dans les lieux publics, les entreprises ont également besoin d'outils pour gérer le résultat des réunions. Des tonnes de vidéos ne sont pas pratiques à visionner ; quelqu'un doit rédiger des procès-verbaux, enregistrer des accords et les transformer en plans. Une personne aide toujours à baliser et à trier le texte déchiffré, mais c'est déjà beaucoup plus pratique que de l'écrire soi-même dans un bloc-notes. Si nécessaire, il est beaucoup plus simple de rechercher les textes transcrits et les balises créées a posteriori. L'intégration avec les planificateurs et divers services de gestion de projet augmente considérablement l'efficacité des outils de communication vidéo. Par exemple, Microsoft et BlueJeans travaillent dans ce sens. Cisco a acheté Voicea à cet effet.

Parmi les fonctions populaires, il convient de noter le remplacement de l'arrière-plan. N'importe quelle image peut être placée derrière le dos de l'orateur. Cette opportunité est offerte depuis un certain temps à divers fabricants, dont le russe TrueConf. Auparavant, pour le mettre en œuvre, il fallait un chromakey (une bannière ou un mur vert) derrière l'enceinte. Il existe désormais déjà des solutions qui permettent de s'en passer - par exemple Zoom. Littéralement à la veille de la sortie du matériel, un arrière-plan de remplacement a été annoncé dans Microsoft Teams.

Microsoft sait également rendre les gens transparents. En août 2019, Teams Rooms a introduit Intelligent Capture. En plus de la caméra principale, conçue pour photographier les personnes, une caméra de contenu supplémentaire est également utilisée, dont la tâche est de diffuser l'image d'un tableau ordinaire sur lequel l'orateur peut écrire ou dessiner quelque chose. Si le présentateur s'emballe et obscurcit ce qui est écrit, le système le rendra translucide et restaurera l'image de la caméra de contenu.

La visioconférence est désormais un marché et de nouvelles technologies. Longue lecture, deuxième partie
Capture intelligente, Microsoft

Agora a développé un algorithme de reconnaissance des émotions. Un système basé sur un serveur cloud traite les données vidéo, y identifie les visages et informe l'utilisateur des émotions actuellement manifestées par l'interlocuteur. Indiquer le degré d'exactitude de la détermination. Jusqu'à présent, la solution ne fonctionne que pour les communications individuelles, mais il est prévu de la mettre en œuvre à l'avenir pour les conférences multi-utilisateurs. Le produit est basé sur le deep learning, en particulier les bibliothèques Keras et TensorFlow sont utilisées.

La visioconférence est désormais un marché et de nouvelles technologies. Longue lecture, deuxième partie
Reconnaissance des émotions depuis Agora

Un domaine d'application fondamentalement nouveau pour les systèmes de vidéoconférence a été ouvert par une technologie qui comprend la langue des signes. L'application GnoSys a été créée par Evalk des Pays-Bas. Le service reconnaît toutes les langues des signes populaires. Tout ce que vous avez à faire est de placer votre téléphone ou votre tablette devant vous lors d'un appel vidéo ou d'une conversation normale. GnoSys traduira à partir de la langue des signes et reproduira votre discours pour l'interlocuteur assis en face ou de l'autre côté de l'écran. Des informations sur le développement d'Evalk sont apparues en février 2019. Ensuite, le partenaire du projet était l'Association indienne des personnes malentendantes - National Deaf Association. Grâce à son aide, les développeurs ont eu accès à une énorme quantité de données sur les langues des signes, les dialectes et les nuances d'utilisation, et des tests actifs étaient en cours en Inde.

De nos jours, la question de la fuite d'informations confidentielles issues des négociations devient très pertinente. Zoom a annoncé l'introduction de la signature ultrasonique début 2019. Chaque vidéo est équipée d'un code ultrasonique spécial, qui vous permet de suivre la source de la fuite d'informations si l'enregistrement se retrouve sur Internet.

La réalité virtuelle et augmentée fait également son entrée dans la visioconférence. Microsoft suggère d'utiliser les nouvelles lunettes HoloLens 2 en conjonction avec son service de collaboration cloud Teams.

La visioconférence est désormais un marché et de nouvelles technologies. Longue lecture, deuxième partie
HoloLens 2, Microsoft

La startup belge Mimesys est allée encore plus loin. L'entreprise a développé une technologie de présence virtuelle, qui permet de créer un modèle d'une personne (avatar) et de la placer dans un espace de travail commun, observable à l'aide de lunettes de réalité virtuelle. Mimesys a été racheté par Magic Leap, un fabricant de lunettes VR de renommée mondiale. Les experts du secteur associent fermement les perspectives de développement des technologies de réalité virtuelle et augmentée au développement des réseaux mobiles 5G, car eux seuls seront en mesure de fournir la vitesse et la fiabilité nécessaires pour rendre ces services accessibles à un large éventail de clients.

La visioconférence est désormais un marché et de nouvelles technologies. Longue lecture, deuxième partie
Travailler ensemble sur un projet en réalité virtuelle, photo de Mimesys

Cas inhabituels. Contrôle des robots et application de la loi

En conclusion, parlons un peu de l'expansion du champ d'application de la communication vidéo. Le plus évident est le contrôle à distance des mécanismes dans les zones dangereuses et les environnements inconfortables, évitant ainsi aux personnes des travaux dangereux ou routiniers. Des sujets de gestion sont apparus dans le domaine de l’actualité au cours de la dernière année, par exemple : robots de téléprésence dans l'espace, assistants robotisés à domicile, BELAZ dans une mine de charbon. Des solutions pour les systèmes pénitentiaires et répressifs sont en cours d’élaboration.

Récemment, des informations sont apparues sur un nouveau développement de l'institut de recherche SRI International (États-Unis), où le problème de la sécurité de la police est assez aigu. Selon les statistiques, chaque année, environ 4,5 XNUMX attaques sont perpétrées contre des agents des forces de l'ordre par des conducteurs agressifs. Environ un centième de ces cas se termine par la mort d’un policier.

Le développement est un système complexe monté sur une voiture de patrouille. Il est équipé de caméras haute définition, d'un écran, de haut-parleurs et de microphones. Il existe également un alcootest, un scanner pour vérifier l'authenticité des documents et une imprimante pour délivrer des reçus d'amende. Le moniteur du complexe étant tactile, il peut être utilisé pour effectuer des tests spéciaux afin d'évaluer l'état général et l'adéquation du conducteur. Lorsque l'équipe de police arrête le contrevenant, le dispositif s'étend vers le véhicule contrôlé et bloque son mouvement jusqu'à ce que toutes les procédures de vérification soient terminées à l'aide d'une barre cloutée spéciale au niveau des roues. Le système subit déjà les derniers tests.

Système d'inspection robotique des véhicules, SRI International

Un autre environnement où la vidéoconférence est utilisée est celui des prisons. Plusieurs pénitenciers américains des États du Missouri, de l'Indiana et du Mississippi ont remplacé les courtes visites régulières des détenus par une communication via un terminal de communication vidéo.

La visioconférence est désormais un marché et de nouvelles technologies. Longue lecture, deuxième partie
Communication via un terminal de visioconférence dans l'une des prisons américaines, photo de Natasha Haverty, nhpr.org

Les prisons augmentent ainsi non seulement la sécurité, mais réduisent également les coûts. En effet, pour amener un détenu au parloir et en revenir, il est nécessaire de prévoir toute une série de mesures de sécurité tout au long du parcours et pendant la communication. Étant donné que les visites dans les prisons américaines sont autorisées une fois par semaine, pour les grands établissements avec un contingent important, ce processus est assuré presque en permanence. Si vous remplacez les réunions personnelles par des appels vidéo, il y aura moins de problèmes potentiels et le nombre d'escortes pourra être réduit.

Les militants des droits de l'homme et les prisonniers eux-mêmes affirment que dans sa version actuelle, le système de communication vidéo est nettement inférieur à la communication personnelle et n'y est en aucun cas équivalent, même malgré l'augmentation du temps de conversation. Les proches ne doivent pas aller en prison, la communication peut être effectuée depuis leur domicile, mais dans ce cas, le coût de la communication est nettement plus élevé - de plusieurs dizaines de centimes à dix dollars américains par minute, selon la région. Vous pouvez communiquer gratuitement via les terminaux locaux situés sur le terrain de la prison.

Les prisons qui ont essayé de mettre en œuvre de tels systèmes de communication sont très satisfaites des résultats et n'envisagent pas d'abandonner cette pratique. Des sources indépendantes notent que l'administration pourrait être intéressée à mettre en œuvre cette technologie en raison de la commission des opérateurs de vidéoconférence qui y installent leurs solutions. Dans tous les cas, nous parlons de systèmes fermés spéciaux dont la qualité, selon les journalistes américains, est inférieure à celle des services populaires comme Skype.

Le marché de la visioconférence va continuer à croître. Cela est particulièrement évident aujourd’hui, en pleine épidémie. L'entrée dans le cloud a ouvert des opportunités qui n'ont pas encore été pleinement exploitées, et de nouvelles technologies sont en route. La vidéoconférence devient plus intelligente, s'intègre dans l'espace commercial global et continue de s'améliorer.

Nous remercions Igor Kirillov pour la préparation du matériel et les éditeurs de V+K pour sa mise à jour.

Source: habr.com

Ajouter un commentaire