France World

Comment l’IA dans la vidéo améliorera le travail dans l’environnement de travail moderne

Secouer la poussière de ce qui pourrait être décrit comme l’année la plus longue connue de l’homme – le travail à distance est un sujet brûlant dans le monde de l’emploi. En établissant à la fois ses avantages et ses défis, le travail à distance fait parler de sa pérennité. De plus, les employés se sont habitués au travail à distance, en fait, beaucoup d’entre eux le préfèrent au bureau. Selon un Sondage FlexEmplois, 65% des employés interrogés ont déclaré vouloir être à distance à temps plein après la pandémie, et 31% veulent un environnement de travail à distance hybride – c’est 96% qui souhaitent une certaine forme de travail à distance.

Ces chiffres signifient inévitablement que les méthodes avec lesquelles nous avons travaillé pendant la pandémie, principalement via l’écran et via les appels vidéo, auront une certaine longévité.

Au cours de la dernière année, il y a eu une quantité impressionnante de création de contenu « accessoire » ou non intentionnelle via les nombreuses plateformes numériques différentes sur lesquelles nous opérons maintenant. Avec des quantités massives de données, cependant, il y a de grandes quantités d’informations à avoir.

Avec les bons outils, votre entreprise peut travailler plus intelligemment, pas plus dur, et obtenir ces précieuses connaissances extraites du contenu dérivé des interactions quotidiennes des employés. Ce sens aigu peut être l’avantage concurrentiel dont votre entreprise a besoin à mesure que nous progressons dans notre journée de travail technologique, avec l’IA dans la vidéo améliorant de nombreux facteurs du monde du travail de l’ère moderne.

Comment l’IA a changé l’expérience de streaming vidéo

Avec le nombre croissant de réunions en ligne et de création de contenu en 2021, la clé du streaming vidéo dans le monde du travail moderne est de s’y retrouver. La vidéo a le potentiel de donner vie au contenu, mais plus important encore, elle donne la possibilité d’accéder au contenu de la vidéo de manière intuitive et efficace.

Regardons les choses de cette façon, achèteriez-vous un manuel s’il n’avait pas de table des matières, d’index ou de chapitres ? Bien sûr, vous ne le feriez pas. Ce serait fou de devoir simplement trouver votre chemin à travers des pages de texte non structuré, mais c’est ce que nous faisons pour la vidéo.

En implémentant l’IA dans la vidéo, vous avez la possibilité de personnaliser et d’accéder facilement à tous les contextes qui existent dans le contenu de la vidéo.

Grâce à l’apprentissage automatique (ML) et au traitement du langage naturel (NLP), l’IA peut effectuer tout le travail difficile consistant à dériver des données pour vous, ce qui vous aide à réduire votre temps de recherche et la fatigue qui pourrait en découler. Grâce aux données audio et visuelles, l’IA prend toute la compréhension disponible de la vidéo et balise le contenu par mots-clés, concepts et sujets importants et pertinents.

Le ML et le NLP construisent ensuite une transcription, et à partir de là, l’IA crée un index intuitif – créant des transcriptions, des chapitres et des titres de chapitre, et enfin une table des matières. Cela rend la recherche de contenu plus facile et plus efficace pour chaque utilisateur.

La vidéo maintenant, diffère considérablement de la vidéo dans le passé.

À ce jour, lorsqu’il s’agit d’utiliser la puissance de la vidéo, la plupart du temps, cela a été fait de manière très méticuleuse. Plutôt que de marquer manuellement les médias vidéo avec des applications d’outil d’édition, en créant des balises une par une ou en créant une vidéo en tranches temporelles en marquant des intervalles de minutes, l’IA peut faire le travail pour vous.

Une étiquette ou un titre, ou une balise à « minute six » n’a pratiquement aucun sens lorsqu’il s’agit de rechercher car le mot-clé est limité à l’interprétation de l’éditeur.

Lorsque vous cherchez quelque chose, que ce soit dans l’épicerie ou sur le moteur de recherche de Google, vous avez le plus souvent quelque chose de spécifique en tête. L’IA permet une nouvelle variation de balisage vidéo avec la capacité d’attirer l’attention sur une pléthore de sujets et de mots-clés. Cela améliore à la fois l’accessibilité et la portée de l’organisation et de l’utilisation de la vidéo. L’IA permet aux entreprises d’économiser du personnel, du temps et des ressources pour appliquer ces méthodes à leur banque de contenu vidéo existante.

OCR et comment cela change la visioconférence

Une technologie vidéo émergente, la reconnaissance optique de caractères (OCR), peut désormais lire les instantanés de votre vidéo et déterminer si un texte pertinent peut être extrait. Cela peut être utilisé sur des éléments tels que des présentations PowerPoint en arrière-plan ou des mots écrits sur un tableau blanc derrière l’orateur dans une vidéo. En combinant à la fois l’enregistrement audio et les éléments textuels dérivés de l’OCR, l’IA peut obtenir plus de contenu que jamais et créer une transcription globale de la vidéo.

Cette traduction basée sur l’IA donne la capacité de « contextualisation des médias », ce qui signifie simplement la possibilité de regarder à l’intérieur d’une vidéo et d’en extraire toutes les informations pertinentes nécessaires à ce moment-là.

Ce processus est rendu possible par la PNL et le ML, qui combinent leurs capacités pour créer une base de connaissances dans laquelle toutes les informations pertinentes sont centralisées. Les processus d’apprentissage en profondeur peut alors venir analyser et organiser tout le texte dans une base de données systématisée, comprenant quand le contexte a changé.

Ensuite, la technologie basée sur l’IA sait quand créer un nouveau « chapitre » en conséquence – en produisant une phrase ou un texte de présentation qui est le titre le mieux adapté pour ce segment du contenu. À partir de là, une table des matières entière se manifeste pour chaque enregistrement vidéo, avec toutes les informations organisées avec précision et efficacité.

En permettant à l’IA d’aller plus loin et de donner un sens à tous les points de données démontrés dans une vidéo, la technologie peut aider à propager des informations pertinentes entre les départements d’une entreprise.

C’est important, surtout avec la hausse des conférences enregistrées dans le monde du travail moderne. Il y a des kilomètres et des kilomètres d’informations potentielles à obtenir dans les appels vidéo enregistrés d’une entreprise, mais il est nécessaire de les comprendre dans un cadre pertinent pour l’individu.

La technologie basée sur l’IA, avec l’OCR implémentée, aide à établir des connexions contextuelles dans toutes les informations et à créer une structure conviviale. Cela rend l’expérience utilisateur vidéo beaucoup plus intuitive et permet aux gens de trouver et de partager exactement ce qu’ils recherchent.

Connecter le contexte via l’ontologie et DBpedia

Avec une base de connaissances bien organisée, informée et centralisée, l’IA innove davantage grâce à ce que l’on appelle l’ontologie. Ontologie est un ensemble de concepts et de catégories dans un domaine ou un domaine qui montre des propriétés communes et leurs relations.

Un de mes clients, une entreprise appelée Ziotag, utilise une technologie d’ontologie d’IA propriétaire pour créer des balises dans les médias vidéo. Ceci est initié en attribuant d’abord tous les termes différents dont les gens pourraient parler sur un certain sujet.

Grâce à cette connaissance, l’IA peut faire sa magie et créer des balises d’ontologie pour se procurer plus de 50 000 concepts, en trouvant les moyens par lesquels ils peuvent tous être liés les uns aux autres.

Cela crée une base multidimensionnelle et dynamique de points de données qui pourraient presque représenter un cerveau humain, en utilisant des concepts, des mots-clés et une compréhension du contexte pour déduire ce qu’un utilisateur pourrait rechercher dans la base de connaissances.

Lorsque cette appréhension locale est appliquée à la vue d’ensemble d’Internet, les possibilités sont infinies. Un projet de Wikipédia connu sous le nom DBpédia extrait des informations structurées de 111 éditions linguistiques différentes de Wikipedia pour susciter des connaissances à l’aide des technologies du Web sémantique et des données liées.

La plus grande base de connaissances DBpedia existe en anglais et se compose de plus de 400 millions de faits qui décrivent 3,7 millions de choses – juste pour vous donner un peu d’échelle. Ces mappages ont été créés via un effort mondial de crowdsourcing dans l’espoir de permettre aux connaissances de toutes les différentes éditions de Wikipédia de se combiner et de créer un contexte à partir des données.

L’approche ontologique de Ziotag reflète cette stratégie de connexion de données, aidant l’IA à discerner les concepts d’une variété de ressources.

En comprenant le contexte à partir d’une vaste quantité de connaissances, l’IA peut transformer la vidéo, donnant un aperçu incommensurable à ceux qui l’utilisent.

Ces informations peuvent être vues lors de la recherche de mots avec des noms similaires mais des significations très différentes. Pour jeter un exemple simple, regardez le mot « sel ». Lorsque vous avez recherché ce mot, recherchiez-vous le composé scientifique chlorure de sodium ou sel de table ? Ou peut-être cherchiez-vous le restaurant local intitulé en tant que tel ou l’histoire de l’exploitation minière pour cela ?

La technologie d’IA d’ontologie peut distinguer ce que vous recherchiez en reliant des vecteurs de sens, adaptant ainsi l’organisation des concepts en vidéo à vos besoins individuels.

Automatiser les processus métier

La combinaison de toutes ces innovations dans l’IA peut changer les processus auxquels les entreprises modernes peuvent effectuer des opérations numériques, augmentant considérablement à la fois l’efficacité et l’interconnectivité.

En extrayant les métadonnées des interactions des employés et des réunions d’équipe, la technologie basée sur l’IA peut rendre l’expertise visible dans tous les départements.

Cela rend les informations vitales dont les employés ont besoin facilement disponibles, traversant tous les silos qui pourraient exister dans l’infrastructure de l’entreprise. Une fois les connaissances centralisées, l’IA peut être proactive et créer des expériences délicieusement personnalisées.

En glanant le contexte des interactions des employés à la fois sur vidéo ou via différentes applications telles que Slack ou e-mail, l’IA peut commencer à créer un dialogue pour les flux de travail personnels.

Dans les grandes entreprises avec une main-d’œuvre répartie, cela peut être particulièrement crucial – intégrer les différents canaux de communication et compiler toutes les informations échangées comme un bibliothécaire assidu. En outre, l’IA peut également approfondir ses connaissances en accédant aux données sur le rôle de la personne dans une entreprise ou sa charge de travail quotidienne.

Cela pourrait, par exemple, aider les individus à se mettre à jour rapidement s’ils ne pouvaient pas assister à une réunion ou s’ils étaient absents pendant un certain temps en raison de vacances. La meilleure partie est que les informations peuvent être absorbées de manière entièrement personnalisable.

Ces informations peuvent être traduites de la manière la plus pratique pour le travailleur, qu’il s’agisse de développer des chapitres, de rechercher des sujets avec facilité, ou de lire et d’écouter à leur guise..

L’automatisation des processus va révolutionner la façon dont l’IA est mise en œuvre dans les entreprises, en changeant le lieu de travail numérique pour qu’il soit plus efficace et moins disparate. Ce par procuration informera une nouvelle façon de travailler dans de nombreuses industries. L’informatique et l’IA sont une structure massive, et sa fondation repose sur un vaste éventail de développements.

Lorsque l’on se concentre sur l’objectif le plus élevé, de nombreuses innovations pertinentes peuvent être réalisées.

La prochaine génération d’IA pourra faire encore plus, avec chaque étage de la structure informatique défini par le niveau inférieur et aucune limite connue à sa hauteur potentielle. L’IA en vidéo sera un multiplicateur dans la construction de cet édifice, propulsant le monde du travail à distance dans le futur.

Par: Emily Senkosky, en collaboration avec Graham Morehead à Ziotag inc., une entreprise technologique basée à New York qui utilise l’intelligence artificielle (IA) pour faire de la recherche et de la navigation dans le contenu vidéo et audio une expérience fluide.

Crédit d’image :

Emily Senkosky

Écrivain

Emily Senkosky est une écrivaine vivant à Medellin, en Colombie. Elle a de l’expérience dans des domaines allant de l’intelligence artificielle (IA) dans les transports à l’IA dans la connaissance des entreprises, à l’industrie de la musique, jusqu’aux thèmes de la psychologie positive. Emily aime l’art d’utiliser une nouvelle perspective à travers le langage et de trouver des moyens de rendre les sujets compliqués digestes pour ses lecteurs. Toujours à l’écoute de la société grâce à ses intérêts variés, elle aime aussi se faire l’avocate du diable et apporter de nouvelles idées. Après avoir dirigé son propre magazine d’art pendant de nombreuses années, elle publie souvent des articles à la pige qui combinent arts et divertissement et son amour pour la nature. Photographe de cinéma et aventurière passionnée de plein air, elle écrit ces pièces à son rythme et complète ses articles avec sa photographie artistique. Avec une capacité de curiosité insatiable, Emily aime utiliser sa capacité linguistique pour explorer quotidiennement de nouvelles idées et de nouveaux sujets.

Source

L’article Comment l’IA dans la vidéo améliorera le travail dans l’environnement de travail moderne est apparu en premier sur zimo news.