Intelligence artificielle
Et si vous pouviez parler à votre machine ?

Offenburg, le 27 février 2024
Intelligence artificielle : la commande vocale autonome utilisée dans l’industrie et la médecine
Dans de nombreux foyers, l’utilisation d’assistants vocaux comme « Alexa » d’Amazon – avec Siri d’Apple et Google-Assistant, le représentant le plus connu des solutions de spotting par mots-clés (en abrégé KWS) – a révolutionné le quotidien. Après un mot dit de réveil (« Alexa ! », « Hey Siri ! », « Ok, Google ! ») qui active l’application, celle-ci transmet le souhait de l’utilisateur à un serveur distant qui analyse la commande vocale et renvoie ensuite le résultat de l’évaluation à l’appareil. C’est ainsi que les souhaits musicaux sont exaucés, qu’un film est ajouté à la liste de lecture ou que le cadeau de Noël est commandé pour l’être aimé. Des similitudes dans la technologie se retrouvent également dans l’industrie et la technique médicale, où le KWS prend de plus en plus d’importance. La saisie et l’utilisation de la parole permettent déjà d’accélérer les processus, de les rendre plus efficaces et même de sauver des vies.
« Les avantages sont évidents », explique en détail Viacheslav Gromov, directeur général du fournisseur d’IA AITAD. « Si le collaborateur commande la machine dans la production avec sa voix, cela signifie plus de flexibilité. Il peut commander les appareils à distance et n’a plus besoin d’appuyer sur des boutons ou de taper sa saisie sur l’écran de la machine. Cela signifie également éviter les germes et les bactéries, un aspect important en médecine. De même, une commande « stop » appelée est plus rapide que de courir vers la machine et de l’arrêter ».
Reconnaissance vocale dans l’industrie et la technique médicale
La transmission de signaux vocaux à des serveurs distants comporte des temps de latence qui ne sont pas acceptables dans des environnements où la sécurité est primordiale. De même, les risques de manipulation et de défaillance d’une connexion réseau jouent un rôle. L’utilisation dans des environnements critiques pour la sécurité dans l’industrie et la médecine exige des solutions qui fonctionnent localement et en temps réel. C’est là qu’entrent en jeu des modèles de commande vocale innovants, mis en œuvre avec une IA embarquée. Dans ce cas, ce ne sont pas seulement des mots d’éveil individuels qui sont reconnus, mais jusqu’à 30 termes prédéfinis, ce qui permet des commandes complexes. Un mot-clé active le système. Ensuite, des combinaisons complexes de ce groupe de mots prédéfinis peuvent être prononcées et évaluées par l’IA, qui se trouve avec les microphones sur la même petite carte (« composant système d’IA embarquée »).
Exemples de telles commandes vocales (ici dans l’exemple avec « robot » comme mot de réveil) :
- « Robot, démarre le programme A sur la machine 3 ».
- « Robot, arrêt du convoyeur 6 »
- « Robot, moteur 4 dans la machine 3, augmente le régime de 40% ».
- « Robot, fauteuil roulant, tourner à gauche maintenant »
- « Robot, arrêt d’urgence »
« Ce qui est décisif ici, c’est un niveau de sécurité maximal, garanti par le traitement local des données vocales – sans cloud ni serveur. Ainsi que l’efficacité, car les commandes sont évaluées en temps réel directement dans la puce, ce qui permet à la machine de réagir plus rapidement », poursuit Gromov.
Librement configurable, en temps réel et robuste
Les entreprises peuvent configurer leur commande vocale de manière individuelle, en commençant par les mots de réveil et en terminant par les groupes de mots. Cela permet d’avoir des systèmes sur mesure qui sont également disponibles en plusieurs langues. Si nécessaire, des requêtes de sécurité générées de manière synthétique peuvent être intégrées. Les possibilités d’utilisation sont multiples, de la commande de machines au déclenchement d’urgence par commande vocale. Les possibilités d’utilisation sont multiples, de la commande de machines au déclenchement d’urgence par commande vocale.
Les possibilités d’utilisation des commandes vocales sont presque illimitées :
- Dans la salle d’opération, le chirurgien peut démarrer, ajuster et arrêter le scalpel à haute fréquence par commande vocale.
- Commande sans contact de machines et d’appareils dans la production et les hôpitaux.
- L’arrêt d’urgence par commande vocale permet d’éviter de se précipiter sur le bouton d’arrêt d’urgence en cas d’urgence.
- Les personnes ayant besoin d’assistance peuvent par exemple commander leur fauteuil roulant par la voix.
Adaptable dans les environnements difficiles
Les solutions innovantes de commande vocale IA embarquée autonome ne fonctionnent pas seulement de manière entièrement locale et en temps réel, mais font également leurs preuves dans des environnements difficiles. L’IA est entraînée non seulement avec les mots à reconnaître, mais aussi avec les bruits parasites, afin de garantir une reconnaissance vocale fiable, même lorsque l’environnement est bruyant. L’intégration d’un microphone supplémentaire permet de détecter l’emplacement du locuteur et d’éliminer les bruits gênants (Beamforming).
« Cette nouvelle commande vocale pionnière va changer et déterminer durablement l’avenir dans l’industrie et la médecine », affirme Gromov avec assurance. « Les demandes de l’industrie et de la médecine sont de plus en plus nombreuses. Nous avons nous-mêmes développé une solution qui permet aux entreprises d’équiper dès aujourd’hui leurs produits de cette technologie et de jouer ainsi un rôle de pionnier dans l’économie et les affaires. Celle-ci se caractérise par une grande robustesse, même contre les bruits parasites, et est adaptée individuellement aux exigences des clients. Comme nous avons recours à un développement préalable, nous pouvons proposer notre commande vocale locale avec environ 30 mots à reconnaître à un prix avantageux ».