Application de communication assistée par IA pensée pour la communication en face à face en temps réel
Application de communication assistée par IA pensée pour la communication en face à face en temps réel
Partager sur les réseaux
IGOOR est une application conversationnelle gratuite et open source destinée aux personnes dont une pathologie altère la communication, la sclérose latérale amyotrophique étant le cas d’usage autour duquel le projet s’est construit.
Sa particularité est de viser la communication en face en face en temps réel : plutôt que de composer péniblement chaque phrase lettre à lettre, l’utilisateur s’appuie sur une intelligence artificielle qui lui propose des formulations à valider, en tenant compte du fil de la conversation.
L’interface est pensée pour rester pilotable au contacteur ou à la commande oculaire. Le projet est porté par l’association IGOOR, en partenariat avec l’ARSLA, et fait l’objet d’une phase d’évaluation avec l’Hôpital Marin d’Hendaye. Il se présente lui-même comme un logiciel expérimental, ce qu’il est honnête de rappeler aux familles comme aux équipes.
| Référence | IGOOR |
|---|---|
| Auteurs | Association IGOOR — concept d’Igor Novitzki, développement de Carlo Giordano |
| Site | igoor.org — documentation : igoor-noprofit.github.io/docs/fr |
| Prix | Gratuit (logiciel libre soutenu par les dons) |
IGOOR fonctionne exclusivement sous Windows 10 et 11, et il est diffusé sous licence libre AGPLv3, son code étant publié sur GitHub. La configuration demandée n’est pas négligeable : une résolution minimale de 1280 × 960 (1920 × 1080 conseillée), 16 Go de mémoire vive recommandés et surtout une connexion internet stable, de préférence fibre ou ADSL. Cette connexion est indispensable car IGOOR confie le raisonnement linguistique à des modèles d’IA distants : ses fonctions principales ne sont pas utilisables hors ligne.
Le point de configuration le plus déroutant à l’installation est l’obligation de fournir une clé API Groq.
Groq est un fournisseur d’inférence tiers (à ne pas confondre avec « Grok », le modèle d’xAI, sans rapport) ; l’association IGOOR précise d’ailleurs n’avoir aucun lien avec lui.
Concrètement, l’utilisateur ou l’aidant crée gratuitement un compte développeur sur la console de Groq, puis reporte la clé obtenue dans IGOOR. La manipulation est gratuite mais suppose un minimum de compétences numériques, et c’est typiquement l’étape qui peut entraîner des difficultés dès le départ…
Les outils proposés, que nous détaillons ci-dessous, s’appuient sur un même contexte, que la machine agrège en permanence : le fil de la conversation, l’heure, l’état de santé déclaré, des éléments biographiques saisis dans Paramètres > Bio, une mémoire de court terme (conservée environ deux semaines) et de long terme, ainsi que des informations extraites de documents fournis à l’application. L’ensemble de ces éléments sont pris en compte par l’IA pour émettre des propositions pertinentes.
Depuis la page d’accueil, l’utilisateur peut amorcer très simplement une conversation portant sur une situation de la vie courante. L’IA s’appuie alors sur le contexte pour proposer des phrases adaptées au moment et à la personne.

L’aidant peut renseigner les éléments proposés par défaut, afin d’adapter ensuite la bio et les mémoires grâce aux informations renseignées.
C’est l’outil le plus caractéristique. Grâce à la reconnaissance vocale, la parole de l’interlocuteur est transcrite, « comprise » par l’IA, puis convertie en plusieurs réponses possibles que l’utilisateur n’a plus qu’à sélectionner.

On sort ainsi du schéma habituel où la personne dépense une énergie considérable à amorcer des phrases et à initier l’échange.
Il faut d’abord autoriser l’accès au micro ; le fournisseur de reconnaissance vocale se règle dans Paramètres > Accueil > Reconnaissance vocale > Configurer la reconnaissance vocale (voir la section dédiée plus bas).
Cette fonctionnalité prend le relais lorsque les propositions de l’IA ne conviennent ou ne suffisent pas. Deux modes coexistent : la prédiction de phrases entières et la prédiction du prochain mot, l’une et l’autre nourries par les complétions déjà enregistrées, la conversation en cours et les éléments biographiques. Ce mode garantit que l’utilisateur garde toujours la main pour formuler exactement ce qu’il veut.
Présents en bas de l’écran, ils prononcent immédiatement une phrase ou un son, sans clic supplémentaire, et — point important — sans être intégrés à la conversation en cours, afin de répondre à un besoin urgent sans en perturber le fil.
Le bouton de gauche réduit la fenêtre pour basculer vers un autre logiciel ; les boutons ATTENDS et RÉPÉTER signalent respectivement que l’utilisateur prépare sa réponse ou que l’IA a mal transcrit la phrase de l’interlocuteur.
Le bouton rouge SOS alerte l’entourage : par défaut il prononce « Aidez-moi, c’est urgent ! », mais on peut le configurer dans Paramètres > Extensions > Prédictions, à la rubrique de l’extension Shortcuts, pour émettre plutôt un son d’alerte, en choisissant le nombre de répétitions (0 pour l’infini) et leur fréquence.

Important : si le son persiste, il faut recliquer sur n’importe quel bouton rapide, ou démarrer ou terminer une conversation, pour l’interrompre.
IGOOR prend en charge trois modalités de synthèse vocale. La première, active par défaut dès l’installation, est la voix intégrée à Windows (SAPI 5), celle-là même que l’on retrouve dans la plupart des utilitaires présentés dans nos fiches. Les deux autres passent par des services en ligne, ElevenLabs ou Speechify, que l’on active dans Paramètres > Accueil > Extensions > TTS, avant de renseigner sa clé API : la liste des voix disponibles se remplit alors automatiquement.
Il faut redémarrer IGOOR après chaque activation, et il est conseillé de laisser la voix Windows active comme secours en cas de coupure réseau (à noter qu’activer plusieurs fournisseurs cloud simultanément fait « doubler » la voix).
La fonction la plus marquante pour l’accompagnement de la SLA reste le clonage de la voix de l’utilisateur, qui contribue à préserver le lien émotionnel avec les proches. IGOOR distingue un clone instantané, qui ne réclame qu’une minute d’enregistrement environ, et un clone professionnel, qui peut demander jusqu’à trois heures. Lorsque la personne n’est plus en mesure de s’enregistrer, le clonage reste possible à partir d’échantillons existants, à condition de n’en conserver que les passages où seule sa voix est audible. C’est un argument fort en faveur d’une démarche anticipée de banque de voix, à engager tant que la parole est encore exploitable.
La reconnaissance vocale (ASR) est le moteur de l’outil « Dialogue avec l’interlocuteur », et IGOOR laisse le choix entre le cloud et le traitement local. Dans le cloud, l’option par défaut est Whisper-large-v3-turbo, hébergé par Groq : c’est une déclinaison rapide et économique du modèle Whisper d’OpenAI, multilingue et largement éprouvée. Une variante, Whisper-large-v3, est légèrement plus précise mais plus lente et un peu plus chère.
La documentation indique cependant que la meilleure qualité de transcription, notamment en français, s’obtient avec Voxtral — précisément le modèle voxtral-mini-transcribe développé par Mistral. Il s’utilise à la consommation via l’AI Studio de Mistral : après création d’un compte et obtention d’une clé API, on se rend dans Paramètres > Accueil > Reconnaissance vocale > Configurer la reconnaissance vocale, puis on sélectionne Mistral à la place de Groq avant d’y coller la clé. Ici encore, ce paramètrage peut s’avérer complexe pour quelqu’un qui n’est pas parfaitement à l’aise avec le numérique.
Pour qui privilégie la confidentialité ou doit composer avec une connexion instable, IGOOR propose enfin une reconnaissance vocale locale reposant sur le modèle Vosk, qui fonctionne entièrement sur la machine. On l’active dans Paramètres > Extensions > ASR en désactivant le module ASR JavaScript, en activant le module Vosk, puis en enregistrant les paramètres globaux et en redémarrant l’application. C’est l’option à privilégier lorsque les échanges portent sur des sujets sensibles que l’on ne souhaite pas voir transiter par des serveurs distants.
Le principal point d’attention tient à l’architecture même d’IGOOR : hors reconnaissance vocale locale, le fonctionnement repose sur des services d’IA tiers (Groq, éventuellement Mistral, ElevenLabs ou Speechify), majoritairement hébergés hors de l’Union européenne. Les conversations, qui touchent par nature à l’intime et à la santé, transitent donc par ces plateformes, ce qui soulève des questions de confidentialité et de conformité au RGPD qu’il convient d’aborder explicitement avec l’utilisateur et son entourage. Plus largement, la qualité comme la disponibilité du service dépendent de fournisseurs d’IA dont les modèles, les conditions et les tarifs évoluent rapidement, dans un secteur encore mouvant. Le recours à Vosk en local peut diminuer ce risque pour la seule transcription.
Autre problème constaté : nous ne sommes pas parvenus à activer l’écoute active, “continuous listening”. C’est-à-dire qu’il fallait à chaque fois activer le micro manuellement, alors qu’une option est censée permettre une écoute en permanence à la manière de certains assistants vocaux. Ce réglage modifie significativement l’interaction et réduit les efforts à fournir par l’utilisateur. Espérons qu’elle sera rapidement effective !

Par ailleurs, le logiciel exploite, dans sa version actuelle, le clavier visuel du système d’exploitation. C’est une erreur : la fenêtre du clavier se superpose à la fenêtre d’IGOOR et certains boutons deviennent alors difficilement accessibles. L’intégration d’un clavier spécifique et paramétrable devrait sensiblement améliorer l’expérience utilisateur.
Les quelques problèmes relevés s’explique par le statut encore expérimental du logiciel et incite à suivre de près les futures versions.
IGOOR sera utile aux personnes atteintes d’une pathologie évolutive affectant la parole — la SLA au premier chef mais pas que — qui disposent d’un PC Windows performant, d’une bonne connexion, et d’un entourage à l’aise avec le numérique pour assurer le paramétrage initial.
Pour ce public, l’outil peut réellement fluidifier les échanges du quotidien, d’autant qu’il est gratuit, qu’il peut fonctionner avec une commande oculaire déjà en place, et qu’il est compatible avec le clonage de voix, précieux quand la parole se dégrade.
Les quelques petits bugs que nous avons relevés et sa dépendance à des services tiers en font toutefois, à ce stade, un excellent candidat à un essai accompagné plutôt qu’à une préconisation immédiate.
Enfin, IGOOR, malgré ses nombreuses qualité, me paraît l’un des meilleurs exemples d’un risque que je vois poindre en lien avec le modèle économique des offres de service autour de l’Intelligence Artificielle : pour une personne en situation de handicap, accéder à l’ensemble des fonctionnalités d’IA utiles à son autonomie peut impliquer de souscrire simultanément à un assistant vocal « premium », à un service de reconnaissance vocale avancée, à un outil de transcription, à une application de navigation adaptée, à un service de description d’images — chacun avec son propre abonnement mensuel.
Ce millefeuille financier est doublement problématique : il rend le coût global de la compensation par l’IA prohibitif pour des personnes et il crée une dépendance fonctionnelle à une poignée d’acteurs qui concentrent le savoir-faire, la propriété des algorithmes et le contrôle des données.
Cette œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution – Pas d’Utilisation Commerciale – Pas de Modification 4.0 International
| Auteur | Sébastien VERMANDEL |
|---|
SMR Marc Sautelet
10, rue du Petit Boulevard
59650 VILLENEUVE D’ASCQ – FRANCE
03 28 80 07 64
Les kits sont prêtés pour deux à trois semaines, ce qui permet de tester les matériels en situation écologique, c’est-à-dire dans les différents contextes de vie de la personne (maison, travail, ESMS…), et sur la durée. La plupart des kits sont constitués de manière à proposer des essais comparatifs : vous trouverez dans ce cas dans la valise plusieurs aides techniques ayant la même finalité.
Paiement des frais d’expédition, de logistique, maintenance et assurance du matériel
Vous bénéficiez d’un demi-tarif si vous effectuez le retrait et la restitution du kit dans nos locaux à Villeneuve d’Ascq.
Vous recevez le kit en quelques jours via Colissimo.
De 2 à 3 semaines
Avis
Il n’y a pas encore d’avis.