Produits

CandyVoice développe des solutions innovantes en temps réel pour des applications de traitement numérique de la voix, basées sur la technologie breveté, MUVOC®

MUVOC®

CandyVoice développe des solutions innovantes en temps réel pour des applications de traitement numérique de la voix, basées sur la technologie breveté, MUVOC®

MUVOC® est une suite unique, constituée de plusieurs modules prêts à l’emploi, indépendants et qui fonctionnent en synergie:

  • MUVOC® Voice Conversion
  • MUVOC® Voice Transformation
  • MUVOC® Noise Filter
  • MUVOC® Lip-Sync
  • MUVOC® Voice Print
  • MUVOC® Speaker Recognition

MUVOC® permet de traiter (contrôler, analyser et calculer) tous les paramètres audio essentiels qui peuvent être utilisés ultérieurement par l’imitation vocale, la transformation de la voix, le filtrage de bruit, la synchro labiale et les modules d'apprentissage/reconnaissance, potentiellement sur des systèmes distribués.

La flexibilité de sa configuration simplifie le développement et la maintenance chez le client, permet des opérations rapides, même sur les CPUs les plus simples (ARM, DSP, Intel, etc.), et rend MUVOC® compatible avec la plupart des chipsets et des systèmes d'exploitation.

MUVOC® fonctionne à des fréquences d'échantillonnage de 8000 Hz a 96 000 Hz, avec des échantillons en 16 ou 24 bits.

Imitation vocale
MUVOC® Voice Conversion

L’imitation vocale consiste à reproduire la voix d’une personne (voix cible) à partir de la voix d’une autre personne (voix source), ou d’une voix de synthèse à partir du texte (Text To Speech ou TTS).

Comment ça marche ?

Professionnels / Partenaires:

La réalisation de l’imitation vocale nécessite l’apprentissage du modèle vocal mathématique des voix source et cible à partir de leurs enregistrements respectifs (délibéré ou à partir d’archives). Ces modèles vocaux sont ensuite traités, afin de générer un modèle d’imitation vocale de la voix source vers la voix cible. Ainsi, une personne (voix source) pourra s’exprimer avec la voix d’une autre personne (la voix cible) en temps réel.

Les enregistrements des voix des interprètes choisies par le client, à reproduire par l’imitation vocale, seront réalisés en studio. Ces enregistrements seront pré-traités pour créer le modèle vocal de manière semi-automatique. A ce stade, le client pourra entendre un résultat assez représentatif de la reproduction de la voix de l’interprète.

Ensuite, une partie importante de traitement supervisé du modèle vocal permettra d’obtenir la qualité optimale de reproduction de la voix.

Dans le cas, où la voix à reproduire provient d’une base de donnée vidéo ou audio d’archives, CandyVoice pourra créer le modèle vocal de qualité à partir de cette base à condition que les enregistrements soient de qualité, homogènes (enregistrés à une même période et dans un même environnement sonore), et sans être perturbés par le bruit.

Grand public:

Nous offrons à l’utilisateur la possibilité de personnaliser un Text To Speech, et de créer son propre modèle vocal facilement, rapidement, et gratuitement !

La création du modèle vocal requiert un enregistrement préalable de la voix de l’utilisateur à l’aide de 160 phrases phonétiquement équilibrées, fait sur un smartphone, ou sur un pc à la maison, via les applications dédiées de CandyVoice (disponible bientôt).

Voir la procédure d’enregistrement

1. Personnalisation des voix de TTS

Les TTS disponibles sur le marché sont très coûteux et longs à créer, et n’offrent que très peu de voix pour chaque langue. Grâce à la technique d’imitation vocale proposée par CandyVoice, tout TTS peut être personnalisé très rapidement et à moindre frais avec de nouvelles voix pour un usage professionnel ou pour le grand public.

Essayer la démo

Champs d’application :
  • La santé

    Grâce à la personnalisation des voix de TTS, nous pouvons reproduire, et redonner la voix aux personnes qui ont la probabilité de perdre son usage, à cause d’une maladie de la gorge (cancer VADS, SLA, etc.), ou à cause de séquelles probables d’une intervention chirurgicale à venir.

    Cette ‘reconstruction’ requiert l’enregistrement préalable de la voix de l’utilisateur (en studio, ou à la maison via notre application pour le smartphone, ou via un pc), dans le but de créer son modèle vocal, et son modèle d’imitation.

    Ensuite, la voix de l’utilisateur peut être intégrée dans un outil d’aide à la communication (Communication Augmentée et Alternative), ou dans un autre objet communicant.

    En ce qui concerne les personnes qui n’ont pas pu anticiper la perte d’usage de leur voix, et n’ont pas pu l’enregistrer au préalable, nous pouvons créer pour eux une voix sur mesure qui correspond au mieux à leur personnalité, ou bien en ‘prélever’ et traiter une de leur entourage familial. Ensuite, tout comme dans le premier cas, la voix choisie peut être intégrée dans un objet communicant.

  • La robotique et objets communicants

    La personnalisation des voix de TTS permet d’avoir le choix parmi une multitude de voix, selon l’usage, ou selon les préférences de l’utilisateur. A titre d’exemple, les robots d’assistance à la personne équipés d’une voix reconnaissable par son usager seraient mieux acceptés dans leur environnement.

  • Sauvegarde de voix des proches

    La voix d’un enfant change rapidement, et il la perd définitivement à la puberté. Le modèle vocal constitue une photo de la voix prise à l’instant T, et peut être réécoutée, ou réutilisée à tout moment. Il constitue aussi une précieuse sauvegarde dans le cas où la personne perd l’usage de sa voix.

  • Les messageries et les réseaux sociaux

    La personnalisation des voix de TTS permet d’écouter, plutôt que de lire, des messages écrits: mail, sms, publications sur les réseaux sociaux avec la voix de l’auteur. Ainsi, nous pouvons consacrer plus de temps et d’attention à nos activités sans avoir les yeux rivés sur nos écrans.

2. Imitation d’une voix en temps réel

La qualité des univers visuels des jeux vidéo, et particulièrement avec l’usage des casques de réalité virtuelle, a atteint un très haut niveau. La technologie d’imitation vocale en temps réel de CandyVoice permet d’enrichir cette expérience, en y rajoutant la dimension sonore. La voix du joueur peut imiter les voix des personnages du jeu en temps réel, ce qui augmente l’immersion dans le jeu, et l’enrichissement sensoriel de l’expérience du joueur.

3. Détection des visèmes

Détection de mouvements de la bouche en fonction de paroles prononcées est une option de l’imitation vocale proposée pour animer la bouche du personnage ou du robot humanoïde.

Création des modèles vocaux et d'imitation pour le grand public

Cliquer pour zoomer, double-cliquer ou Echap pour revenir

Création des modèles vocaux et d'imitation pour les professionnels

Cliquer pour zoomer, double-cliquer ou Echap pour revenir

Transformation de la voix
MUVOC® Voice Transformation

MUVOC® Voice Transformer fait partie de la boîte à outil de traitement numérique de la voix de CandyVoice, et combine MUVOC® Core (analyse et synthèse) avec un modificateur de paramètres de la voix.

MUVOC® Voice Transformer permet de transformer les voix de manière très réaliste, en jouant avec plusieurs paramètres vocaux simultanément : le timbre, le genre (homme, femme), l’âge (enfant, ado, adulte, personne âgée), expressivité, et plein d’autres modifications amusantes et originales (ogre, hélium, etc.).6

Ainsi, à partir d’une seule voix, on peut créer une multitude de voix différentes, par ex.: la voix d'un homme peut être transformée en une voix de femme, une voix de garçon, une voix de fille, une voix de vieil homme ou de vielle femme, etc.

A part ces effets réalistes, MUVOC® Voice Transformer peut créer les effets ‘artificiels’ (non réalistes) sur une voix, ce qui permet de créer un large éventail de nouvelles voix originales !

D’autres réglages permettent d’ajuster la vitesse de lecture, ou les fonctions d’avancement, ou de retour rapide.

Champs d’application :
  • Jeux vidéo: la création d'avatars vocaux (réalité virtuelle)
  • Jouets: modificateurs de voix
  • Karaoké: effets vocaux, transformation de la voix, tuning, etc.
  • Mixage professionnel
  • Applications ou les services téléphoniques
  • Services de télécommunication marketing, etc.

Filtre de bruit
MUVOC® Noise Filter

MUVOC® Noise Filter permet d’atténuer, ou de supprimer le bruit ambiant, sans altérer l’aspect naturel de la voix originale, même dans un environnement très bruyant, mais aussi augmente la clarté et intelligibilité de la voix. MUVOC® Noise Filter combine l'analyse MUVOC® Core avec un filtre adaptatif.

MUVOC® Noise Filter est utilisé depuis une décennie dans les radios numériques des arbitres de sport au niveau mondial.

MUVOC® Noise Filter qui n’utilise qu’un seul micro est parfaitement adapté (et très performant) pour améliorer la qualité de communications via les oreillettes filaires de téléphones mobiles. Actuellement, les téléphones mobiles sont dotés de filtres de bruit très efficaces, mais qui sont désactivés lors de l’utilisation des oreillettes filaires. L’efficacité de ces filtres est liée au fait qu’ils fonctionnent avec deux micros, alors que les oreillettes en ont qu’un seul.

A titre d’exemple, les utilisateurs qui écoutent de la musique avec des oreillettes, et qui en même temps prennent les communications, ne se doutent pas que le filtre de bruit est alors désactivé, et que ça puisse être très désagréable pour leur interlocuteur.

MUVOC® Noise Filter peut remédier à ce problème de manière très spectaculaire, et ainsi améliorer les conditions d’écoute de communications en provenance des environnements bruyants.

Une autre application de MUVOC® Noise Filter trouve son usage dans l’amélioration des logiciels de reconnaissance vocale qui sont très sensibles aux bruits environnants. Tout système utilisant la reconnaissance vocale (par ex. les robots, ou les objets communicants) risque d’être perturbé par les bruits externes ou internes à ces systèmes. Notre filtre de bruit permet de gagner environ 10 dB sur la courbe de performance de reconnaissance vocale en fonction du bruit.

Champs d’application :
  • Téléphonie mobile
  • Communication entre arbitres (football, rugby...)
  • Sécurité
  • Organisation d'évènements
  • Concerts
  • Reconnaissance de Voix (STT)
  • Industrie du bâtiment
  • Aides auditives

Reconnaissance d'emprunte vocale
MUVOC® Voice Print

MUVOC® Voice Print combine MUVOC® Core et le module de reconnaissance de mots.

Ce module permet de reconnaitre des mots et des phrases préenregistrés dans le but d'activer des commandes, mais aussi d’identifier la personne qui l’exprime.

Un seul enregistrement d’une commande suffit pour la détecter, et pour identifier le locuteur.

L’efficacité de MUVOC®, même dans des environnements très bruyants, permet d’augmenter la viabilité et le taux de reconnaissance de mots.

Champs d’application :
  • Reconnaissance du locuteur
  • Activation et Contrôle par la Voix de robots et systèmes communicants
  • Mots de passe vocaux

Synchronisation labiale
MUVOC® Lip-Sync

MUVOC® Lip-Sync combine MUVOC® Core et le module de reconnaissance des visèmes. Il utilise le modèle vocal appris pour MUVOC® Voice Conversion.

Reconnaissance du locuteur
MUVOC® Speaker Recognition

MUVOC® Speaker Recognition combine MUVOC® Core et le module de reconnaissance du locuteur. La reconnaissance du locuteur permet de reconnaître la voix d’une personne à partir de son modèle vocal, et de sécuriser des actions à exécuter par une Intelligence Artificielle. Le modèle vocal est utilisé pour créer le modèle d’imitation vocale. La reconnaissance vocale se fait en temps réel, en 1 ou 2 secondes, à partir de n’importe quel contenu vocal. Grâce à la rapidité de détection de la voix, un robot peut suivre une conversation, tout en identifiant les locuteurs.

Le modèle d’imitation peut être sécurisé (réservé à l’usage exclusif du propriétaire de la voix source) en utilisant le même modèle vocal.

Champs d’application :
  • Reconnaissance du locuteur
  • Transactions vocales sécurisées