logo Ircam

IrcamAlign

Le programme IrcamAlign effectue l’alignement et donc la segmentation de signaux de parole en phones et diphones, et calcule une mesure de confiance par phone. Il extrait aussi la structure phonologique (syllabes, mots et groupes de souffle) à partir de la séquence de phones alignés.

ircamalign.png

Entrée : fichier audio de parole et facultativement, fichier du texte prononcé. Sortie : fichiers de type .lab des divers niveaux de segmentation visualisables dans les logiciels comme AudioSculpt ou WaveSurfer. IrcamAlign utilise des modèles appris sur des enregistrements. Les modèles existent pour le français et l’anglais, hommes et femmes. Il peut être utilisé pour la voix chantée mais cela nécessite l’apprentissage de modèles spécifiques. Il est utilisé en particulier pour la création de corpus de voix (par exemple pour la Synthèse de la Parole à partir du texte). Plateforme : Linux, utilise la bibliothèque HTK et le logiciel LiaPhon. Réalisation : P. Lanchantin



Demonstrations


Logiciel Associé: IrcamAlign
Personnes Associées: Pierre Lanchantin