Caractérisation automatique des accents étrangers
Laboratoire d »lnformatique de Grenoble Université STENDHAL Grenoble3 Équipe GETALP Caractérisation automatique des accents étrangers next page Projet réalisé par Abdelkarim Mars Mémoire de Master Mention Science du Spécialité Modélisati Industries De la Lang Orientation Recherch Responsables : Laurent Besacier Solange Rossato Membres du jury Georges Antoniadis Résumé 2 et tra atique en tissage Abstract Among the many features affecting the way people speak, accents constitute a major component of variation.
A speakefs pronunciation can inform about the origin geographically and socially. A escription of the phonetic features undertying perceived differences in accent are therefore of particular scientific interest. Besides, accents research is crucial to the improvement of technological applications such as speech recognition and speaker indexing. This memory proposes an acoustic phonetic study of foreign accents in French. To analyze large-scale variations related to the origin of the speaker we evaluated the contribution of automatic tools, acoustico-phonetic decoding and forced alignments.
From the results of the automatic tools we have reached to characterized three main classes of accents. These ccents are the accent of Maghreb, the accent of Europe and the accent of sub-saharan Africa. Keywords: accents, pronunciation, phonetic features, acoustic phonetic study, forced alignments, acoustico-phonetic decoding Remerciements J »ai une vive dette envers tous ceux qui m »ont aidé à rassembler les faits qui constituent l »indispensable fondation de ce travail. Je remercie tout particulièrement : Mr.
Laurent BESACIER et Mme Solange Rossato, de m »avoir accueilli au sein du GETALP (CIG), et d »offrir ainsi la possibilité de travailler dans un laboratoire de linguistique informatique de renommée mondiale. Ils o é disponibles, malgré de 2 témoignage de toute ma reconnaissance et mon profond respect. Mes enseignants pour la qualité de l »enseignement qu’ils m’ont disposé durant mes études, surtout monsieur George ANTONIADIS qui mua fait I »honneur d »accepter la tâche d »être rapporteur. Mes amis : Hana, Atef, Najeh, Issam pour leur amabilité et leur soutien.
Je remercie également mon ami de bureau François. Par la même occasion, je tiens à remercier infiniment tous les membres de l »équipe GETALP qui m »ont accueilli de manière très chaleureuse. Enfin, je garde une place toute particulière à mes parents qui sont toujours à mes cotés, à mes hers frères, à ma sœur. En exprimant toutes mes reconnaissances pour leurs sacrifices, leurs patiences compréhensives et leurs encouragements Au-delà de toutes limites.. Abdelkarim Table des matières Liste de Figures . 9 Liste de 11 Introduction . 12 Chapitre 1 . 4 Contexte d’étude et état d 3 2 2. Caractéristiques de la parole non native… . 2. 1. L’acquisition de la langue. 16 2. 2 Erreurs de prononciation : 2. 3 Différences de débit 17 2. 4 Différents types d’accents 3. Différents approches de caractérisation d’accent 3. 1 Caractérisation d’accent en utilisant des paramètres 19 4. Conclusion prosodiques 3. 2 Arbre de décision multilingue pour la caractérisation 3. 3 Caractérisation d’accent en utilisant des caractéristiques acoustiques . 20 3. 4 Approche phonétique-phonotactique Chapitre 4 2 . 1 Méthodologie 21 1. Introduction. 2. 1 Choix des 2. 2 Présentation du corpus ESTER 22 2. 2. 1 Présentation . 2. 2. 2 Caractéristiques des locuteurs — . 3. Choix d’accent 3. 1 Prétraitement 3. 2 Catégories d’accents choisies : 23 4. Reconnaissance automatique de phonemes . 4. 1 Introduction s 2 24 4. 2 Décodage acoustico-phonétique : . 25 5. Principe d’alignement forcé . 26 5. 1 Construction du dictionnaire de rononciation.. 5. 2 Principe et réalisation de l’alignement forcé 6. Obtention des confusions — 29 7. Conclusion . 30 Chapitre 3 . 1 Analyses des accents 2. Regroupement des phonèmes……….. 2. 1 Consonnes 6 2 28 2. 2 34 3. Résultat d’alignement 35 3. 1 Calcul des statistiques… 3. 2 Analyse des résultats : 4. Résultat DAP 38 4. 1 Statistiques 4. 2 Comparaison Alignement forcé/ DAP — 38 43 Analyse des résultats — . 39 5. Discussion 42 5. 1 Accents du Maghreb 5. 2 Accents d’Afrique sub-saharienne 2 . 45 5. 3 Accents d’Europe 46 6. Analyse des Confusions — . 6. 1 Accents du Maghreb . 47 6. 2 Accents d’Europe 1 6. 2. 2 Consonnes . 52 6. 3 Accents — 53 7.
Conclusion : 55 Conclusion . 56 Bibliographies 58 Annexel . 61 1. Statistiques du résultat de l’alignement forcé . 8 2 2. Statistiques du résultat de DAP pour la parole non native : — 62 3. Statistiques du résultat de DAP pour la parole native : . Annexez 64 Résultat DAP Annexe 3 . 66 Extrait de résultat donné par le système d’alignement forcé : . — 66 Annexe 4 68 Extrait de dictionnaire de prononciation…… Annexe 5 70 Annexe 6 . 71 1. Accents d’Europe : . 1. 1. 72 . 71 1. 1. Voyelles…. 1. 2 Consonnes : 72 2. Accents d’Afrique 73 2. 1 Voyelles . 2.
Consonnes : 74 Liste de Figures Figure 1: L’utilisation des arbres de décisions multilingue pour l »ldentification d’accent français (chinois et vietnamien) non native [T. Ping 2008] • • • • • • • • • • • • • • • • • • 19 Figure 2 : Identification d »accent en utilisant des caractéristiques acoustiques [Arslan 1996] Figure 3 : Reconnaissance automatique de phonèmes. Figure 4 : étapes d »alignement forcé………. Figure 5: Extraction des confusions Figure 6 : Exemples d’alignement de phonèmes et de calculs des confusions — Figure 7 : Distribution des {a, o, E} dans le 0 2