Thème : Son et musique : Emetteur et récepteur sonore ...physchimltpmf.h.p.f.unblog.fr/files/2012/09/tp01-rec-voc-2016.pdf · Le passage du souffle d’air entre les deux cordes

Thème : Son et musique Domaine d’étude : Emetteur et récepteur sonore TP01 La voix, l’oreille et la reconnaissance vocale A l’heure actuelle, l’homme communique de plus en plus par la voix avec les machines qu’il invente en s’appuyant sur le principe de la reconnaissance vocale. Cette technique est utilisée dans de nombreux domaines : téléphone portable, GPS, traitement de texte, console de jeux, sécurité, domotique pour personnes à mobilité réduite, … Quel en est le principe ?

La voix Doc1 : Comment naît la voix ? La formation de la voix est déterminée par un ensemble de structures : 1. L’appareil respiratoire, producteur de souffle Il produit le souffle nécessaire à la production de la voix. Les poumons, par l’intermédiaire du diaphragme, envoient un flux d’air qui remonte le long de la trachée et atteint les cordes vocales. 2. Le vibreur laryngé, producteur du son de la voix Le passage du souffle d’air entre les deux cordes vocales les fait vibrer. C’est l’origine du son de la voix. Les deux cordes sont placées horizontalement dans le larynx à hauteur de la pomme d’Adam. Les dimensions des cordes vocales varient entre 17 et 25 mm de long chez un homme et entre 13 et 18 mm chez une femme. La fréquence de vibration des cordes vocales dépend de leur tension et de leur épaisseur. Plus les cordes vocales sont courtes et fines plus elles peuvent vibrer rapidement lors du passage de l’air et produire les sons émis sont aigus. 3. Les espaces d’amplification et de résonance Ce sont la gorge, la bouche et le nez. Ces espaces, ou cavités, changent de volume et de forme

grâce au jeu des muscles du voile du palais, des lèvres, de la langue etc. Ils peuvent ainsi

modifier les qualités de la voix.

Doc2: Description de la voix.

La voix peut-être caractérisée par quatre paramètres principaux : - La hauteur : c’est la sensation auditive liée à la fréquence des vibrations des cordes vocales (son grave, son aigu). L’unité de mesure est le hertz (Hz). - L’intensité : c’est la sensation auditive liée à l’amplitude des vibrations des cordes vocales (son fort, son faible). L’unité de mesure est le décibel (dB). - Le timbre : c’est la sensation auditive liée aux harmoniques présents dans le son (son « sombre », son « clair »). - La tenue : c’est la sensation auditive liée à la durée des vibrations des cordes vocales (son long, son court). Globalement les fréquences de la voix sont comprises entre 200Hz (fondamentale)et 6kHz(harmoniques). Le registre d’une voix est l’étendue de son échelle vocale, de la note la plus grave à la note la plus aigüe.

Extraire et exploiter (1) 1. Quelles sont les trois parties du corps qui interviennent dans la voix ? 2. Schématiser, à l’aide d’une chaîne, les principales étapes de la production d’un son par la voix. Représenter, de même, une chaîne illustrant la perception d’un son par l’oreille. 3. Comment expliquer la différence de registre entre un baryton et une soprano ?

Réaliser et valider (1)

1. Proposer un protocole pour déterminer le registre votre voix. (! Pas de voix de tête !)

2. Visualiser le spectre du la3 (440Hz) du diapason. Enregistrer ou visualiser le spectre du la

3 chanté. Faire une analyse critique des

spectres des signaux.

Matériel disponible : Micro, logiciel Régavi, logiciel Régressi.

Rq : Attention, vérifier dans panneau de configuration partie audio que la case micro dans volume soit cochée sinon il n’est pas

possible d’enregistrer les notes.

L’oreille Doc3 : Acoustique physiologique. (voir l’animation « oreille et son » puis l’animation « onde sonore plane ») L’oreille comporte trois parties :

L’oreille externe est la seule partie en communication directe avec l’extérieur. Elle est composée d’un pavillon et d’un conduit auditif. C’est une simple structure de transmission des sons vers le tympan.

L’oreille moyenne tient le rôle de protection et de transmission mécanique. Les vibrations du tympan sont transmises au marteau, à l’enclume et à l’étrier.

L’oreille interne est la partie la plus fragile de l’oreille. Elle est constituée de

quelques milliers de cellules ciliées, situées dans la cochlée, qui convertissent

les vibrations mécaniques en signaux électriques. C’est notre capital auditif.

Lorsqu’une onde sonore de haute fréquence est transmise à la cochlée, seuls

les récepteurs sensoriels du début de la cochlée sont activés. Lorsque la fréquence de l’onde sonore diminue, les récepteurs plus

éloignés sont aussi activés. Donc plus le son est grave, plus le nombre de récepteurs activés est important.

Doc4 : Intensité acoustique et niveau sonore.

L'intensité acoustique I ( W.m-2

) caractérise la puissance énergétiqueP véhiculée par l'onde sonore et reçue par le tympan de

l'oreille :

I = P /S avec S : surface du récepteur perpendiculaire à la direction de propagation de l’onde sonore. (m2)

P : puissance sonore reçue par la surface S. (W)

Pour rendre compte de la sensation phisiologique perçue par l’oreille, on utilise le niveau sonore L qui s’exprime en décibels (dB) : L = 10. log ( I/I0) avec I0= 10

-12 W.m

-2 (seuil d’audibilité)

Rq:

L = 20.log (P/P0) avec P l’amplitude de la surpression par rapport à la pression atmosphérique

P0= 2.10-5

Pa (surpression de référence) Doc5 : Sensibilité de l’oreille humaine.

L’oreille humaine est sensible à la puissance acoustique transportée par l’onde sonore. L’oreille perçoit convenablement les sons dont le niveau

d’intensité sonore est compris entre le seuil d’audibilité et

le seuil de douleur. Sa sensibilité varie en fonction de la

fréquence. Cela peut être représenté par une série de

courbes (diagramme de Fletcher et Munson) dîtes d’égale

sensation auditive. Ces courbes montrent, par exemple,

qu’un son de 1000 Hz dont le niveau d’intensité sonore

est de 60 dB donne la même sensation d’intensité qu’un

son de 50 Hz de 90 dB (points rouges). Par ailleurs, la

sensibilité diminue avec l’âge, ce qui conduit à des pertes

auditives.

Doc6: Les dangers du bruit . Les sons deviennent nocifs lorsque leur intensité dépasse les possibilités de réception de l’oreille. Le niveau d’intensité sonore est exprimé en décibel (dB). L’échelle va de 0 à 120 dB, mais certaines sources (avion, fusée, canon) émettent des sons d’un niveau supérieur. La réglementation limite à 100 dB le niveau de sortie des baladeurs et à 105 dB celui dans les lieux musicaux. La limite de nocivité est située entre 85 et 90 dB. Après une exposition prolongée à un niveau proche de 100 dB, par exemple après une soirée en discothèque, on constate divers états auditifs que l’on peut classer par gravité croissante : - aucun phénomène auditif particulier, c’est le cas le plus fréquent, mais à coup sûr, quelques cellules ont été fragilisées. - phénomènes temporaires tels que des bourdonnements ou des sifflements (acouphènes) ; - phénomènes de type acouphènes persistants et irréversibles, baisse sensible de l’audition.

Extraire et exploiter (2) 1. Schématiser, à l’aide d’une chaîne, les principales étapes de la perception d’un son par l’oreille.

2. Diagramme de Fletcher et Munson: 2.1. Quelles sont les fréquences maximales et minimales des sons perçus par l’oreille humaine Quelle serait l’allure des courbes de ce diagramme si la sensibilité de l’oreille ne variait pas en fonction de la fréquence ? 2.2. Pour quelle fréquence, une oreille est-elle la plus sensible ? Justifier. 2.3. L’échelle des fréquences est logarithmique : quelles sont la particularité et l’utilité de cette échelle ? 2.4. Comparer les niveaux d’intensité sonore permis par la réglementation avec les limites de nocivité et le seuil de douleur. Quel autre paramètre est aussi à prendre en compte pour évaluer la nocivité du son ? 3. Calculer le niveau sonore correspondant à une intensité acoustique de 2.10

-5 W.m

-2.

Suggérer une source sonore pouvant fournir une telle intensité acoustique. Un son de 50Hz avec cette intensité acoustique est-il audible ?

Calculer la surpression P correspondant à cette intensité acoustique. 4. Pour une oreille non musicienne, les harmoniques des sons sont souvent masqués par le fondamental. Pourquoi? 5. Le théorème d'échantillonnage de Nyquist-Shannon énonce que l'échantillonnage d'un signal, c'est-à-dire sa représentation sous une forme discrète, par une liste de valeurs prélevées régulièrement dans ce signal, exige une fréquence d'échantillonnage supérieure au double de l'écart entre les fréquences minimale et maximale qu'il contient. Sachant que la fréquence d’échantillonnage du son téléphonique vaut 8kHz, expliquer pourquoi la bande passante d’un téléphone portable est limitée par les fréquences 300Hz et 3,4kHz. Réaliser et valider (2)

1. A l’aide d’une double prise-jack, brancher votre lecteur MP3 à un sonomètre (Range : Hi ; Response : F ; Funct : C).

Noter le niveau d’intensité sonore lorsque le volume est réglé au maximum.

Votre lecteur respecte-t-il la règlementation sur les baladeurs ?

Faire une mesure avec un casque audio et conclure.

2. Réaliser votre audiogramme grâce au logiciel « audiogramme ». (Faire cette manip si le temps le permet)

La reconnaissance vocale

Doc7 : Les 2 techniques de la reconnaissance vocale

L’homme peut communiquer avec les machines qu’il invente : Smartphone, ordinateur de voiture, domotique, …

Le principe repose sur l’utilisation de logiciels de reconnaissance vocale développés principalement par IBM, Microsoft et

Nuance.

Il existe 2 techniques de reconnaissance vocale. L’une reposant sur une approche globale et l’autre sur une approche analytique.

L’approche globale s’intéresse directement aux mots. Une image acoustique d’un certain nombre de mots est enregistrée

dans une base et comparée à l’image acoustique du mot prononcé. Cette technique est efficace, mais le nombre de mots

est limité à cause de la capacité de stockage et de traitement de la machine.

L’approche analytique est basée sur la reconnaissance des phonèmes et syllabes. L’avantage est incomparable car tous les

mots de la langue française peuvent être prononcés avec seulement 36 phonèmes.

Voir http://sd-1.archive-host.com/membres/up/1425199533224639/sons/Les_36_phonemes.pdf

L’ordinateur décompose chaque phonème d’une phrase prononcée. A chaque phonème est associé un spectrogramme

caractéristique (cf. doc9). Il compare alors les spectrogrammes obtenus et leurs associations à ceux de mots réels.

Interviennent alors les traitements de la phrase et de son sens par des logiciels d’analyse contextuelle et sémantique.

La plus grande difficulté, en plus de la gestion des différences d’accent, de timbre et de rythme de parole, est l’interprétation par la

machine du sens du discours.

Ex : « La citerne est pleine d’eau » et « la scie terne est plaine dos ».

http://fr.wikipedia.org/wiki/%C3%89chantillonnage_(signal)

http://fr.wikipedia.org/wiki/Syst%C3%A8me_discret

http://fr.wikipedia.org/wiki/Fr%C3%A9quence_d%27%C3%A9chantillonnage

http://fr.wikipedia.org/wiki/Fr%C3%A9quence

http://sd-1.archive-host.com/membres/up/1425199533224639/sons/Les_36_phonemes.pdf

Doc8: Spectre d’un phonème

Le spectre d’un son correspondant à un phonème fait apparaître plusieurs pics, appelés formants.

Ils sont dus à des phénomènes de résonance à l’intérieur du conduit vocal ;

leur fréquence dépend de la position des divers organes mis en jeu dans la voix

(langues, lèvres, etc.).

Les formants sont caractéristiques du phonème prononcé.

Les analyses spectrales montrent que quatre à cinq formants importants sont

présents dans tous les spectres de voix.

Doc9: Spectrogramme Un spectrogramme est la représentation tridimensionnelle d’un son. Il représente la fréquence en fonction du temps et l’intensité sonore associée à chaque fréquence est représentée par un code couleur. Sur un spectrogramme, les formants correspondants à des maximas

d’intensité sonore sont repérés par des zones nettement colorées.

Doc10: Spectrogrammes et reconnaissance vocale

Résolution d’un problème scientifique : Associer à chaque lettre A, B, C et D le mot correspondant.

Spectrogramme du phonème [] < -- > ( è)

Spectre du phonème [] < -- > ( è)

Le document ci-dessous est le spectrogramme

obtenu lors de la prononciation des 4 phonèmes

« i », « é », « o » et « ou ».

Le document ci-dessous est le spectrogramme obtenu lors de

la prononciation dans le désordre de 4 mots

«l it », « lait », «lot » et «loup ».

Documents

Thème : Son et musique : Emetteur et récepteur sonore ...physchimltpmf.h.p.f.unblog.fr/files/2012/09/tp01-rec-voc-2016.pdf · Le passage du souffle d’air entre les deux cordes