57
Audio et spatialisation du son Nicolas Tsingos

Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Embed Size (px)

Citation preview

Page 1: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Audio et spatialisation du son

Nicolas Tsingos

Page 2: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Motivation

• L’apport du son est indéniable– films, jeux vidéos, simulation, réalité virtuelle– le son augmente le réalisme et la sensation

d ’immersion

Page 3: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Motivation

• Le son doit être cohérent avec les visuels– synchronisation– cohérence des effets (distance, position, etc.)

Page 4: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Introduction au son physique

• Onde mécanique– compression/dilatation

des molécules du milieu– pas de son dans le vide ! – créée par un corps en vibration– caractérisée par le niveau de

pression acoustique (Pa ou N.m-2)

– également mesurée en décibels (dB) : 20 log10(P/Préf)

Page 5: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Ondes harmoniques

• Onde sphérique: – P(r,t) = Po/r sin(t - kr ) = 2f (pulsation)– k = /c (nombre d’onde)– = 2 /k (longueur d’onde)– = kr (phase)

r

Page 6: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Introduction au son physique• Ordres de grandeur

– célérité : 340 m/s (air) 1000 m/s (eau/métal)– fréquences: 0 - 400 kHz

(audible de 20Hz à 20kHz)– longueur d’onde : 100m - 1mm

• Lumière:– célérité : 3.108 m/s (vide)– fréquences: 1011 - 1017 Hz– longueur d’ondes: 7.8x10-7 m (rouge) - 3.9x10-7 m (violet)

Page 7: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Ondes complexes

• Peuvent se décomposer en ondes harmoniques– décomposition linéaire

• Analyse de Fourier– FFT par blocs – spectrogramme

Page 8: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Ondes complexes

Page 9: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Propagation du son

• Sources/Auditeur en mouvement– Effet Doppler

Page 10: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Propagation du son

• Réflexion– spéculaire

• Diffraction du son

Page 11: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Propagation du son

• Réverbération– superposition de réflexions/diffractions du son

au cours du temps– particulièrement sensible dans les espaces clos

Page 12: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Perception du son

• L’oreille est un récepteur complexe – le tympan mesure la pression acoustique– convertie en atomes temps-fréquence par le cortex

Page 13: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Perception du son

• Nous somme sensibles à l’intensité(intégrale temporelle du carré de la pression)

• Fréquences audibles: 20Hz- 20kHz

• Dynamique: 1012 W.m2 (120 dB) du seuil d’audition au seuil de douleur

Page 14: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Perception du son

Page 15: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Perception du son

• Filtrage en « bandes critiques »– membrane basilaire (cochlée)– le son est découpé en 25 bandes – 1/3 octave

Page 16: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Perception du son

• Masquage– Effet de précédence : pour des signaux similaires

le premier arrivé à l’auditeur masque le second (essayez avec votre chaine hifi)

– Masquage temporel : un son fort masque un son faible immédiatement après…et même avant !

– Masquage fréquentiel: une fréquence masque les fréquences voisines (+ dans les basses)

Page 17: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Perception du son

• Le spectre et la phase du son sont plus importants que les variations de la pression

Page 18: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Perception du son

• la perception binaurale (des 2 oreilles) donne des indications de direction en 3D

Page 19: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Le son numérique

• Acquisition du son– microphone– convertit les variations de pression

en variations d’intensité électrique

• Numérisation du son– convertit les variations d’intensité electrique en bits – Pulse Code Modulation (PCM)– quantisation et fréquence d’échantillonage

Page 20: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Le son numérique

• Quantisation– nombre de bits utilisés

pour encoder l’amplitude du signal

– virgule fixe ou virgule flottante– linéaire ou non-linéaire– pas assez de résolution => bruit – détermine la dynamique possible du signal

Page 21: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Le son numérique

• Fréquence d’échantillonnage (sampling rate)– combien de fois par seconde va-t-on représenter la

valeur du signal– Théorème de Shannon: il faut échantillonner à

au moins 2x la plus haute fréquence contenue dans le signal pour ne pas avoir de pertes

Page 22: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Le son numérique

• Quelques chiffres– CD : 16 bits, entiers, 44100 Hz– Téléphone: 8 bits, entiers, 8kHz, non linéaire– DVD: jusqu’à 192kHz, 24 bits, entiers

Page 23: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Spatialisation du son

*

Page 24: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Spatialisation du son

• Positionnement du son dans l’espace– différence de temps d’arrivée aux oreilles– masquage/diffraction par le torse et la tête– filtrage complexe dû aux réflexions/diffractions

dans le pavillon de l’oreille

=> dépend de la direction d’incidence

Page 25: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Spatialisation du son

• Réverbération– Modèle géométrique

• Construire les réflexions

• En déduire un filtre

– Modèle perceptif• approximation statistique

• réverberation artificielle

• contrôle par critères perceptifsReflections Delay

Reverb Delay

dBReflections

Reverb0 dB

Direct

time

Decay Time

Page 26: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Réverbération par convolution

• Réponse impulsionelle– la réponse d’un système lorsque

l’entrée est une impulsion (Dirac)– suffit à décrire le système

• Convolution

Page 27: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Calcul de réponse impulsionelle

• Ray-tracing

Page 28: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Calcul de réponse impulsionelle

• For each path– Build path filter– Add to impulse response

• Convolve signal chunk with “long” filter

Need for a convolution engineNeed for a convolution engine

Best-suited to static environmentsBest-suited to static environments

Page 29: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Calcul de réponse impulsionelle

• For each path– Build “short” path filter – Convolve with a chunk of input signal– Mix contribution to output

Convolution per pathConvolution per path

Supports interpolation of Supports interpolation of paths attributes and filterspaths attributes and filters

Page 30: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Attributs perceptifs

• Acoustique des salles(design de salles de concert)

dB

0 dB

time

Page 31: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

dB

0 dB

time

Total energy (amplification)• Acoustique des salles

Attributs perceptifs

Page 32: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Attributs perceptifs

dB

0 dB

time

Total energy (amplification)Decay time (reverberance)

• Acoustique des salles

Page 33: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Attributs perceptifs

dB

0 dB

time

Total energy (amplification)Decay time (reverberance)

Direct/reflected ratio (proximity)

• Acoustique des salles

Page 34: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Attributs perceptifs

dB

0 dB

time

Total energy (amplification)Decay time (reverberance)

Direct/reflected ratio (proximity)Early/late ratio (intelligibility)

• Acoustique des salles

Page 35: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Attributs perceptifs

dB

0 dB

time

Total energy (amplification)Decay time (reverberance)

Direct/reflected ratio (proximity)Early/late ratio (intelligibility)Initial delay time (room size)

• Acoustique des salles

Page 36: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Attributs perceptifs

dB

0 dB

time

Total energy (amplification)Decay time (reverberance)

Direct/reflected ratio (proximity)Early/late ratio (intelligibility)Initial delay time (room size)

• Acoustique des salles

Page 37: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Attributs perceptifs

dB

0 dB

time

Total energy (amplification)Decay time (reverberance)

Direct/reflected ratio (proximity)Early/late ratio (intelligibility)Initial delay time (room size)

Lateral energy fraction

• Acoustique des salles

Page 38: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Attributs perceptifs

On divise la réponse impulsionelle en 3 parties– le son direct– reflexions précoces– réverbération (tardive)

fréquences: 3 bandes– basses [20-500 Hz]– médium [500-2000 Hz]– aigus [2000+ Hz]

dB

time

Hz

Page 39: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Attributs perceptifs

• Distribution spatiale (typique)son direct: directionelréflexions individuelles: directionellesréverberation: diffuse (de partout)

• Réflexions précoces ne sont pas séparéesmais: - le son direct peut être bloqué

- echos audibles (environmt. extérieurs)- “phasing” avec les sources en

mouvement

Page 40: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Reverbération artificielle

• Plus efficace qu’une convolution directe

1

N

2

g1

gN

g2

A

delai atténuation

matrice de feedback

Page 41: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Spatialisateurmulti-channel

output bus

source processing block

filter gain

Refl.

Reverb.

reverberation block

pan

pan

Page 42: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Positionement 3D du son

• Systèmes de restitution– stéréo– multi-haut parleur

Page 43: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Positionement 3D du son• En stéréo

– pas besoin de plus !– appliquer une paire de filtres

à un signal mono– filtres sont directionels

• HRTFs– Head Related Transfer Functions– mesurés ou simulés– dépendent de l’auditeur

Page 44: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Positionement 3D du son

• Extension à des enceintes stéréo– transaural stereo– suppression des chemins

croisés (cross-talk)

Page 45: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Positionement 3D du son

• Multi-haut parleur– Son surround 5.1 et +– Ambisonics– Holophonie

Page 46: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Récapitulatif

?

yes (3D array)

yes (3D array)

yes

yes

elevation

?smallaveragelowaverage (4+)

AmplitudePanning

?n/av.goodhighheavy (100+)

WFS

yessmallgoodmoderateaverage (4+)

Ambisonics

yessmallgoodmoderatelight (2+)Transaural

yes

recording

n/a

Sweet spot

v.good

imaging

moderate

DSP

light (2)

Setup(# chans)

HRTF

Technique

Page 47: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Standards

• Direct Sound 3D– spatialisation, reverberation, effets– EAX (Creative Labs)– OpenAL (multi-plateforme)

=> support hardware par les cartes sons

64 voix 3D + 4 reverb simultanées

• MPEG4 audio

• JAVA 3D

Page 48: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Compression du son

• Quantization et fréquence d’échantillonage

• Quantization non uniforme

• Adaptive Differential PCM (ADPCM)

• Perceptual audio coding (PAC)

Page 49: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Quantization et échantillonnage

• Réduire le nombre de bits– introduit du bruit de quantization– limite la dynamique

• Réduire la fréquence d ’échantillonage– limite la réponse en fréquence

• Peut marcher pour certains signaux (voix,…)

Page 50: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Quantization non uniforme

• Donner plus de résolution aux signaux de faible amplitude– quantization logarithmique -law (US) et A-law (europe)– 14/16 bits représentés sur 8 bits– téléphone

Page 51: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Adaptive Differential PCM (ADPCM)

• Coder les différence entre les samples proches• 127-145-138 sera stocké 127-18-(-7).

• utilisé principalement pour la voix

• de 16 bits à 4 bits = compression 4:1

• DTS

Page 52: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Perceptual audio coding (PAC)

• MPEG I -layer III (mp3) , MPEGII AAC, Dolby digital (ac3), etc.

• Principe: – Découper le signal en bandes critiques– Allouer le nombre de bits de quantization

dynamiquement– Mais réduire ce nombre introduit du bruit– Exploiter les masquages auditifs pour assurer que le

signal masque le bruit

Page 53: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Modèles à base d ’événements

• MIDI (Musical Instrument Digital Interface)

• Représente la musique comme des notes et des événements

• Utilise un moteur de synthèse pour la restitution

• Compression très efficace

• Mais sons limités et pas de garantie de qualité

Page 54: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Direct Sound

• Partie audio de Direct X– gère les entrées-sorties audio temps-réel– support hardware par les cartes audio

• DirectSound object– configuration audio

• DirectSound primary buffer• DirectSound secondary buffers

– mixés dans le primary buffer

Page 55: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Direct Sound Object

• Device– carte son

• Configuration d ’écoute– casque– enceintes stéréo– multi-canal

Page 56: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Direct Sound Primary buffer

• Format de données audio– quantisation– format (entiers, flottants)– fréquence d ’échantillonnage– nombre de canaux– compression

• Mode exclusif ou partagé

Page 57: Audio et spatialisation du son Nicolas Tsingos. Motivation Lapport du son est indéniable –films, jeux vidéos, simulation, réalité virtuelle –le son augmente

Direct Sound Secondary Buffers

• Tableaux circulaires de données échantillonnées– lus à la fréquence d ’échantillonnage audio

– il faut écrire assez vite pour ne pas perdre des données

• Paramètres de contrôle– volume

– position (buffers 3D)

– pitch