69
Image, Son, Multimedia Analyse et Synthèse du Son Musical Pierre Hanna [email protected] Université de Bordeaux ASSM – p. 1

Analyse et Synthèse du Son Musical - LaBRI

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Analyse et Synthèse du Son Musical - LaBRI

Image, Son, Multimedia

Analyse et Synthèse du Son Musical

Pierre Hanna

[email protected]

Université de Bordeaux

ASSM – p. 1

Page 2: Analyse et Synthèse du Son Musical - LaBRI

Plan

Modélisation du son

ASSM – p. 2

Page 3: Analyse et Synthèse du Son Musical - LaBRI

Modèles

formelle

analyse

synthèse

modèle

transformation

monde

(physique)

représentation

(mathématique)

réel

Analyse : peu de contrainte de temps

Synthèse : temps-réel

ASSM – p. 3

Page 4: Analyse et Synthèse du Son Musical - LaBRI

Modèles spectraux

Son est représenté par une somme d’oscillateurs

Historique:

Dès années 1903 pour films russes. . .

Années 30: vocoder (voice coder) développé par Dudley (Bell Telephone

Laboratories)

Années 60: phase vocoder (Flanagan/Golden)

Utilisation pour la musique (Risset, années 60)

Exemples de modélisations de voix:

1939

1951

. . .

Avec expressivité

ASSM – p. 4

Page 5: Analyse et Synthèse du Son Musical - LaBRI

Phase Vocoder par FFT

Vocoder : modification de la transformée de Fourier à court-terme

Calculer la FFT (trames, chevauchement, fenêtrage)

Pour chaque bin k

calcul de l’amplitude

calcul de la phase

Calcul de la fréquence instantanée Fk(m) pour le mème bin :

F =1

dt

Fk(m) =θk(m)−θk(m−1)+2pπ

2π(tm − tm−1

Fk(m) =θk(m)−θk(m−1)

2π NFe

ASSM – p. 5

Page 6: Analyse et Synthèse du Son Musical - LaBRI

Phase Vocoder par FFT

Utilisation:

Compression

Traitement parole

Supression reverbération

Réduction de bruit

Limites

Bruit

Attaques

Modulations fréquence/amplitude (vibrato/tremolo)

ASSM – p. 6

Page 7: Analyse et Synthèse du Son Musical - LaBRI

Modèles sinusoïdaux

[McAulay, Quatieri (IEEE TASSP, 1986)]

applications [Smith, Serra 1986]

Le signal audio s est donné dans le domaine temporel par:

s(t) =P

∑p=1

ap(t)cos(φp(t))

s(t) =P

∑p=1

ap(t)cos(2π fp(t)t +φp(0))

où P est le nombre de partiels et

φp(t) = φp(0)+2π

∫ t

0fp(u)du (1)

Les fonctions fp(t), ap(t) et φp(t) sont, respectivement,

la fréquence, l’amplitude et la phase du p-ième partiel.

Ces paramètres varient lentement dans le temps.ASSM – p. 7

Page 8: Analyse et Synthèse du Son Musical - LaBRI

Modèles hybrides

Limites des modèles sinusoïdaux pour les sons complexes :

Séparation du son en plusieurs composantes

Partiels

Transitoires

Bruit (résidu)

Traitement indépendant de chaque composante

Fusion des composantes pour la synthèse

ASSM – p. 8

Page 9: Analyse et Synthèse du Son Musical - LaBRI

Définition du bruit (1)

Langage courant:

sons perturbateurs

sons non désirés

sons désagréables

Sinusoide de 1000Hz très désagréable, pourtant ce n’est pas un bruit.

ASSM – p. 9

Page 10: Analyse et Synthèse du Son Musical - LaBRI

Définition du bruit (2)

Acoustique, sciences:

Spectre dense

Signal défini statistiquement (2 signaux différents mais perception

équivalente)

transitoires: traitement différent

ASSM – p. 10

Page 11: Analyse et Synthèse du Son Musical - LaBRI

Définition du bruit (3)

Modèles analyse/synthèse de sons:

Tout ce qui n’est représenté par des sinusoïdes évoluant lentement dans le

temps.

Tout ce qui n’a pas été retenu par le vocodeur de phase.

Frontière son harmonique ou inharmonique complexe/bruit ?

Critère pour décider si un spectre est dense ?

Instrument seul/Multitude d’instruments

ASSM – p. 11

Page 12: Analyse et Synthèse du Son Musical - LaBRI

Intérêt du bruit (1)

Présent dans les sons d’instruments de musique:

Sons denses (cymbales)

Souffle pour les instruments à vent ou pour la parole

Courte impulsions : coups de marteau (piano), cordes pincées (guitare,

violon, . . . )

Bandes de fréquences élargies (tampons du piano qui stoppent les

vibrations de la corde)

Multiples impulsions (chocs) comme pour les maracas.

=⇒ Importance dans la synthèse de sons: un son reste artificiel si l’on ajoute pas

de bruit

ASSM – p. 12

Page 13: Analyse et Synthèse du Son Musical - LaBRI

Intérêt du bruit (2)

Traitement de la parole

Consonnes non voisées (s,ch,f,. . . )

Voix chuchotées

Importance dans les expériences psychoacoustiques

expériences de masquage: mélange de bruit avec des sons harmoniques

ASSM – p. 13

Page 14: Analyse et Synthèse du Son Musical - LaBRI

Modèles pour le bruit

Deux approches possibles:

Approche temporelle: synthèse de bruits classiques/filtrés

Approche spectrale: modèles de synthèse complétant les modèles de sons

harmoniques

ASSM – p. 14

Page 15: Analyse et Synthèse du Son Musical - LaBRI

Approche temporelle

Etude de la distribution des échantillons

Tendance à tendre vers une distribution gaussienne

Deux sons bruités peuvent être très proches, tout en ayant des propriétés

statistiques différentes

Deux sons bruités peuvent être très différents, même si leurs propriétés

sont ressemblantes

Seule approche envisageable :

filtrer du bruit blanc

pas vraiment de modèle. . .

ASSM – p. 15

Page 16: Analyse et Synthèse du Son Musical - LaBRI

Modèle bruit thermique (1)

x(t) =N

∑n=0

[An cos(ωnt)+Bn sin(ωnt)]

où n est un entier et

les pulsations ωn sont également espacées

les coefficients An et Bn sont des variables aléatoires.

ASSM – p. 16

Page 17: Analyse et Synthèse du Son Musical - LaBRI

Modèle bruit thermique (2)

Autre possibilité d’écriture:

x(t) =N

∑n=0

Cn cos(ωnt +Φn)

Φn = arctan(BnAn) distribuées uniformément entre 0 et 2π

Cn = B2n +A2

n distribués selon la loi de Rayleigh, valeur plus probable σ

ASSM – p. 17

Page 18: Analyse et Synthèse du Son Musical - LaBRI

Analyse du bruit

Plusieurs méthodes existantes, selon les applications

Estimation directe depuis le signal

beaucoup de méthodes qui estiment les sinusoïdes

beaucoup de méthodes qui estiment le niveau de bruit

mais peu qui cherchent à estimer le bruit. . .

Estimation à partir d’une estimation de la partie déterministe (sinusoïdale)

Erreur inévitable. . .

ASSM – p. 18

Page 19: Analyse et Synthèse du Son Musical - LaBRI

Analyse du bruit

Décision binaire pour chaque pic du spectre

Sinusoïde

Bruit

Pic peut être un mélange sinus/bruit

Autres approches basées sur l’analyse à long terme du spectre

ASSM – p. 19

Page 20: Analyse et Synthèse du Son Musical - LaBRI

Analyse du bruit

Spectre des parties bruitées évolue rapidement au cours du temps

Idée: Diminuer ces variations (ou la variance)

Moyenne (Méthode de Welsh)

Minimum

Maximum

Etude théorique nécessaire

ASSM – p. 20

Page 21: Analyse et Synthèse du Son Musical - LaBRI

Distribution des amplitudes

Amplitude des composants bruités seuls suivent une loi de Rayleigh:

p(M) =M

σ 2e−M2

2σ2

où σ la valeur la plus probable

Remarque : probabilité non nulle d’avoir une amplitude très forte ou nulle.

ASSM – p. 21

Page 22: Analyse et Synthèse du Son Musical - LaBRI

Distribution des amplitudes

Amplitude des composants sinusoïdaux bruités suivent une loi de Gauss:

ρN(x) =1

σ√

2πexp

−x2

(2σ 2)

où x ∈ R et σ représente l’écart-type (largeur de la fonction de distribution).

Loi pour les deux cas ?

ASSM – p. 22

Page 23: Analyse et Synthèse du Son Musical - LaBRI

Distribution des amplitudes

Loi de Rice

pA,σ (M) =M

σ 2e

−(M2+A2)2σ2 I0

(

AM

σ 2

)

où I0 est la fonction de Bessel modifiée de la première espèce d’ordre 0:

I0 (x) =1

∫ 2π

0excos(φ) dφ

ASSM – p. 23

Page 24: Analyse et Synthèse du Son Musical - LaBRI

Distribution des amplitudes

0 1 2 3 4 5 6 7 8 9 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

M

p(M

)

A=0A=1A=2A=5

A tend vers 0 : Rayleigh

A plus grand que σ : Gauss (moyenne A et écart-type σ )

ASSM – p. 24

Page 25: Analyse et Synthèse du Son Musical - LaBRI

Analyse du bruit

Meurisse, Hanna, Marchand (ICASSP 06)

Etude de la distribution des amplitudes pour un bruit blanc sur plusieurs

frames

Distribution de Rice (Rayleigh/Gauss)

Si Rayleigh : Bruit

Si Gauss : Bruit + Sinus

La valeur de σ indique le niveau de bruit.

ASSM – p. 25

Page 26: Analyse et Synthèse du Son Musical - LaBRI

Modèles Sinus+Bruit

SMS Serra/Smith 1989

s(t) =P

∑p=1

ap(t)cos(φp(t))+ e(t)

e(t) : composant résiduel (ou bruit)

Bruit blanc filtré

Obtenu par soustraction spectrale:

e(t) = s(t)−P

∑p=1

ap(t)cos(φp(t))

ASSM – p. 26

Page 27: Analyse et Synthèse du Son Musical - LaBRI

Soustraction

Besoin d’interpoler la phase. . .

ASSM – p. 27

Page 28: Analyse et Synthèse du Son Musical - LaBRI

Soustraction spectrale

|Er(k)|= ||Xr(k)|− |Dr(k)||Soustraction des spectres d’amplitude

Pas besoin d’avoir les informations de phase de la partie sinsuoïdale

inutile pour la soustraction spectrale

inutile pour la partie résiduelleASSM – p. 28

Page 29: Analyse et Synthèse du Son Musical - LaBRI

Modèles Sinus+Bruit

Partie bruit:

Uniquement représentée par le densité spectrale de puissance (enveloppe

spectrale)

Phases considérées comme aléatoires

Autres modèles:

Energies dans des bandes ERB (Goodwin 96)

Somme de sinus de courtes durées (Moi 03) ASSM – p. 29

Page 30: Analyse et Synthèse du Son Musical - LaBRI

Modèles Sinus+Bruit

Exemples:

Piano

Guitare

Conga

ASSM – p. 30

Page 31: Analyse et Synthèse du Son Musical - LaBRI

Modèles Sinus+Bruit

SMS Serra/Smith 1989

ASSM – p. 31

Page 32: Analyse et Synthèse du Son Musical - LaBRI

Modèles non hybrides

Fitz 1998

Son : somme de sinusoïdes bruitée

yn = A(√

1−K++√

2K[δn ∗hn]).exp( jωcn)

Partiel centré en ωc

K proportion de bruit

δn bruit blanc

hn réponse impulsionnelle (enveloppe du bruit)

ASSM – p. 32

Page 33: Analyse et Synthèse du Son Musical - LaBRI

Modèles Sinus+Attaques+Bruit

STN Verma/Smith

ASSM – p. 33

Page 34: Analyse et Synthèse du Son Musical - LaBRI

Modèles Sinus+Attaques+Bruit

Autre approche (Nsabimana/Zölzer 2008)

Détection précise des transitoires

Supression

Extrapolation du signal pour combler les trous

Applications :

ASSM – p. 34

Page 35: Analyse et Synthèse du Son Musical - LaBRI

Modèles Sinus+Attaques+Bruit

Exemples

Analyse

Etirement temporel

ASSM – p. 35

Page 36: Analyse et Synthèse du Son Musical - LaBRI

Plan

Synthèse de Bruit

ASSM – p. 36

Page 37: Analyse et Synthèse du Son Musical - LaBRI

Synthèse temporelle

Description et algorithme de synthèse de bruits :

Bruit blanc

Bruit rose

Bruit brownien

Bruit ondulant

ASSM – p. 37

Page 38: Analyse et Synthèse du Son Musical - LaBRI

Bruit blanc (1)

white noise

Analogie avec lumière blanche (mélange de toutes les couleurs): contient toutes

les fréquences.

Spectre de fréquence continue

Spectre d’amplitude moyenne égale

Modèle (n’existe pas naturellement) restreint à 20−20000Hz

ASSM – p. 38

Page 39: Analyse et Synthèse du Son Musical - LaBRI

Bruit blanc (2)

Propriétés auditives:

Pas de hauteur perçue

Pas de rythme perçu

ASSM – p. 39

Page 40: Analyse et Synthèse du Son Musical - LaBRI

Synthèse de bruit blanc

Méthodes reposent sur la définition: indépendance et même loi.

Différences selon la loi choisie : perception (intensité), efficacité

Uniforme (rectangulaire)

Gauss (normale)

ASSM – p. 40

Page 41: Analyse et Synthèse du Son Musical - LaBRI

Bruit blanc: uniforme

∀(x1,x2) ∈]−1;1]2, p(x = x1) = p(x = x2)

Densité de probabilité ρ : ρ(x) = 12

0−1 1

ρ

12

x

ASSM – p. 41

Page 42: Analyse et Synthèse du Son Musical - LaBRI

Bruit blanc: uniforme

Algorithme:

Utilisation de la fonction de tirage aléatoire (rand du C)

ASSM – p. 42

Page 43: Analyse et Synthèse du Son Musical - LaBRI

Bruit blanc: gauss (1)

Appelée parfois normale (normal or gaussian)

Tendance naturelle des bruits à être gaussiens (théorème central limite)

Y =N

∑k=1

Xk

Y suit une loi gaussienne si N est grand, quelle que soit la distibution des Xk.

ASSM – p. 43

Page 44: Analyse et Synthèse du Son Musical - LaBRI

Bruit blanc: gauss (2)

Suit une loi de Gauss:

ρN(x) =1

σ√

2πexp

−x2

(2σ 2)(2)

où x ∈ R et σ représente l’écart-type (largeur de la fonction de distribution).

ASSM – p. 44

Page 45: Analyse et Synthèse du Son Musical - LaBRI

Bruit blanc: gauss (5)

Amplitude RMS:

ARMS =√

〈x2〉= σ

Amplitude max: dépend de σ

Compromis:

σ grand : probabilités de saturation

σ petit : intensité perçue faible

=⇒ normalisation

ASSM – p. 45

Page 46: Analyse et Synthèse du Son Musical - LaBRI

Bruit blanc: gauss- Algorithme (1)

Principe:

addition d’un certain nombre de variables aléatoires xi uniformement

distribuées

Littérature indique N = 12 bonne approximation

ASSM – p. 46

Page 47: Analyse et Synthèse du Son Musical - LaBRI

Bruit coloré

Même analogie avec la couleur.

Forme du spectre permet d’associer une couleur

Bruit rose

Bruit brownien (rouge)

Autres . . .

ASSM – p. 47

Page 48: Analyse et Synthèse du Son Musical - LaBRI

Bruit coloré

Bruits roses:

distribution de puissance moyenne suit échelle logarithmique

0 2 4 6 8 10 12 14 16 18 20 22

−25

0

25

50 Amplitude(dB)

Fréq.(kHz)

ASSM – p. 48

Page 49: Analyse et Synthèse du Son Musical - LaBRI

Bruit rose: applications (2)

Application en Musique: distribution des mélodies des morceaux de

musique. La plupart (classique ou moderne) suivent une distribution rose.

Composition aléatoire (Xenakis)

Bibliographie sur 1f

et sur 1f 2 :

http://linkage.rockefeller.edu/wli/1fnoise/

ASSM – p. 49

Page 50: Analyse et Synthèse du Son Musical - LaBRI

Bruit rose: algorithme de Voss (1)

Principe:

Chaque échantillons est la somme de n variables aléatoires.

Pour avoir l’échantillon, on ne retire qu’un certain nombre de ces

variables.

Comme les hautes fréquences sont atténuées, deux valeurs successives vont être

proches: peu de variables retirées.

ASSM – p. 50

Page 51: Analyse et Synthèse du Son Musical - LaBRI

Bruit rose: algorithme de Voss (2)

Data : N

Result : tableau samples de taille 2N

début

pour i = 0 à N −1 faire

oldbit[i] = 1;

fin

pour K = 0 à 2N −1 faire

K = bit[0], bit[1], . . . , bit[N-1];

sum = 0;

pour i = 0 à N −1 faire

si bit[i] 6= oldbit[i] alors

d[i] = rand(0.1);

fin

sum = sum + d[i];

oldbit[i] = bit[i];

samples[i] =sum;

fin

fin

fin

ASSM – p. 51

Page 52: Analyse et Synthèse du Son Musical - LaBRI

Bruit rose: algorithme de Voss (3)

Exemple sur 3 bits:

K 0 1 2 3 4 5 6 7

bits 000 001 010 011 100 101 110 111

retirages 3 1 2 1 3 1 2 1

ASSM – p. 52

Page 53: Analyse et Synthèse du Son Musical - LaBRI

Bruit Brownien (1)

Aucun lien avec couleur marron, analogie avec mouvements browniens des

molécules dans un fluide.

Autre nom: random walk ou l’homme saoul

0 2 4 6 8 10 12 14 16 18 20 22

−50

−25

0

25

50

Fréq.(kHz)

Amplitude (dB)

ASSM – p. 53

Page 54: Analyse et Synthèse du Son Musical - LaBRI

Bruit Brownien (2)

S( f ) =A

f 2

avec f ≥ fmin

S(2 f ) =A

4 f 2=

1

4S( f )

ce qui signifie que, dès que f double de valeur, S( f ) est divisé par 4.

ASSM – p. 54

Page 55: Analyse et Synthèse du Son Musical - LaBRI

Bruit Brownien: algorithme

Différences entre échantillons successifs = variables aléatoires uniformément

distribuées.

Data : N

Result : tableau samples de taille N

début

sum = rand(−1,1);

pour i = 0 à N −1 faire

oldsum = sum;

tant que sum > 1.0 OU sum <−1.0 faire

sum = oldsum + rand(−0.1,0.1);

fin

samples[i] =sum;

oldsum = sum;

fin

fin

ASSM – p. 55

Page 56: Analyse et Synthèse du Son Musical - LaBRI

Coloration d’un bruit (1)

Modifcation de la couleur d’un bruit

=⇒ modification de l’enveloppe spectrale

Les modèles temporels sont basés sur les filtres

=⇒ les bruits sont considérés comme des bruits blancs filtrés.

Linear Predictive Coding (analyse/synthèse de la parole).

ASSM – p. 56

Page 57: Analyse et Synthèse du Son Musical - LaBRI

Coloration d’un bruit (2)

Générateur

Bruit blancFiltrage Bruit coloré

Excitation : bruit blanc

Résonateur : filtres

ASSM – p. 57

Page 58: Analyse et Synthèse du Son Musical - LaBRI

Coloration d’un bruit (2)

Avantage:

efficacité

modélisation physique

Inconvénients:

Lissage de l’enveloppe : compromis précision/complexité

Intuitivité du modèle : suite de réels

ASSM – p. 58

Page 59: Analyse et Synthèse du Son Musical - LaBRI

Synthèse temporelle: conclusions

Facilité et efficacité de synthétiser des bruits colorés de base.

Plus complexe et moins intuitif pour couleurs moins simples.

Avantage: lien avec la physique

Problème: lien avec la perception

ASSM – p. 59

Page 60: Analyse et Synthèse du Son Musical - LaBRI

Modèle bruit thermique (3)

Théorie:

Vérification de E(x[n]x[n+ p]) = 0

Répartition de l’énergie dans le spectre

Deux possibilités:

1. Amplitudes distribuées selon Rayleigh, phases uniformément choisies

2. Amplitudes fixes, phases uniformément choisies

La deuxième méthode est la plus utilisée.

ASSM – p. 60

Page 61: Analyse et Synthèse du Son Musical - LaBRI

Méthodes de synthèse spectrale (1)

Détermination aléatoire des valeurs d’amplitude Cn

Distribution Rayleigh:

ρ(x) =x

σ 2exp− y2

2σ 2

Phases déterminées aléatoirement (loi uniforme) entre 0 et 2π

Quel que soit le nombre de composants sinusoïdaux du bruit (même 1), la

distribution des échantillons suit une loi de Gauss.

ASSM – p. 61

Page 62: Analyse et Synthèse du Son Musical - LaBRI

Algorithme: distribution de Rayleigh

Algorithme à partir de valeurs aléatoires 0 ≤ x < 1 uniformément distribuées et

l’inverse de la fonction cumulative∫ x

0 ρ(z)dz:

yn = σn

−2ln(1− x)

où σ 2n est la puissance moyenne du composant n.

ASSM – p. 62

Page 63: Analyse et Synthèse du Son Musical - LaBRI

Méthodes de synthèse spectrale (2)

Valeurs d’amplitude Cn fixées

Phases déterminées aléatoirement (loi uniforme) entre 0 et 2π

Avantage: chaque signal synthétisé a exactement le même spectre de puissance.

ASSM – p. 63

Page 64: Analyse et Synthèse du Son Musical - LaBRI

Méthodes de synthèse spectrale (3)

Les coeficients An et Bn ne sont plus distribués selon Gauss, et ne sont plus

indépendants:

An =Cn cosΦn

Bn =Cn sinΦn

où Cn est une valeur fixe.

Phases uniformément distribuées =⇒ An et Bn suivent une loi décrite par la

fonction de densité de probabilité d’une sinusoïde.

Théorème central limite: N > 5 =⇒ la distribution des échantillons est

gaussienne.

ASSM – p. 64

Page 65: Analyse et Synthèse du Son Musical - LaBRI

Stationnarité (1)

Limites:

Efficacité (nombre de sinusoïdes)

Hypothèse de stationnarité (analyse)

Transitions entre fenêtres successives (clics)

Pour résoudre ce problème: technique de recouvrement et addition.

Avantage: réduction du nombre d’oscillateurs.

ASSM – p. 65

Page 66: Analyse et Synthèse du Son Musical - LaBRI

Modèles de synthèse spectrale

Une approche possible:

Le signal est composé d’une somme de sinusoïdes

Plus ou moins d’énergie est aléatoirement ajoutée autour de chaque pic

(élargissement)

Spectral Line Broadening (Freed, 1999), Fitz 1999

ASSM – p. 66

Page 67: Analyse et Synthèse du Son Musical - LaBRI

Partie stochastique (SMS)

Partie bruit du signal est obtenu par soustraction spectrale (source d’erreurs).

Hypothèses principales sur la partie stochastique:

considérée comme du bruit blanc filtré

entièrement définie par l’enveloppe spectrale

ASSM – p. 67

Page 68: Analyse et Synthèse du Son Musical - LaBRI

Synthèse de la partie stochastique(1)

basée sur le modèle amplitudes fixes, phases uniformément distribuées

s’effectue uniquement à partir d’une approximation (plus ou moins

importante) de l’enveloppe spectrale

ASSM – p. 68

Page 69: Analyse et Synthèse du Son Musical - LaBRI

Algorithme de synthèse

IDFT

stochastic partphase

complex

spectrum

spectrum

drawuniform

spectrum

magnitude

ASSM – p. 69