Traitement des signaux audio de musique: le d?bruitage
Introduction: utilisation de LTFAT et pr?paration
Demarrage de la toolbox ltfat
clear 'variables'; close all; clc; ltfatstart;
LTFAT version 2.1.1. Copyright 2005-2015 Peter L. S��ndergaard. For help, please type "ltfathelp". LTFAT is using the MEX backend. (Your global and persistent variables have just been cleared. Sorry.)
%Lire le fichier audio jazz.wav fourni, ou celui de votre choixa l'aide de %la fonction audioread, puis l'afficher avec une echelle temporelle adaptee [x,fs] = audioread('../../wav/jazz.wav'); x = x(:); T = length(x); TimeAxis = linspace(0,T/fs,T); figure; plot(TimeAxis,x); title('Samples representation');

On s'appuiera sur la toolbox LTFAT pour toutes les transformees temps-frequence. En particulier, on utilisera les fonctions dgtreal} et idgtreal:
help dgtreal help idgtreal
il pourra etre utile d'utiliser les "pointeurs de fonctions" matlab, qui permettent de simplifier le code. En pratique, cela evitera de passer tous les parametres necessaires de dgtreal ? une fonction: on passera simplement le nom de la fonction qui l'encapsule. Par exemple, on cree une fonction {\tt op.analysis} qui permet d'implementer l'operateur d'analyse d'une transformee de Gabor avec une fenetre de Hann
%M de taille 1024, avec 50\% de recouvrement: M = 1024; a = M/4; T = length(x); g = gabwin({'tight', 'hann'}, a, M); op.analysis = @(x) dgtreal(x,g,a,M); op.synthesis = @(x) idgtreal(x,g,a,M,T);
Ainsi, il suffit d'appeler op.analysis(x) pour faire l'analyse temps-frequence du signal x
X = op.analysis(x); [NbFreq, NbTime] = size(X); FreqGaborAxis = linspace(0,fs/2,NbFreq); TimeGaborAxis = linspace(0,T,NbTime); figure; imagesc(TimeGaborAxis, FreqGaborAxis, 20*log(abs(X)+eps)); set(gca,'Ydir','Normal');

et op.synthesis pour faire la synthese:
x_reconstruit = op.synthesis(X);
err = norm(x(:)-x_reconstruit(:))^2;
fprintf('erreur de reconstruction: %f\n',err);
erreur de reconstruction: 0.000000
Dans une fonction, on pourra passer simplement la variable op pour beneficier de op.analysis et op.synthesis. Exemple:
function [X,x_rec] = func_ex(x,op)
T = length(x); X = op.analysis(x); x_rec = op.synthesis(X);
[X, x_rec] = func_ex(x,op); [NbFreq, NbTime] = size(X); FreqGaborAxis = linspace(0,fs/2,NbFreq); TimeGaborAxis = linspace(0,T,NbTime); figure; imagesc(TimeGaborAxis, FreqGaborAxis, 20*log(abs(X)+eps)); set(gca,'Ydir','Normal'); err = norm(x(:)-x_rec(:))^2; fprintf('erreur de reconstruction: %f\n',err);
erreur de reconstruction: 0.000000

Generation de bruits blanc ou colores et estimation spectrale
La fonction noise_gen permet de generer un bruit blanc ou color?
help noise_gen noise_type = 'white'; [noise,spectrum] = noise_gen(T,1,fs,noise_type);
NOISE Stochastic noise generator Usage: outsig = noise(siglen,nsigs,type); Input parameters: siglen : Length of the noise (samples) nsigs : Number of signals (default is 1) type : type of noise. See below. Output parameters: outsig : siglen xnsigs signal vector NOISE(siglen,nsigs) generates nsigs channels containing white noise of the given type with the length of siglen. The signals are arranged as columns in the output. If only siglen is given, a column vector is returned. NOISE takes the following optional parameters: 'white' Generate white (gaussian) noise. This is the default. 'pink' Generate pink noise. 'brown' Generate brown noise. 'red' This is the same as brown noise. By default, the noise is normalized to have a unit energy, but this can be changed by passing a flag to NORMALIZE. Examples: --------- White noise in the time-frequency domain: sgram(noise(5000,'white'),'dynrange',70); Pink noise in the time-frequency domain: sgram(noise(5000,'pink'),'dynrange',70); Brown/red noise in the time-frequency domain: sgram(noise(5000,'brown'),'dynrange',70); See also: normalize Url:
La methode de Welch permet d'estimer la densite spectrale de puissance du bruit. Pour cela, il suffit de faire la transformer de Gabor du bruit, puis de moyenner les densit?s spectrales obtenues dans chaque fenetre
Exercice 1: implementer une fonction [dsp_noise] = welch(noise,op,g) avec pour parametres: - noise : le vecteur contenant le bruit - op : l'operateur permettant de faire l'analyse de Gabor voulue - g: fenetre d'analyse utilisee dans l'operateur (n?cessaire pour normalisation) Et qui renvoit: - dsp_nosise: l'estimation de la densite spectrale de puissance du bruit
[dsp_noise] = welch(noise,op,g);
On compare la dsp estimee et la dsp theorique
figure; hold on FreqAxisTrue = linspace(0,fs/2,length(spectrum)); plot(FreqAxisTrue,spectrum,'r'); FreqAxisEstim = linspace(0,fs/2,length(dsp_noise)); plot(FreqAxisEstim,dsp_noise,'b'); hold off

On va maintenant simuler l'ajout d'un bruit de fond. La fonction noise_gen generant un bruit de variance 1, on va ajuster l'energie de bruit pour atteindre un SNR en entree fixee
Input_SNR = 0 ; sigma_bruit = sqrt(var(x)*10^(-Input_SNR/10)); noise = sigma_bruit*noise; y = x + noise;
On verifie le SNR en entree:
fprintf('Input SNR = %f\n',SNR(x,y));
Input SNR = -0.000028
On va simuler l'hypothese: on observe une partie du signal qui ne contient que du bruit sur 1 s, qui permet d'estimer la dsp du bruit
Tnoise = fs; noiseObserved = noise(1:Tnoise); [dsp_noise] = welch(noiseObserved,op,g); figure; hold on FreqAxisTrue = linspace(0,fs/2,length(spectrum)); plot(FreqAxisTrue,sigma_bruit^2*spectrum,'r'); FreqAxisEstim = linspace(0,fs/2,length(dsp_noise)); plot(FreqAxisEstim,dsp_noise,'b'); hold off

Debruitage par estimation diagonale
La premiere methode vue est le filtrage "a la Wiener" empirique, sans parametre
Y = op.analysis(y); HWienerNum = bsxfun(@minus,abs(Y).^2,dsp_noise); %Noter l'utilisation de bsxfun + dspNoise est deja une puissance HWienerNum(HWienerNum < 0) = 0; HWienerDenum = abs(Y).^2; HWiener = HWienerNum./(HWienerDenum+eps); % +eps pour eviter les divisions par 0 X_estim = Y.*HWiener ; x_estim = op.synthesis(X_estim,T);
On evalue le SNR en sortie
Output_SNR = SNR(x,x_estim);
fprintf('Output SNR = %f\n',Output_SNR);
Output SNR = 12.864651
Exercice 2: implementer une methode generale de debruitage, permettant d'effectuer Wiener empirique ou soustraction spectrale, avec plusieurs parametres. On pourra fixer certains parametres par defaut [x_denoise] = DeHiss(x,noise,op,lambda,alpha,beta,gamma) De Hissing par estimation diagonale dans le domaine T.F. XDenoise = X .* H avec H = max(gamma x DspN ; (X|alpha-lambda|DspN^(alpha/2))./|X|^alpha) ) ^ beta) ou DspN est une estimation de la densit? spectrale de puissance du bruit
Entree: - x: signal a debruiter - noise: bruit isole - op: operateurs d'analyse/synthese - lambda: valeur du seuillage - alpha: puissance du module (defaut alpha = 2) - beta: puissance du filtre (defaut beta = 1) - gamma: bruit residuel (defaut gamma = 1e-4) Sortie: - x_denoise: signal debruite
On testera cette methode avec les valeurs par defaut pour commencer, en faisant varier le parametre lambda.
Exercice: dessiner la courbe SNR en sortie VS lambda. On choisira une echelle logarithmique pour les lambda
faire apparaitre sur cette courbe les resultats obtenus par le Wiener Empirique sans ponderation par lambda
Exo2 % Exercice 3: reprendre l'exercice precedent, en supperposant les courbes % obtenues pour differents gamma = [1e-1,1e-2,..,1e-6,0] Exo3 % Exercice 4: comparer les courbes pour differents gamma = [1e-1,1e-2,..,1e-6,0], beta = [1,2] et % alpha = [1,2]. dessiner les cources pour le meilleur gamma, et faire % apparaitre les resultats obtenus pour le Wiener Empirique, la % soustraction spectrale d'amplitude et la soustraction spectrale de puissance (lambda = 1) Exo4