Symphonie en boîte

Le codec MP3 est à l’origine d’une grande révolution du début des années 2000 : le piratage musical. Au passage, sans cette étape, les plateformes légales de streaming ne se seraient pas aussi bien développées. Mais passons cette histoire pour nous intéresser techniquement au fonctionnement du MP3.

Version courte. Suite à une analyse psychoacoustique, le son est débarrassé des fréquences peu pertinentes ce qui en simplifie sa description. Pour finir, un encodage de Huffman est appliqué pour compresser ce qu’il peut encore l’être. Voilà, on divise par 10 la taille du fichier en perdant un peu en qualité.

Le problème de cette description est qu’elle soulève de nombreuses questions. Huffman, c’est un classique de la compression. Mais, qu’est ce l’analyse psychoacoustique ? En quoi une fréquence est moins bien perçue par notre oreille qu’une autre ? Comment cela est-il décrit dans le fichier final ?

Tant de questions auxquelles je vais essayer de répondre dans la version longue

Commençons par l’analyse psychoacoustique. Comme pour notre vision, notre audition a des biais. Certaines informations ont plus d’importance que d’autres. Alors pourquoi enregistrer avec la même précision des informations sur lesquelles nous feront moins attention. 

Premier biais observé, imaginons que vous écoutiez un groupe dans la rue lors de la fête de la musique. Si votre téléphone portable sonne, vous ne le remarquerez pas alors que chez vous, vous trouverez la sonnerie bruyante. Entre 2 sons, le plus puissant occupera notre attention rendant l’autre inutile.

Second biais, nous prêtons plus attention aux sons que nous avons l’habitude d’entendre : la voix humaine. Les sons entre 300 Hz et 3400 Hz sont plus importants dans notre vie. L’enregistrement audio est réalisé entre 20 Hz et 20 000 Hz. Au-delà de ces bornes, nous n’entendons pas. 

Cela signifie que les bandes de fréquence [20 Hz ; 300 Hz] et [3400 Hz, 20 000 Hz] n’ont pas besoin d’être aussi décrites que la bande centrale, sauf si elles sont exploitées majoritairement dans la musique enregistrée. En pratique, j’imagine que le découpage en bande de fréquence est plus complexe. 

Mais pour distinguer cela, il faut utiliser une représentation fréquentielle du signal audio. Et pour cela l’outil mathématique utilisé est la Transformation en Cosinus Discrète Modifiée (ou MDCT en anglais). Cette transformation permet de distinguer les fréquences et leurs intensités dans le signal audio.

Le calcul est approximatif mais suffisamment précis pour conserver un signal audio correct. Et avec l’exploitation des biais psychoacoustiques de l’audition humaine, il est possible de coder plus précisément les informations les plus importantes et de supprimer celles qui ne sont pas importantes pour l’auditeur. 

La différence introduite par ces calculs est un bruit quasi imperceptible par l’oreille humaine et le poids du fichier est divisé par au moins 10. A la lecture, la représentation fréquentielle réalisée par la MDCT sera inversée (iMDCT) afin de décrire le signal comme une tension exercée sur le haut parleur. 

L’algorithme qui décrit la compression MP3 a été défini en 1993. 32 ans plus tard, de nouveaux encodages avec pertes ont été proposés. Ils peuvent utiliser d’autres transformations mathématiques du signal ou jouer sur le débit en sortie pour gagner en efficacité ou en qualité.

Pourtant, c’est bien le format MP3 qui a écrit l’histoire. De nos jours, nous ne nous posons plus la question de l’encodage de nos musiques. Pourtant, des milliers d’ingénieurs et d’informaticiens cherchent encore à optimiser ces algorithmes. Quelques Ko économisés sur un réseau ou sur un support de stockage ce n’est rien. Répété des milliards de fois, aucun comptable n’ignorera le gain. 

Comme toujours dans le domaine de la compression, la représentation mathématique de l’objet à compresser est utilisée pour simplifier et gagner de l’espace. Et comme souvent, cela change notre monde. Le codec MP3 en fait partie et on n’en remercie jamais assez les mathématiciens à l’origine de ces créations.  

Partager l'article !!

J’ai de la chance !!!