Le futur

L’avenir ! Le futur ! Voici un exercice risqué. Lorsque j’ai commencé à m’intéresser à l’informatique, les jeux étaient déjà faits. Les algorithmes de catalogage et de gestion de l’entropie ne pouvaient être améliorés. Et cet état de fait n’a pas changé. Par contre, tout le reste a évolué. 

En 30 ans, les puissances de calculs ont explosé. Les quantités de données stockées et échangées n’ont plus rien de comparable. La qualité des contenus est incomparable. Images et sons sont représentés avec un réalisme bluffant. Et les algorithmes de compression se sont adaptés à ces nouveaux contenus. 

Ainsi, le classique Winzip est devenu obsolète sauf pour les Administrations. La taille des catalogues ne correspond plus à leurs cibles. Les algorithmes de compression d’image se sont adaptés à des images toujours plus détaillées et complexes. Les audiophiles veulent toujours plus de qualité avec des latences toujours réduites. 

Comme nous l’avons vu dans l’article précédent, la boîte à outils se complète progressivement d’outils mathématiques. En combinant les méthodes efficaces pour les contenus et les phases de compression, il est possible de trouver des combinaisons toujours plus performantes. 

Et pour ce faire, on pourrait demander à l’intelligence artificielle de réaliser ce travail de recherche à notre place. La combinaison parfaite sera peut être trouvée.  Ainsi, les chercheurs de Google et de Facebook (pardon Meta !) construisent des modèles qui compressent la voix humaine.

Les gains obtenus sont impressionnants et serviront les réseaux d’entreprises et les réseaux téléphoniques prochainement … à condition que le modèle utilisé ne soit pas trop lourd en espace et en temps de traitement. De plus, l’article compare les challengers EnCodec et Lyra avec le MP3. Musique et voix sont des applications différentes. 

Dans le même genre, les formats PNG (compression d’image sans perte) et FLAC (compression de musique sans perte) sont mis en concurrence par des modèles des IA. Les résultats sont impressionnants mais faire tourner un modèle de 70 Go pour compresser une image de 1 Mo, cela ne semble pas facilement généralisable.

Autre technique d’amélioration de la compression, le GAN. Oratio ne reniera pas tant cet outil est utilisé. L’idée est de générer une image à partir d’une autre image moins détaillée. Concrètement, vous prenez une photo et vous la stockez dans une version très dégradée. Une IA en face se charge de retrouver l’image initiale. 

Le processus est un peu plus complexe. Voici une présentation qui explique bien chaque étape. Une IA reconnaît chaque partie d’une photo (une rue, des passants, une femme qui sourit, des immeubles, …), découpe l’image en sous ensemble de ces éléments et associe une valeur à chaque objet. 

Cela génère une version minimaliste qui est encore réduite par LZ77 et Huffman avant d’être échangée. Pour être visionnée, on réalise les étapes inverses, dont le GAN à la fin pour imaginer ce que le modèle entendait pour chaque élément paramétré. C’est très performant. Mais je ne suis pas sûr que le modèle soit d’actualité dans 20 ans, contrairement au JPEG.

La compression par IA, ce n’est pas encore pour demain en raison des contraintes. Et puis nos mathématiciens n’ont pas dit leurs derniers mots. Les mathématiques sont des outils complexes et seule une infime fraction est utilisée. 

Un mathématicien (artiste ?) génial, Hamid Naderi Yeganeh, propose de créer des images à partir d’équations. Le résultat est impressionnant. Bien loin des cœurs que l’on faisait sur les calculatrices au lycée. Voici son Twitter si vous voulez admirer son travail. Une équation pour décrire un objet, on peut difficilement mieux compresser l’information. 

Vous l’aurez compris, le domaine de la compression ne cesse d’évoluer. Et ce grâce aux mathématiques. Certes, l’IA va apporter sa pierre à l’édifice mais dans ce domaine, c’est bien le génie humain qui est le vrai moteur. 

Partager l'article !!

J’ai de la chance !!!