Lisez le contrat

L’envie de changer, de faire autre chose. On promet de prendre de bonnes habitudes, de se montrer original afin de ne pas répéter les erreurs du passé. Et l’idée revient. Comment passer à la suite lorsqu’il reste un sentiment de ‘non terminée sur un projet ? Alors je vais faire les deux. 

Je vais terminer cette application de gestion de compétitions … en utilisant les capacités des agents propulsés par l’intelligence artificielle (IA). C’est une bonne conclusion à ce chapitre avant de passer au prochain chapitre. Ainsi, pour la n-ième fois, je repars d’une page vierge ou presque. 

Je mesure l’expérience au fait que le domaine métier n’a plus de secrets pour moi. Seule son implémentation technique m’intéresse. Et afin de m’assurer que mes agents travaillent bien, le domaine technique sur lequel ils s’activent ne me fait plus peur depuis longtemps. 

L’expérience présente des situations surprenantes. La première, lorsque vous demandez à un agent de coder, c’est combien de temps il peut travailler avant d’épuiser son crédit. Un agent prépare des tâches et les réalise. Pour cela, il réagit à vos phrases … et à des consignes cachées. Oui le fameux RCT.

Pour répondre à vos désirs, un agent fait appel à un moteur d’inférence … une IA dit plus simplement. Comme une voiture, le moteur tourne souvent dans le vide. Mais il peut aussi entraîner le compresseur de l’air conditionné pour rafraîchir l’habitacle ou l’alternateur pour fournir de l’électricité ou les roues pour avancer. 

La comparaison est limitée, mais le moteur d’inférence permet à l’agent de réfléchir (thinking), de manipuler des composants externes sur votre ordinateur (tools) ou générer une réponse statistique à une question (sa fonction principale).  Si vous regardez la description d’une IA sur Ollama, vous retrouverez ces capacités supplémentaires.

Pour un agent qui va écrire une application à votre place, il faut au minimum les capacités tools et thinking. Et vous l’aurez compris, elles puisent sur le moteur. Or le moteur, il faut bien le faire tourner. Et pour cela, il faut de l’énergie. Cela me rappelle le gaz des contrats intelligents.

Ici, on parle bien de kwh, les mêmes que vous retrouvez sur vos factures EDF. Lorsque vous avez un abonnement à un fournisseur d’IA, son objectif c’est que vous ne lui coûtiez pas trop cher en énergie. Et pour cela, il va fixer des limites à vos usages. L’usage d’une IA doit être celui d’un bon père de famille (formule empruntée au FAI au début des années 2000).

Ainsi, suivant le contrat, vous pouvez générer x photos, y vidéos et z questions par jour. En pratique, les services et limites sont bien plus nombreux, mais le principe est là, lorsque vous êtes un usager classique. Pour les entreprises qui ne peuvent pas s’arrêter de travailler, le quota expiré, le mode de calcul est différent. 

Un moteur d’inférence génère des jetons (token). Il s’agit de morceaux de réponses. Suivant le modèle d’IA utilisé, ce token est plus ou moins cher à produire. Générer une image est plus complexe que générer un texte. Un moteur d’avion à un coût à l’usage plus important qu’un moteur de voiture. Mais ce n’est pas le même service.

Ainsi, les contrats professionnels se basent sur le nombre de token consommé. Il ne faudrait pas stopper un projet faute d’énergie. Ainsi, par une règle de trois, les fournisseurs d’IA transforment les kwh en argent. Et l’affaire est très rentable, d’où la ruée vers l’or pour savoir qui aura l’IA la plus utile.

Je me trompe peut être mais pour avoir contrôlé la consommation électrique de modèles locaux, j’évalue entre x10 et x100 le rapport entre le kwh payé par le fournisseur d’IA et le prix facturé. Vous me direz, il a à amortir le prix des serveurs et de la RAM sur lesquels tournent ses modèles. 

Ainsi, le simple message ‘Vous avez dépassé votre quota d’utilisation’, m’a fait prendre conscience des limites des services que j’utilise. Le sujet est bien plus complexe mais maintenant, il va falloir : 

  • que j’attende, 
  • ou que je reprenne mon projet de modèle d’inférence local pour des agents de code,
  • ou que je passe à une facturation d’entreprise. 

Tant de sujets à développer. Mais ce sera pour une prochaine fois. Il n’empêche, j’ai éclaté le quota avec tant de facilité …

Partager l'article !!

J’ai de la chance !!!