Derniers ajouts

Anthropic’s new AI model can control your PC

Ce n’est pas le premier qui s’y essaie, nombreux sont les services pour prendre la main sur votre ordinateur. Mais la différence ici, c’est que c’est un LLM avec le peu de précisions qu’on leur connait. Il peut faire des choses beaucoup plus dangereuses qu’un chatbot enfermé dans sa petite fenêtre. Cela va faire bien sûr avancer le sujet des Agents IA, mais avec quelle prise de risque ?

Sabotage evaluations for frontier models

Beaucoup de sentiments contradictoires à la lecture de cette page d’Anthropic le créateur du modèle Claude. Ils rappellent que dans le nucléaire ou l’automobile, on ne peut pas sortir un modèle sans tester sa dangerosité. Mais c’est fait par de la régulation dans ces secteurs. Dans le monde l’IA, les fournisseurs de modèles s’arrangent comme ils veulent. Alors oui, c’est bien que Anthropic partage ses mesures de contrôle, mais est-ce vraiment à lui de le faire ? Et une semaine avant d’annoncer Claude 3.5 qui prend le contrôle de votre ordinateur pour agir dans le monde physique…

What is a “cognitive architecture”?

Sujet peut-être un peu technique : les “cognitive architecture” expliquée par LangChain. Cela reste simple et vaut le coup de bien comprendre les différents modèles, du 100% humain au 100% autonome. Aucune solution n’est meilleure qu’une autre, tout va dépendre du problème à résoudre. On visualise aussi qu’une confusion peut se créer : beaucoup de workflow sont connus et prévisibles, l’autonomie d’un agent pour décider quelle est la prochaine étape n’est pas nécessaire, un bon vieux (no)code est bien plus frugal et maîtrisable.

AI21 CEO says transformers not right for AI agents due to error perpetuation

Au moment où OpenAI pousse ses LLM (sur une technologie de Transformers) pour développer des Agents IA, on entend de plus en souvent la petite musique : trop d’erreurs, pas de mémoire, le perroquet stochastique ne pourra pas prendre des décisions fiables. Il faudrait attendre la fin de l’ère des LLM pour passer à la phase des Agents ? Il va falloir changer un peu le vocabulaire du marketing ambiant… Et refaire atterrir les entreprises qui croyaient à la baguette magique pour leurs opérations.

U.S. Federal Trade Commission launches Operation AI Comply to tackle deceptive business practices

Aux Etats-Unis, l’équivalent de l’Autorité de la Concurrence et de la DGCCRF en France attaque des sociétés soupçonnées de survendre les bienfaits de l’IA. C’est bien. Mais pourquoi pas Microsoft, OpenAI ou Google quand ils truquent (un peu, parfois beaucoup) les démos pour les entreprises ? Ou quand à longueur d’événements ils dressent une situation de l’IA où tout marche à la perfection ? Car rares sont les journées on l’on ne rencontre pas un dirigeant témoignant d’un POC super existant, suivi de plusieurs mois de galère, voire l’abandon pur et simple. Et vous, qu’en pensez-vous ?

STATE OF AI REPORT 2024

Pour celles et ceux qui auraient passé l’année 2024 sur une autre planète ou jamais suivi les évolutions de l’IA, ce rapport (220 slides tout de même) n’oublie pas grand-chose. Pour les autres qui sont à jour, ils n’apprendront rien, mais ce genre de ressource est toujours utile. Même si cela consomme un temps non négligeable, comment comprendre ou anticiper ce qui va se passer sans faire cet effort de veille ?