Anthropic’s new AI model can control your PC

Ce n’est pas le premier qui s’y essaie, nombreux sont les services pour prendre la main sur votre ordinateur. Mais la différence ici, c’est que c’est un LLM avec le peu de précisions qu’on leur connait. Il peut faire des choses beaucoup plus dangereuses qu’un chatbot enfermé dans sa petite fenêtre. Cela va faire bien sûr avancer le sujet des Agents IA, mais avec quelle prise de risque ?

What is a “cognitive architecture”?

Sujet peut-être un peu technique : les “cognitive architecture” expliquée par LangChain. Cela reste simple et vaut le coup de bien comprendre les différents modèles, du 100% humain au 100% autonome. Aucune solution n’est meilleure qu’une autre, tout va dépendre du problème à résoudre. On visualise aussi qu’une confusion peut se créer : beaucoup de workflow sont connus et prévisibles, l’autonomie d’un agent pour décider quelle est la prochaine étape n’est pas nécessaire, un bon vieux (no)code est bien plus frugal et maîtrisable.

AI21 CEO says transformers not right for AI agents due to error perpetuation

Au moment où OpenAI pousse ses LLM (sur une technologie de Transformers) pour développer des Agents IA, on entend de plus en souvent la petite musique : trop d’erreurs, pas de mémoire, le perroquet stochastique ne pourra pas prendre des décisions fiables. Il faudrait attendre la fin de l’ère des LLM pour passer à la phase des Agents ? Il va falloir changer un peu le vocabulaire du marketing ambiant… Et refaire atterrir les entreprises qui croyaient à la baguette magique pour leurs opérations.

STATE OF AI REPORT 2024

Pour celles et ceux qui auraient passé l’année 2024 sur une autre planète ou jamais suivi les évolutions de l’IA, ce rapport (220 slides tout de même) n’oublie pas grand-chose. Pour les autres qui sont à jour, ils n’apprendront rien, mais ce genre de ressource est toujours utile. Même si cela consomme un temps non négligeable, comment comprendre ou anticiper ce qui va se passer sans faire cet effort de veille ?

Agent database by Agency : 400 Agents

Agency répertorie 400 services ou technologies pour créer des Agents. Comme dit précédemment, on n’y est pas encore, mais ça montre que beaucoup sont dessus. Notamment en open source. Cette liste sera probablement mise à jour, à suivre donc.

AI Agents: A New Architecture for Enterprise Automation

On s’approche d’une définition de plus en précise de “comment ça marche” les Agents. Quatre modèles d’architectures différents. Cela aide à vraiment comprendre la différence sans besoin d’entrer dans trop de détails techniques. Une référence à garder et regarder

AI researchers discover “Law of the Weakest Link” in language models

Toujours utile de se référer aux travaux de recherche pour évaluer la situation actuelle en termes de qualité. Celle-ci a créé un benchmark pour mesure dans les LLM le “maillon faible” particulièrement dans les tâches nécessitant plus d’une compétence. Pour démontrer la distance qu’il nous reste à parcourir avant les Agents.

Nouvelles fonctionnalités IA chez Make. Soyez prêt pour “Human in the Loop” !

C’est tellement simple que c’en est génial : en ajoutant du “Human in the Loop”, Make résout une des raisons pour lesquelles les Agents ne sont pas activables. Le niveau de qualité n’étant pas là, ils sont vite bloqués. En ajoutant une validation humaine simple, cela peut débloquer le scénario qui devient “viable” tout en limitant les risques de problème.

Beyond Bots: How AI Agents Are Driving the Next Wave of Enterprise Automation

Une plongée dans l’univers encore incertain des Agents. Menlo Venture tente une cartographie des start-ups du secteur, mais on remarque que certaines sont encore à la périphérie du sujet. Au moment où les avancées tech, notamment o1 va bouleverser les cartes. Un sujet à suivre, c’est le stade de l’automation que personne n’avait réussi à exécuter avec succès même avec toute la stack no-code.

Convergence AI played with agents ‘for years’ until raising $12M to give them long-term memory

Une nouvelle expression pour faire le tri dans les “Agents” : les Proxy Agents propulsés par des LMLM (Large Meta Learning Models) vs les Narrow agent ou copilotes avec des LLM (ce qu’on voit le plus aujourd’hui). La stratégie est intéressante : commencer par le grand public pour entraîner les agents et attaquer les entreprises ensuite. Comme ce qu’a fait OpenAI avec chatGPT ? Smart…