Derniers ajouts

LLMs Can Easily Learn to Reason from Demonstrations Structure, not content, is what matters!

Un papier de recherche un peu ardu qui éclaire un aspect intéressant des modèles de raisonnement (o1, Deepseek) : en générant des longs Chain of Thought par un autre LLM comme donnée d’entraînement, les capacités de raisonnement s’améliorent grandement. Cela semble rester un mystère même pour ces chercheurs… Un peu comme quand les Transformers créés pour de la traduction se sont mis à être capable de répondre à des questions pour amener à ChatGPT…

The Impact of Generative AI on Critical Thinking

Avec ChatGPT, les “knowledge workers” gagnent du temps sur la recherche d’information ou une première rédaction qu’ils doivent réinvestir dans la vérification. Avec un gros biais : moins on connait le fonctionnement de la GenAI, plus on fait confiance… La conclusion de l’étude : former ses collaborateurs est clé pour qu’ils gardent leur esprit critique, car la GenAI produit le plus souvent des contenus questionnables. Et c’est Microsoft qui finance l’étude !

How I Built an Entire App with AI in One Weekend

Le témoignage d’une application fabriquée en 48h. On pense moins à la 1 person 1 billion company qu’à l’impact que cela aura dans les entreprises. Cela redonne de la puissance au Lean, son takt et ses MVP : pour tuer la concurrence, il faut aller plus vite et plus léger. La méthode Agile est définitivement remisée au placard. Au premier meeting pour parler de l’approche avec vos équipes, votre concurrent aura déjà fait une centaine d’itérations. Cela redonne aussi le pouvoir aux équipes où l’IA favorise le bottom-up : l’innovation va enfin venir du terrain.

Modern-Day Oracles or Bullshit Machines?

Excellent cours fait par deux profs de l’Université de Washington pour comprendre l’implication de l’usage des LLM. Très loin des discours marketing ambiants, tout en étant très équilibré. Ils reviennent à l’expression bien meilleure que “hallucinations” : “bullshit”. Un LLM est conçu pour vous faire croire qu’il a raison (même avec de faux arguments), mais cela reste la prédiction du prochain mot. Un menteur sait qu’il n’a pas raison, un bullshitter ne connaît pas la vérité et s’en moque. Rassurons-nous (ou pas), les humains restent encore les rois dans ce domaine…

The Anthropic Economic Index

Encore une excellente initiative d’Anthropic : plutôt que de sonder les personnes sur leurs tâches avec l’IA, ils ont interrogé leurs données d’usage (anonymisées) à partir d’une classification de 20 000 tâches du Ministère de Travail américain. Ce qui est intéressant, c’est de voir le décalage avec le monde du travail réel. Ils vont reconduire l’étude périodiquement. À suivre ! Les évolutions seront plus intéressantes que les chiffres en eux-mêmes.

AI Agents Are Here. What Now?

Encore une clarification (bienvenue) de HuggingFace sur les agents et surtout les agents autonomes (agentic). Probablement la version la plus détaillée trouvée à date pour lister les différents agents, les bénéfices/risques et des recommandations fortez sur les règles notamment éthiques à respecter.

What Companies Succeeding with AI Do Differently

Date un peu, mais intéressant de voir les différences entre 2021 et 2023 de l’implémentation de projets IA en entreprise. Les principales différences : le soutien des CEO, le travail avec des partenaires extérieurs, une implication hors des silos et un focus sur la data. Une bonne feuille de route à réutiliser.

Workday to cut 1,750 jobs in AI push

Ce qui est intéressant dans cet exemple de la société Workday aux États-Unis, c’est que la réduction des équipes se fait dans un contexte tendu. C’est un arbitrage souvent fait dans les entreprises : trouver des ressources pour investir dans une technologie d’avenir (ici l’IA). Cet exemple va encore venir alimenter les peurs sur l’impact de l’IA sur les emplois. Le sujet est sérieux et préoccupant, mais en l’occurrence ici, c’est la situation économique de l’entreprise qui est le déclencheur. Et le mot IA lancé plus pour rassurer les marchés ?

The Future of Jobs Report 2025

Le Future of Jobs Reports 2025 par le World Economic Forum, 290 pages annexes comprises. Vous avez ici les 15 principaux slides pour comprendre les enjeux autour de l’IA et son impact sur les emplois et les organisations dans le monde en 2030.

Deloitte: 74% of enterprises have already met or exceeded gen AI initiatives (but challenges remain)

Dernière version de “State of Generative AI Q4”. On y retrouve la confirmation que les cas en production sont essentiellement dans les équipes tech et un peu dans le support. Que le vrai sujet, c’est maintenant les Agents IA dans le quotidien. Mais que là, il faut faire pause et réfléchir (comme o1 vs 4o…) : on ne change pas tous les process d’une entreprise par POC, il faut une vue d’ensemble et embarquer les équipes.