Perplexity and PayPal Team Up for AI Shopping: What It Means for You

Après Visa et Mastercard, c’est maintenant PayPal qui permet le paiement par un agent IA. Cela ouvre un nouveau monde où ce ne seront plus des humains qui iront sur les sites de shopping, mais des Agents IA. A quoi serviront les belles images de produits ? A mieux décrire le produit grâce à la Computer Vision ? Ou faudra-t-il encore les charger en méta-données…

IAcademie #6 – RAG, Agentic RAG &protocoles (MCP & A2A)

Pour celles et ceux, non tech qui voudraient avoir une explication très didactique sur comment fonctionne un RAG et les protocoles MCP et A2A, c’est une très bonne vidéo à regarder. Ces sujets évoluent tellement qu’il est souvent utile de revenir aux basiques et oser reconnaître qu’on ne comprend pas tout à fait comment ça marche.

These autistic people struggled to make sense of others. Then they found AI.

J’entends souvent dire dans les équipes en entreprise que l’IA ne peut pas interagir avec des humains. Oui bien sûr, elle n’a aucune intelligence émotionnelle ni compréhension de la situation. Mais est-ce toujours nécessaire ? Regardons du côté des autistes. Même si l’outil n’est pas parfait, un service développé sur ChatGPT par un autiste explique la différence de perception dans une situation décrite par l’utilisateur autiste, et l’aide à gérer la relation. L’IA ne se fatigue jamais, ne s’énerve pas, reste factuelle et sait simuler l’empathie. À garder en tête pour les sujets d’interaction avec les clients.

Meta aurait triché avec sa nouvelle intelligence artificielle Llama 4

Meta aurait benchmarké un autre modèle sur la LMArena que celui livré. Ce ne seraient pas les premiers, ni les derniers à optimiser leur modèle pour bien se positionner dans un benchmark qui reste imparfait. Cela a le mérite de mettre un peu de pression sur les fournisseurs de modèles et pour nous autres entreprises, de nous rappeler ne pas prendre ces benchmarks comme un fait, mais plutôt comme une hypothèse (à vérifier donc). En périphérie, on observe que le débat sur l’AGI sonne vraiment creux si on n’est même pas capables de se mettre d’accord sur la performance des modèles actuels.

Meta Neuroscientist King: “Some of the concepts like reasoning may need to be re-evaluated”

Un chercheur en neuroscience chez Meta partage une idée déjà exprimée ailleurs : la course au plus gros LLM n’améliorera probablement pas les performances, notamment sur la partie raisonnement (le hype du moment). Il faudra sûrement une rupture technologique comme les Transformers en 2017. Vu le nombre de sociétés qui travaillent à une approche différente des LLM (notamment Deepmind) cela pourrait arriver rapidement. Avant ça, testons, mais restons prudents sur les capacités en conditions réelles en entreprises des agents autonomes…

Slopsquatting: One in five AI code snippets contains fake libraries

Au moment où toute la communauté de développeur se tourne vers la génération de code par l’IA, cette étude rappelle la nécessité de tout vérifier. 20% des “Packages” ajoutés dans le code n’existent pas. Cela donne une idée de la précision actuelle et reste cohérent avec le niveau d’hallucination constaté sur les cas précis. C’est aussi une brèche pour les hackers qui peuvent créer ces packages dont les noms reviennent souvent pour y mettre du code malicieux.

How People Are Really Using Gen AI in 2025

Une fois n’est pas coutume : intéressant de regarder l’évolution de l’IA du côté du grand public pour anticiper les usages dans l’entreprise. Toujours plus long à venir. On y découvre que l’accompagnement psychologique qui était déjà en deuxième place passe en premier en 2025. En entreprise, ça commence, mais on reste coincé dans la perception qu’une machine est moins bonne qu’un humain. Or à un niveau limité et contrôlé, c’est l’inverse. Y penser dans une réflexion sur le support client par exemple…

12 Graphs That Explain the State of AI in 2025

Le 2025 AI Index de Stanford University est une somme de 500 pages où vous trouverez les principaux thèmes abordés dans cette veille. Vous aurez les meilleurs passages ici. Une chose que j’avais loupée : le Humanity Last Exam qui mesure la capacité de raisonnement humain. o1 le meilleur arrive à 8% de pertinence. En revanche, avec le Planbench qui mesure la disposition à résoudre des problèmes de planification, o1 arrive à 98%. On est donc loin de l’AGI, mais très proche des capacités de raisonnement nécessaire à la plupart des entreprises.

Large Language Models Pass the Turing Test

C’est un symbole plus qu’une réalité, mais il faut noter que les IA réussissent maintenant le test de Turing. Datant de 1950, on reconnait le génie du bonhomme, mais pas forcément sa pertinence aujourd’hui. À comparer à toutes les autres études récentes qui rejettent la notion d’intelligence dans l’IA beaucoup plus pertinente.

The AI Agent Index

Le MIT a fait l’effort de comptabiliser les 67 vrais “Agents” avec une définition précise. Intéressant de voir leur définition, l’historique et les pays d’origine. Pas de surprise, tout se passe aux US, mais attention, c’est la rupture la plus importante après l’ère du ChatGPT pour les entreprises.