Derniers ajouts

Human drivers are to blame for most serious Waymo collisions

Dans le débat sur l’IA dangereuse (elle peut l’être très clairement), on l’oppose souvent aux humains qui seraient meilleurs, plus sécurisants. Pas tout le temps ! Pour les voitures autonomes, ces chiffres des robots taxi Waymo (100 000 courses par semaines à San Francisco) montrent que la voiture robot fait moins d’accidents et que quand elle en fait, des humains en sont à l’origine ! Pas une raison pour faire une confiance aveugle à la techno, mais il est toujours bon de relativiser…

AI researchers discover “Law of the Weakest Link” in language models

Toujours utile de se référer aux travaux de recherche pour évaluer la situation actuelle en termes de qualité. Celle-ci a créé un benchmark pour mesure dans les LLM le “maillon faible” particulièrement dans les tâches nécessitant plus d’une compétence. Pour démontrer la distance qu’il nous reste à parcourir avant les Agents.

Nouvelles fonctionnalités IA chez Make. Soyez prêt pour “Human in the Loop” !

C’est tellement simple que c’en est génial : en ajoutant du “Human in the Loop”, Make résout une des raisons pour lesquelles les Agents ne sont pas activables. Le niveau de qualité n’étant pas là, ils sont vite bloqués. En ajoutant une validation humaine simple, cela peut débloquer le scénario qui devient “viable” tout en limitant les risques de problème.

Nuclear power’s AI renaissance

Qui aurait imaginé que l’IA allait relancer le nucléaire aux États-Unis ? C’est le seul moyen qu’ils entrevoient pour fournir la demande électrique prévue pour les data-center et l’IA. Pour ceux qui comparaient l’IA à l’arrivée du Web ou du mobile, on est à une magnitude bien supérieure. Les impacts ne sont pas seulement technologiques : notre planète est déjà factuellement impactée.

Beyond Bots: How AI Agents Are Driving the Next Wave of Enterprise Automation

Une plongée dans l’univers encore incertain des Agents. Menlo Venture tente une cartographie des start-ups du secteur, mais on remarque que certaines sont encore à la périphérie du sujet. Au moment où les avancées tech, notamment o1 va bouleverser les cartes. Un sujet à suivre, c’est le stade de l’automation que personne n’avait réussi à exécuter avec succès même avec toute la stack no-code.

Convergence AI played with agents ‘for years’ until raising $12M to give them long-term memory

Une nouvelle expression pour faire le tri dans les “Agents” : les Proxy Agents propulsés par des LMLM (Large Meta Learning Models) vs les Narrow agent ou copilotes avec des LLM (ce qu’on voit le plus aujourd’hui). La stratégie est intéressante : commencer par le grand public pour entraîner les agents et attaquer les entreprises ensuite. Comme ce qu’a fait OpenAI avec chatGPT ? Smart…

185 real-world gen AI use cases from the world’s leading organizations

A la conférence Gemini at Work, Google liste 185 cas d’usages parmi ses clients. Attention marketing. Mais très intéressant de scanner la liste : pour la grande majorité, on reste sur de la GenAI chatbot et bureautique en mode copilote. Aucun Agents autonomes au sens strict, rien de surprenant, bien que ce soit dans tous les titres des catégories. Je liste les plus intéressants/surprenants.

Sam Altman catapults past founder mode into ‘god mode’ with latest AI post

Chacun à sa place, le boss de OpenAI valorisé maintenant 150 milliards de dollars peint un avenir en rose qui va encore plus faire paniquer les sceptiques. Aucun n’ayant raison, Techcrunch reprend chaque point et le qualifie de “Believable” ou “Hype”. Cela donne un bon équilibre sur ces débats futuristes où en fait, personne ne sait. Une chose est souvent sûre, ça ne se passe jamais comme on le pensait.

Copilot Wave 2 supercharges productivity with AI across all your Microsoft 365 apps

C’est finalement le moyen le plus simple de commencer avec l’IA en utilisant ce qu’il y a sur étagère. Et là Microsoft, qui n’a jamais fait les meilleurs produits et souvent copié les meilleurs, a un avantage certain : son parc d’installation. Dans la vague 2 qui se lance, on trouve de nouvelles briques intéressantes. À tester, et en toute sécurité, à la différence parfois des services existants et plus “fancy”. Un compromis simplicité-sécurité sur performance-coût qui peut être très pertinent au début.