Stanford study finds AI legal research tools prone to hallucinations

Un rappel (contraire au marketing ambiant) : le RAG n’est pas la panacée. Grâce à lui un LLM fait moins d’erreurs, mais il en fait toujours. Cette étude qui teste les solutions professionnelles dans le juridique montre un taux d’erreur entre 17 et 33%. Les éditeurs rappellent à raison que le but n’est pas de remplacer les juristes, mais de les aider. Mais important de garder ce point en tête : l’IA générative n’atteint pas l’exactitude (et ce n’est pas son but).

Google’s AI summaries cause headaches and spawn memes

Un enseignement du cas Google, qui introduit l’IA dans son moteur de recherche : une IA générative (Gen AI) peut se tromper. Même s’il est facile de s’amuser des erreurs présentées, cela doit surtout nous faire réfléchir sur le fait que ces erreurs proviennent souvent de la qualité des données d’entraînement et de l’incapacité de l’IA à comprendre réellement le contenu qu’elle ingère. La Gen AI fonctionne, et fonctionnera encore probablement un temps, dans des domaines où l’erreur est permise, voire un avantage, comme dans la créativité. Mais elle n’est pas (encore) adaptée là où les résultats doivent être 100 % exacts et exhaustifs.