Les performances des IA génératives sont-elles gonflées artificiellement ?
Les tests de performance LLM sont truffés de biais et utilisés par les fournisseurs de LLM. À garder en tête quand on doit faire le choix pour son entreprise. Un benchmark sur ses propres cas d’usages semble être malheureusement la seule solution.