Extracting Concepts from GPT-4
Ca commence par “We currently don’t understand how to make sense of the neural activity within language models”. Tout comme le récent “Golden Gate Claude” d’Anthropic et la recherche correspondante, les entreprises d’IA travaillent toujours pour comprendre ce qui se passe réellement sous le capot. Déchiffrer la boîte noire de l’IA serait un grand pas vers une meilleure sécurité, un meilleur ajustement et une meilleure contrôlabilité des modèles en rapide évolution. Mais bon, c’est quand même assez dingue d’observer ça…