Les grands défis de l’IA générative
rapport très complet qui aborde notamment les biais dans les données d’entraînement et l’impact environnemental de la GenAI
Une IA Ethique pour transformer votre business
rapport très complet qui aborde notamment les biais dans les données d’entraînement et l’impact environnemental de la GenAI
Article à charge du New York Times mais on y apprend plein de choses sur le manque de data pour entraîner les modèles et les solutions imaginées par les fabricants de LLM…
Ah ben mince, avec les nouveaux modèles avec une fenêtre de contexte bien plus importante (notamment Gemini 1.5) qui permet de faire plus de choses sans passer par du RAG, on augmente le risque de hack !
En utilisant créant une image avec des caractères ASCII le LLM répond à la question “How to make a Bomb”
Les LLM entrainés sur des données copyrighté reproduisent ces contenus : il ne s’agit pas de juste utiliser un contenu pour construire un “raisonnement”
Les droits de propriété intellectuelle sur les données d’entrainement va devenir de plus en plus un problème pour les constructeurs de LLM.
L’article ne mentionne pas directement le cas des contenus médias utilisés pour entrainer les modèles, mais ça doit très certainement englober ce sujet