Les générateurs d’images par l’IA cachent une terrible faille, les explications

DALL-E,(IA) Stable Diffusion et Midjourney sont des créateurs d'images impressionnants. Cependant, des chercheurs de l'Institut indien des sciences à Bangalore ont découvert un problème dans une étude récente.

© beincrypto

En premier lieu, il est essentiel de comprendre que les outils de génération d’images basés sur l’IA ont une tendance forte à projeter une vision du monde très occidentale, principalement américaine. Ceci se reflète par exemple dans le fait que lorsqu’on demande à ces IA de dessiner une maison, elles produisent généralement une image typique d’une maison américaine.

Par ailleurs, des scientifiques ont mené une expérience intéressante. Ils ont demandé à ces technologies d’IA de créer des images à partir de mots tels que drapeaux, mariages et villes. Ensuite, ils ont interrogé les participants sur leurs ressentis à propos de ces images. À l’exception des participants résidant aux États-Unis, la majorité a estimé que ces créations ne reflétaient pas leur vie quotidienne.

L’IA et la diversité des modèles

Un des auteurs de cette étude, cité par Fast Company, a exprimé sa surprise face à l’absence quasi totale de diversité dans les représentations des modèles de l’IA. Toutefois, l’IA montre un peu plus de perspicacité lorsqu’on lui demande de représenter un objet spécifique provenant d’un pays en particulier. Par exemple, l’IA est capable de représenter une maison indienne ou allemande de manière plus fidèle.

Cependant, il y a encore beaucoup à faire pour obtenir des résultats plus personnalisés et moins centrés sur l’Amérique. « Ces technologies sont présentées comme des changements majeurs. Elles sont présentées comme des outils de créativité, et une grande partie de l’activité économique est censée être libérée. Mais si un artiste indien a beaucoup plus de mal à utiliser ces outils, je pense que c’est un grave problème », explique le chercheur Danish Pruthi à nos confrères.

En conclusion, une des principales raisons de cette problématique est la base de données avec laquelle ces modèles d’IA ont été entraînés. Ils utilisent souvent ImageNet, une collection très riche, mais critiquée pour son manque de diversité. Il est donc essentiel de veiller à ce que les sources de données utilisées pour l’entraînement de l’IA soient plus diversifiées à l’avenir.

Il est important de rappeler que ces générateurs d’images basés sur l’IA ont commencé à se démocratiser au cours de l’été 2022. Grâce à une simple entrée de texte, ces outils peuvent exprimer visuellement une idée. Bien sûr, ces outils sont impressionnants, mais ils restent sujets à des erreurs.

Étiquettes