【案例】/ Y _$ |9 u1 s$ E0 C
拒绝白人与亚洲人同框,Meta图像生成器的「歧视」,被人挖出来了 ; h& \% m" m9 O( B/ J
AI 生成工具的偏见何时休?5 F6 n; `2 ?, K% A- R1 W E* k* D
" Y* _& k9 ~6 r% Y# o! h在人工智能构筑的世界中,AI 有时会像人一样存在着某种偏见或倾向性。比如对于大语言模型而言,由于训练数据的影响会不可避免地存在性别偏见、种族刻板印象,等等。 ' P- a% F8 k. A( z6 J$ i2 [* q
当然,这种偏见或倾向性在图像生成工具中同样存在。今年 2 月,谷歌 Gemini 被曝出拒绝在图像中描绘白人,生成大量违背基本事实(性别、种族、宗教等)的图片。 1 \) Y2 ]3 e- {8 h6 c4 M6 n' D
马斯克也被系统过分矫正了
6 \- v1 `5 I+ k2 ^0 x3 T近日,外媒 The Verge 的一篇文章指出,Meta 的 AI 图像生成器无法准确生成「亚洲男性和白人妻子」或者「亚洲女性和白人丈夫」这类图像,让人大跌眼镜。我们来看看怎么回事。
" M5 _/ [3 [; v
4 g2 {; |, b- u1 R& p2 \2 `2 xThe Verge 尝试使用了「Asian man and Caucasian friend」(亚洲男性和白人朋友)、「Asian man and white wife」(亚洲男性和白人妻子)和「Asian woman and Caucasian husband」(亚洲女性和白人丈夫)等 prompt,让 Meta 图像生成器生成对应的图像。
( e9 L9 ]4 O/ l, K8 X结果发现,Meta 图像生成器在多数情况下无法遵照 prompt 来生成图像,暴露出了它的某种偏见。
" o3 p% _% H; k图源:Mia Sato/The Verge " P( r! M' R3 b
不仅如此,调整文本 prompt 似乎也没有多大帮助。 / G5 w$ D+ g! T
当输入「Asian man and white woman smiling with a dog」(亚洲男性和白人女性带着狗微笑)时,Meta 图像生成器给出的都是「两个亚洲人」的图像。即使将「white」改为「Caucasian」时,结果同样如此。
( e" y" a7 I; U7 m! ^机器之心自测图像 % ?4 m% u/ `( u% ^. Q7 \8 k
当输入「Asian man and Caucasian woman on wedding day」(婚礼上的亚洲男性和白人女性)时,生成的依然是两个亚洲人。
7 o" L! g2 c: a# u) D婚礼上的亚洲男人和白人女人。图源:Mia Sato/The Verge
) K' e6 F6 k: P5 g: b6 L当输入「Asian man with Caucasian friend」(亚洲男性和白人朋友)或「Asian woman and white friend」(亚洲女性和白人朋友)时, 生成的大多数图像仍是两个亚洲人形象。
. c* Q2 a0 |% I" ?+ t( i4 c8 K3 N. P! [7 l/ R% w4 U' [
自测图像
# @5 s- l- C* M7 h当输入「Asian woman with Black friend」(亚洲女性和黑人朋友)时,Meta 图像生成器仍是两名亚洲女性。但当将 prompt 调整为「Asian woman with African American friend」(亚洲女性和非裔美国朋友),结果反而准确得多。
5 w" M, K) u' }# m9 a
: m1 U6 _. E" e: S* a, ]2 W, `% ^, A3 R7 M8 J
自测图像
, }8 t8 S2 f5 E' w( H此外,当指定南亚人时,Meta 图像生成器的结果变化也不太大。当输入「South Asian man with Caucasian wife」(南亚男性和白人妻子)时,大多数时候是两个印度人形象。该工具还有刻板印象,在没有要求的情况下,生成的南亚女性往往会穿戴纱丽。 4 \+ W( Z# C. f/ v- K% J: l/ r A
5 C0 i" ]" I5 Z( O0 u+ f自测图像 ! e9 D" ~0 ^" B( g* w
一番测试发现,Meta 图像生成器无法想象亚洲人与白人「同框」,这样的结果令人震惊。其中,该工具始终将亚洲女性或男性描绘为肤色浅的东亚人,尽管印度已经成为世界上人口最多的国家。在没有明确提示的情况下,该工具还会添加特定文化服饰。
+ R5 x* v* c g% o最后,机器之心使用类似的 prompt 验证了 The Verge 的结果,对于 prompt「亚洲女性和白人丈夫」,生成的 10 张图像中,只有 3 张图像准确还原。
) b; `. @2 t* [; {0 u4 K
9 \3 b j3 q, g# V7 B* Q' |- a5 A* ~# _, @
输入 prompt「asian man and caucasian wife」(亚洲男性和白人妻子),结果更离谱,生成的 8 张图像没有一张还原。 " B! T+ a, v; B, a' R" L' m! Z
9 G* R9 i: |+ i! \& s4 b! e: h; n
其实,这并不是 Meta 的图像生成工具第一次被曝出问题了。去年 10 月,Meta 的 AI 生成贴纸工具创建了大量不恰当的图片,比如童兵、持枪和拿刀的米老鼠等暴力、粗鲁、裸露形象。
, A$ M y3 R' W+ U) o. k7 }/ q图源:arstechnica and meta
6 @$ \% G! Q; M- v此次,Meta 图像生成器再次让我们警醒 AI 系统创建者、训练者以及所用数据集可能存在的偏见和刻板印象。 1 R1 c$ i/ o% D8 r+ V, s# A
对于 The Verge 发现的这一现象,有网友分析称,这是 Meta 在训练的时候没有喂给模型关于这一场景足够的示例。
) Z+ o; C* Q; S$ S, \2 Z+ N2 p: x) T2 X( S5 n- v; Y
你觉得呢?
% y. A8 g! }- I" ^$ x9 o$ L7 M* Z2 p7 V
8 _1 F9 b: r( F2 ?9 j& m
+ f. K; i5 e( V. ?: |% ^( P! w- G4 ^+ X3 U8 k0 @8 A5 |. p
1 X; Y! P9 |9 I6 z
1 I/ j0 g" s6 m5 \ |