清雅小居 发表于 2024-9-4 10:41

AI生图审核惹争议:米老鼠抽烟

据《华尔街日报》9月2日报道,近期一些带有戏谑意味、政治误导性的AI图像在社交媒体平台X上流传,例如“特朗普与哈里斯缠绵”、“奥巴马吸食可卡因”、“米奇拿枪”等,画面内容令用户感到迷惑和不适。
这些AI图像由Grok-2、Gemini等AI大模型生成。Grok-2由马斯克创办的美国AI大模型独角兽xAI研发,Gemini来自美国科技巨头谷歌。
近期,谷歌一直在完善其AI图像生成内容的审核机制,以尽可能避免AI输出带有偏见、歧义、错误、种族主义、违背历史事实等方面的内容。
针对类似的问题,此前美国AI大模型独角兽OpenAI,已禁止利用AI生成指向性明确的人物形象,来加强AI图像生成内容审核力度。
一、xAI新一代大模型Grok-2,默许政治人物被恶搞
打开社交媒体平台X(原Twitter),你可能会看到这些“雷人”画面:米老鼠喝啤酒,海绵宝宝穿纳粹制服,美国前总统唐纳德·特朗普(Donald Trump)与美国副总统卡玛拉·哈里斯(Kamala Harris)接吻。
这些令人费解、不适的图像,都是用xAI和谷歌的生成式AI新模型或软件生成的。

▲利用AI技术生成的图像,特朗普“公主抱”哈里斯,人物肖像清晰(图源:《华尔街日报》)

8月14日,xAI推出下一代大语言模型Grok-2。模型发布后的几天内,X平台涌入了大量据说是用Grok-2生成的图像。在这些画面中,“死对头”特朗普与哈里斯动作亲密,童话世界里的米奇却拿枪、抽烟。这些利用生成式AI技术制作的图像,不仅损害了政治人物形象,还令有版权的角色做出一些带有冒犯意味的动作。“迪士尼如果看到,可能也笑不出来。”
Grok-2大语言模型由德国AI图像和视频生成创企Black Forest Labs提供支持,目前仅向X平台的付费订阅用户开放。
根据X平台的政策,用户禁止分享可能混淆或误导事实、人为刻意伪造的,以及最终导致人身或财产伤害的内容。Grok-2发布当天的晚些时候,虽然部分违规的AI图像已无法在X平台上检索出来,但用户仍可以使用Grok-2生成充斥“恶趣味”的新作品。
然而,X平台的实控人马斯克,似乎并不介意这种恶搞政治的行为。今年7月,他转发了一段深度伪造哈里斯的虚假视频,视频中哈里斯自称为“最终的多元化雇员”。
有内容审核方面的专家称,类似的生成式AI工具可能会在美国大选周期中,生成一些虚假信息,甚至扩散到社会面。


8月19日,2024美国民主党全国代表大会开幕的前一天,特朗普发布了一张疑似用AI生成的图像。当时,由于美国现任总统拜登已放弃连任,经过党内投票后,这幅AI图像的主角哈里斯已提前锁定民主党总统候选人提名。
而图像中描绘了“哈里斯在芝加哥发表演讲”的现场情况,其背景中有一面镰刀和锤子图案的红旗,似乎在暗示哈里斯是共产主义者,从而引发政治争议。
二、谷歌Gemini大模型屡屡翻车,涉敏感元素就黑白不分
谷歌的Gemini聊天机器人,由其同名大语言模型Gemini支持。
在今年2月推出新版Gemini聊天机器人之前,谷歌曾调试Gemini模型,使其遇到涉及生成人物的指令时,能反馈更多样化、属性更模糊的人物形象。
例如,之前在生成医生图像时,AI通常更倾向于给出白人男性的形象。谷歌希望能通过“多样化”的方式,来减少AI图像生成模型的“偏见”。
但不到一个月,Gemini模型就捅了大篓子。该模型在生成“具有种族多样性”的图像时,出现错误匹配宗教、种族、性别等情况,以至于得到多张不符合历史事实的人物图像。受到大量网友的抨击后,谷歌决定暂停Gemini模型的图像生成功能,为AI图像生成的潜在风险踩下“急刹车”。
谷歌副总裁兼Gemini聊天机器人负责人Sissie Hsiao,在近期的一次采访中,称确保AI模型听从用户指令,是谷歌坚持的原则。“这是用户的Gemini,我们是为用户服务的。”
尽管如此,使用Gemini聊天机器人生成的部分图像,仍存在违背历史事实的情况。不少X平台的用户截图质疑谷歌模型的内容审核能力。
对于Gemini模型输出带有冒犯意味的、种族偏见的内容,谷歌CEO Sundar Pichai回应称,“这是不可接受的”,该公司将“全面解决这一问题”。
不过,谷歌最近因利用AI技术生成的画面内容不严谨,再次激怒了用户。
8月中旬,谷歌最新一代智能手机Pixel 9系列上市。Pixel 9系列引入了一个名为“Reimagine”的AI照片编辑工具,因此用户可以通过输入文本提示,来调用AI修改照片中的内容。
但有用户发现,Reimagine允许用户添加一些违规元素,比如为海绵宝宝“佩戴”纳粹标志。这一内容安全漏洞引起用户的反感。
一位谷歌发言人称,该公司正在“不断加强和完善AI模型现有的安全防护措施”。
谷歌今年8月底曾透露,其AI聊天机器人Gemini将重新上线人物图像生成功能,该功能初期仅面向付费订阅的英语用户开放。同时,谷歌已在AI图像生成审核方面取得“重大进展”,不过Gemini生成的图像也“不可能每一张都准确无误”。

页: [1]
查看完整版本: AI生图审核惹争议:米老鼠抽烟