AI生图审核惹争议：米老鼠抽烟-大话地产

清雅小居 发表于 2024-9-4 10:41

AI生图审核惹争议：米老鼠抽烟

据《华尔街日报》9月2日报道，近期一些带有戏谑意味、政治误导性的AI图像在社交媒体平台X上流传，例如“特朗普与哈里斯缠绵”、“奥巴马吸食可卡因”、“米奇拿枪”等，画面内容令用户感到迷惑和不适。
这些AI图像由Grok-2、Gemini等AI大模型生成。Grok-2由马斯克创办的美国AI大模型独角兽xAI研发，Gemini来自美国科技巨头谷歌。
近期，谷歌一直在完善其AI图像生成内容的审核机制，以尽可能避免AI输出带有偏见、歧义、错误、种族主义、违背历史事实等方面的内容。
针对类似的问题，此前美国AI大模型独角兽OpenAI，已禁止利用AI生成指向性明确的人物形象，来加强AI图像生成内容审核力度。
一、xAI新一代大模型Grok-2，默许政治人物被恶搞
打开社交媒体平台X（原Twitter），你可能会看到这些“雷人”画面：米老鼠喝啤酒，海绵宝宝穿纳粹制服，美国前总统唐纳德·特朗普（Donald Trump）与美国副总统卡玛拉·哈里斯（Kamala Harris）接吻。
这些令人费解、不适的图像，都是用xAI和谷歌的生成式AI新模型或软件生成的。

▲利用AI技术生成的图像，特朗普“公主抱”哈里斯，人物肖像清晰（图源：《华尔街日报》）

8月14日，xAI推出下一代大语言模型Grok-2。模型发布后的几天内，X平台涌入了大量据说是用Grok-2生成的图像。在这些画面中，“死对头”特朗普与哈里斯动作亲密，童话世界里的米奇却拿枪、抽烟。这些利用生成式AI技术制作的图像，不仅损害了政治人物形象，还令有版权的角色做出一些带有冒犯意味的动作。“迪士尼如果看到，可能也笑不出来。”
Grok-2大语言模型由德国AI图像和视频生成创企Black Forest Labs提供支持，目前仅向X平台的付费订阅用户开放。
根据X平台的政策，用户禁止分享可能混淆或误导事实、人为刻意伪造的，以及最终导致人身或财产伤害的内容。Grok-2发布当天的晚些时候，虽然部分违规的AI图像已无法在X平台上检索出来，但用户仍可以使用Grok-2生成充斥“恶趣味”的新作品。
然而，X平台的实控人马斯克，似乎并不介意这种恶搞政治的行为。今年7月，他转发了一段深度伪造哈里斯的虚假视频，视频中哈里斯自称为“最终的多元化雇员”。
有内容审核方面的专家称，类似的生成式AI工具可能会在美国大选周期中，生成一些虚假信息，甚至扩散到社会面。

8月19日，2024美国民主党全国代表大会开幕的前一天，特朗普发布了一张疑似用AI生成的图像。当时，由于美国现任总统拜登已放弃连任，经过党内投票后，这幅AI图像的主角哈里斯已提前锁定民主党总统候选人提名。
而图像中描绘了“哈里斯在芝加哥发表演讲”的现场情况，其背景中有一面镰刀和锤子图案的红旗，似乎在暗示哈里斯是共产主义者，从而引发政治争议。
二、谷歌Gemini大模型屡屡翻车，涉敏感元素就黑白不分
谷歌的Gemini聊天机器人，由其同名大语言模型Gemini支持。
在今年2月推出新版Gemini聊天机器人之前，谷歌曾调试Gemini模型，使其遇到涉及生成人物的指令时，能反馈更多样化、属性更模糊的人物形象。
例如，之前在生成医生图像时，AI通常更倾向于给出白人男性的形象。谷歌希望能通过“多样化”的方式，来减少AI图像生成模型的“偏见”。
但不到一个月，Gemini模型就捅了大篓子。该模型在生成“具有种族多样性”的图像时，出现错误匹配宗教、种族、性别等情况，以至于得到多张不符合历史事实的人物图像。受到大量网友的抨击后，谷歌决定暂停Gemini模型的图像生成功能，为AI图像生成的潜在风险踩下“急刹车”。
谷歌副总裁兼Gemini聊天机器人负责人Sissie Hsiao，在近期的一次采访中，称确保AI模型听从用户指令，是谷歌坚持的原则。“这是用户的Gemini，我们是为用户服务的。”
尽管如此，使用Gemini聊天机器人生成的部分图像，仍存在违背历史事实的情况。不少X平台的用户截图质疑谷歌模型的内容审核能力。
对于Gemini模型输出带有冒犯意味的、种族偏见的内容，谷歌CEO Sundar Pichai回应称，“这是不可接受的”，该公司将“全面解决这一问题”。
不过，谷歌最近因利用AI技术生成的画面内容不严谨，再次激怒了用户。
8月中旬，谷歌最新一代智能手机Pixel 9系列上市。Pixel 9系列引入了一个名为“Reimagine”的AI照片编辑工具，因此用户可以通过输入文本提示，来调用AI修改照片中的内容。
但有用户发现，Reimagine允许用户添加一些违规元素，比如为海绵宝宝“佩戴”纳粹标志。这一内容安全漏洞引起用户的反感。
一位谷歌发言人称，该公司正在“不断加强和完善AI模型现有的安全防护措施”。
谷歌今年8月底曾透露，其AI聊天机器人Gemini将重新上线人物图像生成功能，该功能初期仅面向付费订阅的英语用户开放。同时，谷歌已在AI图像生成审核方面取得“重大进展”，不过Gemini生成的图像也“不可能每一张都准确无误”。

页: [1]

洛阳信息港's Archiver

AI生图审核惹争议：米老鼠抽烟