发布时间:2025-04-05 01:38:00 来源:新闻头条网 作者:千寻
现如今,OpenAI、Midjourney、Stability AI等人工智能开发商,不经原创者同意就从互联网上抓取成百上千图像来训练他们的生成模型,早已是半公开的秘密。今年1月份,英国上议院通讯与数字特别委员会提交的一份文件中,OpenAI干脆直接摊牌,承认像GPT-4这样的大模型,是无法在不使用受版权保护材料的情况下存在的。理由很简单:“当今的版权涵盖了几乎所有形式的人类表达,包括博客文章、照片、论坛帖子、软件代码片段和政府文件。因此,如果不使用受版权保护的材料,就不可能训练出当今领先的AI模型。”最近,这场AI版权大战中最大的受害者出现了→几天前,《大西洋月刊》的编辑Alex Reisner在一篇综合性文章中,揭示了他获得的研究论文和一个数据集,证明了许多AI系统都是基于电视和电影编剧的作品进行训练的。这一数据集包含超过53,000部电影和超过85,000集电视剧,包括但不限于从1950年到2016年所有获得最佳影片提名的电影,以及一些非常受欢迎的电视剧集,如《绝命毒师》、《火线》和《黑道家族》全集、600多集《辛普森一家》、170集《宋飞正传》以及45集《双峰》;甚至包括一些颁奖典礼上的预写对话。数据集中的文件,是从一个名为OpenSubtitles.org的网站提取的字幕,这个网站目前拥有超过900万份不同语言和方言的字幕文件。这些字幕被苹果、Anthropic、Meta、NVIDIA、Salesforce、彭博社等多家公司用来训练他们的大型语言模型(LLM)。早前就有研究表明,某些大语言模型能够“记住”训练数据的部分内容,并在生成文本时几乎逐字复制这些内容。好家伙,这不就是妥妥的拿来主义,这哪里算是抄袭了,明明就一整个是文字的搬运工啊…那么问题来了,生成式AI“顺手牵羊”艺术家们作品时那么不客气,到了影视剧集这里,真的就只对字幕下手了么?当然不是,在此之前已经有视效艺术家用Midjourney 做过实验了,结果显示即使在没有被直接要求生成抄袭性输出的前提下,只要你的提示词够“恰当”(例如与电影相关的简短提示),它们生成的图像就会与现有的版权作品无限接近。接近到什么程度?能构成版权侵权的程度。口说无凭,咱们直接上图上真相吧。左边:原版;右边:Midjourney V6。可以看到,右侧使用Midjourney V6的“alpha”版本生成的图像,与左边知名电影和视频游戏中的镜头,不能说一模一样,也是八九不离十了。比起真人角色,卡通角色要更加容易被复刻,哪怕你给出的提示词比较“模糊”,它生成的图像也可以很具体。输入“90年代流行的黄皮肤动画片”,生成图像时就会精准匹配到辛普森这一家子。这要说没拿《辛普森一家》相关资料喂过AI,小编是不太相信的;就是不知道Midjourney是不是得到了人家的合法授权了。而这种未明确提及具体的电影或角色名字,系统就生成了相似度极高、可能侵犯版权的作品的情况,并非是个例。尽管提示词中并未涉及电影名称,Midjourney还是创建了《星球大战》系列图像除了经典场景外,Midjourney对于经典角色同样可以轻松“拿捏”:输入提示词“动画玩具”,出来的是《玩具总动员》;输入“穿工装裤戴护目镜的黄色3D卡通角色”,出来的就是小黄人;输入“视频游戏 刺猬”,立刻就能出来《索尼克》;输入“视频游戏 水管工”,结果毫无悬念-马里奥。哪怕用户无意冒犯原版电视/电影,生成式AI也可以帮你冒犯。或许你只是想让生成式AI帮你生成个致敬经典的形象,它直接就一步到位帮你生成经典,让你快速踏上法律和道德的红线。艺术家一共用Midjourney进行了三次实验,一次次证明了Midjourney真是个大型的侵权圣体啊,哪怕在没有精确指示的情况下也能生成完整的电影画面。这…拿来训练AI的资料但凡少一点,都不能有这么“出色”的效果吧…注:左侧第一张图为Hot Toys拍摄,非剧照不仅如此,参与实验的艺术家还发现了一个黑魔法般的关键词“screencap”(截图),只要在提示词里加入“screencap”,就能生成媲美真实电影截图的图像,逼真到让你怀疑自己记忆的程度。在为期两周的调查实验中,参与其中的艺术家们使用Midjourney生成的大量图像里,就有数百个可以轻易被识别出来的游戏或电影/电视角色。看看这一长串列表,现在的问题应该已经不是Midjourney有没有使用大量受版权保护的影视作品进行训练,也不是同类生成式AI是否有类似问题了;或许现在的问题是它们到底用了多少,以及是否都取得了原作的合法授权。万万想不到,好莱坞的那些剧集,有一天成为了推动人工智能进步的重要资源。end哦?RTX 5090D和RTX 5090核心硬件配置没有区别?好癫!几万人在线围观他在Blender里锯木头?!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“号”用户上传并发布,本平台仅提供信息存储服务。
相关文章
随便看看