第100章 【100】180(1 / 2)

  刘教授重复刚才的操作,说:“是的。”

  言谨提出下一个问题:“那请问刘教授,这种差异是怎么产生的呢?”

  刘教授笑,说:“这就是个复杂的问题了,每家公司采用的模型不同,进行预训练的数据集也不同。”

  言谨客气致谢,再次提问:“那么是否存在一种可能,有些 AI 绘图工具并未能达到您所说的‘把数据库真的学会了,生成的结果确实是一种全新创造’的程度呢?”

  刘教授滞了滞,答:“这个要具体情况具体分析……”

  言谨并未打算纠缠,但郭家阳那边已出声打断,对法官说:“原告律师的提问存在引导专家的倾向,请求法庭准许我方辅助人不回答这个问题。”

  法官支持了他的意见,看向言谨,提醒她注意提问的方式。

  言谨致歉,她其实可以换一种方式重新提问,却出乎对方意料地说:“原告没有其他问题了,申请请上我方的专家辅助人。”

  法官点头准许,刘教授顺利完成任务,退出法庭,换了原告方聘请的林博士坐到中间的辅助人席位上。

  林博士不过三十几岁,自我介绍身份以及资历,是个数据法领域的学者,正在做人工智能监管方面的理论研究。

  双方专家辅助人的名单也是庭前就提交了的,同样都是明牌。言谨可以猜到郭律师和孙力行看到名单时的反应。他们或许会觉得她蠢,因为美国那个同类案件之所以首战失利,除去两位艺术家没做版权登记,还有一个原因就是原告方没能把为什么认为 AI 绘图工具侵权的逻辑解释清楚。而言谨似乎也在犯同样的错误,居然请了一个法学学者来做 AI 案件的专家辅助人,等于白白浪费掉了唯一的外援机会。

  这一次,由言谨先提问,她再次开口,仍旧是方才那个问题:“请问林博士,AI 绘图工具生成的内容是否存在复制拼接数据集作品的可能?”

  这是早就预演过的流程,林博士要求使用大屏幕,在上面展示材料,同时简述其中的内容:“我这里有一篇马里兰大学和纽约大学联合研究团队的论文,题目叫《扩散艺术还是数字伪造?》https://arxiv.org/pdf/2212.03860.pdf,研究了扩散模型当中的过度拟合和数据复制现象。结论指出,一款当下著名的 AI 绘图工具生成的内容与数据集作品的相似度超过 50%的可能性达到了 1.88%。也就是说,每一百幅 AI 生成的图片当中,就有将近两幅存在一半以上的复制的现象。而且,训练数据集的大小在很大程度上影响着这个复制率,在使用具体艺术家姓名或者“某某某风格”作为提示词的情况下,这种复制拼接尤其明显,甚至可能达到赝品的程度。”

返回