“这个AI正在实施规模空前的软件侵权盗版行为!”
正式发布不到5个月,GitHub的敲代码神器Copilot已惹怒一众程序员,甚至摊上了官司:
被集体诉讼、按每条违法行为的最低法定赔偿额计算,需赔偿90亿美元(约合人民币647亿元)。
诉讼的发起者,一位干了20多年的老程序员Matthew Butterrick(马修)愤然对其给出上述评价。
其实在10月份,马修就公开表示要告Copilot。现在他和优秀的几位律师一起前往加州旧金山的美国联邦法院,对Copilot提出集体诉讼。
申诉中还提到,Copilot涉嫌多次违反《加州消费者隐私法》:
就算每个用户在整个使用过程中只收到一次违法输出,那么GitHub和OpenAI都已经违法了3600000次。
马修指出:
要是再不管管Copilot,它将成为少数特权者从大多数人工作中获利的一种新方式。
他们将Copilot告上法庭的举动受到了众多网友的关注和支持。不少人表示,虽然Copilot确实功能强大,但它现在就是非法的,没有任何借口。
被索赔90亿美元,Copilot出了哪些问题?
简单来说,Copilot的主要问题可以概括为“侵权”二字:
包括侵犯众多代码原创者的版权,以及侵犯众多用户的隐私等。
而致此情况背后的原因,可以看成主要和两个方面有关。
一是Copilot的训练过程。
Copilot强大的编码能力来自一个叫做Codex的AI。Codex是OpenAI独立开发的一个模型,他们将此模型授权给了微软。
Codex是怎么训练的呢?
尽管微软含糊其辞,表示其训练源是数亿行公共代码;但Copilot的研究员后来还是道出了实情,都是出自GitHub上的公共仓库。
马修表示,微软和OpenAI要想用GitHub上的开源仓库进行训练,要么遵守它们的开源许可证协议,要么合理使用。
但马修和其他几位律师认为微软等既没有发布大量的attribution来获得许可,也没真正地“合理使用”。
于是他们在申诉词中指出:
Codex在没有遵守适用许可条款的情况下,输出了受版权保护的材料 。
微软他们未经代码拥有者的授权,擅自修改了多项版权管理信息,例如:标题和作者名称等。这些都违反了美国《数字千年版权法》(DMCA)中的相关规定。
除了训练过程,第二点则是关于Copilot的使用。
马修指出,Copilot正式版在今年6月份正式发布,定价10美元/月,但微软等一面收着前一面还对自己进行了免责申明。
(就是说,你可以用,但出了事别找我)
微软将Copilot给的代码称为“建议”,称自己不从中主张任何权力,也不对它生成的代码作任何关于正确性、安全性和产权相关的保证。
一旦用户接受了Copilot给出的“建议”,如果出了问题都由用户自己负责。
而且这些“建议”在很多时候对使用者来说并不太适用:
Copilot可能会一字不差地把原作者的代码直接丢给用户,连注释都一并奉送的那种。
这要是直接采纳可就要涉及版权和许可等问题了,可Copilot压根儿没有注明这些代码的来源,所以用户也难以遵守协议。
本次诉讼的具体申诉文件长达56页,马修已经将其上传到了一个专门的网站上。(参考链接1)
马修表示,他们会在诉讼期间在此网址上及时更新当前进展。
Copilot都惹恼了谁?
其实迄今为止,Copilot的“侵权”问题已经引发了诸多不同群体的强烈抗议。
其一就是马修等辛苦自研代码的程序员们。
马修等人认知,自己辛辛苦苦写的代码就这么被挪用了,实在不能忍!
值得一提的是,马修这位老哥拥有众多技能:他不仅是一个经验丰富的老“码农”,还有哈佛大学的视觉研究学位,并已获得了律师资格证。
除了……现在不玩某蓝色小鸟软件了(手动狗头)。
而且在今年6月份,Copilot结束内测开启收费模式后,大家的不满情绪更是瞬间高涨。
许多人指出:免费引流再收费的商业模式让人反感;而且大家一致认为这个AI用开发者写的代码来训练,不应该回过头向再开发者收费:
每一个曾向GitHub提交过代码的人都应免费使用!
现在,马修终于联手几位律师把Copilot告上了法庭,他们称这是美国第一个挑战AI系统训练和输出的集体诉讼案件。
除了软件开发者们,计算机领域的一些学者也对Copilot颇有微词。
在听说马修他们要起诉Copilot后,德克萨斯A&M大学的一位计算机科学教授,并兼任ACM、IEEE和SIAM会员的Tim Davis也发推分享了自己的“遭遇”:
Copilot没有拿到LGPL许可证(函数库公共许可证),就擅自发出了大段我的版权代码。
另外,软件自由保护协会SFC等组织也在积极声讨Copilot。
SFC是一个旨在为自由开源软件项目提供支持和基础设施的非营利组织。
其实自从微软及其子公司 GitHub在去年首次推出Copilot 以来,SFC 就一直在试图与他们沟通。
SFC之前也向微软他们提出了版权和许可证相关的问题,但微软等一直拒绝明确回答。
现在,SFC不仅自己已经停止使用微软 GitHub来开展项目托管,而且还号召其他软件开发商同样照做。