日本:敞开训练AI不用管版权,LeCun:机器学习天堂
对AI训练数据无版权限制
西风 发自 凹非寺
量子位 | 公众号 QbitAI
大模型狂潮下,日本政府坐不住了。
直接宣布:不会对训练AI所使用的数据实施版权保护。
这也就意味着,训练AI可以使用任何数据。
不管是非营利还是商业目的,不论是否是复制以外的行为,只要你能搞得到,你就可以用,甚至从非法网站获得的数据也可以用。
连Yann LeCun看到消息后都发文表示:
日本已经成为了机器学习的天堂。
确实,不少日本学术界和商界人士那是敲锣打鼓。
毕竟想要在全球大模型舞台上分得一杯羹,数据本就是一大关键要素。
但这引起了动漫和艺术创作者的担忧。
早在四个月前,日本参议院议员、职业漫画家赤松健在YouTube上发布了一个讲用AI进行图像生成的视频,就有提到过侵权问题,以及漫画师的担忧。
在那时,就有日本画友认为:
希望能开发出超越“Novel AI”的AI插图服务。当然,这个AI服务的训练数据集中不能使用未经授权的转载图片。
但现在,对训练AI所使用的数据集的版权限制已放开。
用无视版权的方式“弯道超车”
其实,日本并不是第一次在版权保护上有所松懈。
日本曾经因为过于严苛的版权保护,导致版权转让极为不便,需要遵循诸多条条框框,盗版问题也很严重。
之后,日本在2019年修正了版权保护制度。
即便如此,这次日本被爆在训练AI方面的大尺度政策,还是令人惊讶。
Technomancers.ai报道称:
似乎日本认为版权问题,尤其是与动漫和其它视觉媒体相关的版权问题,阻碍了该国在人工智能技术方面的进展。
作为回应,日本决定全力以赴,选择无版权的方式来保持竞争力。
尽管日本目前是世界第三大经济体,但自1990年代以来,日本的经济增长一直缓慢。
此时,若人工智能可以得到有效发展,就有可能在短时间内将日本的GDP提高50%或者更多。
对于日本来说,这是一个令人兴奋的前景。
日本还试图把手伸向西方国家的数据库,这也是日本发展人工智能的关键。
相较而言,日本的日语训练数据量明显少于西方可用的英语数据资源。
日本拥有很受欢迎动漫等文化内容。在这点上,日本的立场似乎很明确:
如果西方利用日本文化来训练AI,那么西方文化资源也应该可供日本训练AI。
AI监管辩论还在继续
TB级别的训练数据是维系大模型进化的一大核心要素。
毕竟可用的高质量训练数据越多,AI 模型就越好。
而关于大模型训练数据不透明等问题一直是大家讨论的热点。
大模型的野蛮生长势必要带来人们对其安全合规的考量,侵权问题就是需要监管的问题之一。
而此次日本这一举动也为监管辩论增添了转折。
针对版权问题,美国版权局(USCO)在三月份也发布了新规。
但并不是对版权进行保护,而是称:
人工智能(AI)自动生成的作品不受版权法保护。
因为,和人工参与创作的Photoshop作品不同,通过Midjourney、Stability AI、ChatGPT等平台生成的作品完全由AI自动完成,而且训练的数据是基于人类创作的作品,因此不受版权法保护。
对此,你怎么看?
参考链接:
[1]https://technomancers.ai/japan-goes-all-in-copyright-doesnt-apply-to-ai-training/
[2]https://www.reddit.com/r/singularity/comments/13wxhe3/white_house_is_no_longer_laughing_at_ai_risk_like/
[3]https://twitter.com/ylecun/status/1664313215310807041
- 马斯克新官上任再起诉OpenAI!新证据称Ilya七年前就不放心奥特曼2024-11-16
- 杨植麟发布Kimi新模型:数学对标o1,中考高考考研成绩全第一2024-11-16
- 量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了2024-11-16
- 大模型“取长补短”新思路入选NeurIPS’24,显著优于现有路由方法,南科大港科大出品2024-11-14