知识产权大悖论

  • caonima 2025年05月13日 06:40:04 51阅读
  • 卡拉奇:

    这是一个后书店、后真相、后一切时代的现代道德谜题:如果一台受过盗版小说训练的机器写出了一篇畅销小说,这个故事能因此赚到钱吗?如果是这样,谁会得到报酬?

    随着文化界努力应对人工智能(AI)不断扩大的足迹,出现了两个阵营,而且往往有重叠的成员:一些人谴责未经同意使用艺术家和作家的作品来训练人工智能,另一些人则以公平和反资本主义的名义热情地捍卫盗版学术和文学材料的获取。我们如何理解这个矛盾呢?

    Z-Library、LibGen、Anna’s Archive等网站长期以来一直是南半球资金不足的学生、工作过度的研究人员和缺书的读者的宠儿。他们免费提供大量的付费知识库和商业文献。2022年底,当联邦调查局(FBI)关闭Z-Library并逮捕其所谓的创始人时,随之而来的是一波网上愤怒,这并不是因为人们支持侵犯版权本身,而是因为它暴露了一个更深层次的问题:知识在商品化系统中难以获取。

    然而,快进到2025年,人们的愤怒已经发生了转变。人工智能公司正在抓取同样的盗版数据集:书籍、期刊、新闻文章,以训练大型语言模型。这包括OpenAI, Meta,谷歌,可能还有任何模型看起来很好读的公司。对此的反应是广泛的愤怒、抗议、版权诉讼,作者们对他们的作品未经许可就被剽窃感到愤怒。这是可以理解的。

    但这里有一个转折:一些曾经把安娜档案馆的数字罗宾汉浪漫化的人,现在对人工智能划出了明确的界限。我们必须想知道是什么改变了。

    认识你的新图书管理员

    ChatGPT、Claude和Perplexity等人工智能工具通常是在包含盗版或公开抓取材料的数据集上进行训练的。这意味着你的绝版诗集,你晦涩的研究论文,或者你精心制作的同人小说现在可能是模特大脑的一部分。对许多作家来说,道德上的冒犯不仅仅是他们没有得到报酬,而是他们没有被要求。

    今年4月,《卫报》报道了英国计划实施集体许可,以确保作者在人工智能培训中使用的作品得到补偿。这是向承认写作是一种劳动迈出的一步。但事情变得混乱的地方就在这里:如果人工智能必须付费进行数据训练,我们必须考虑这对Z-Library等免费访问档案的合法性意味着什么,在某种程度上支持公平访问的同时谴责使用相同材料训练的模型。

    这种困境不仅仅是作家的问题。上个月,一段模仿吉卜力工作室艺术风格的人工智能视频在网上疯传,引发了粉丝和吉卜力工作室的强烈反对。宫崎骏以坚决反对人工智能生成的艺术而闻名,他曾称机器生成的图像是“对生命本身的侮辱”。

    但我们不要忘记,吉卜力在全球的粉丝群体中,有很大一部分是通过盗版dvd、种子和未经授权的粉丝订阅诞生的。这同样适用于早期的动漫文化、朋克杂志、独立漫画和地下音乐。文化在成为主流之前总是要经历影子经济。

    有警告的反资本主义

    这一切揭示了盗窃的等级制度。为了访问而盗版是一种高尚的行为。为了实现自动化而进行盗版会让人觉得很榨取。许多人会说,区别在于权力。人工智能公司不是穷学生或苦苦挣扎的研究人员。它们是数十亿美元的实体,利用集体文化劳动。

    这种权力不平衡是真实存在的,但这并不能解决矛盾。如果我们相信信息应该是免费的,我们对这种自由有什么限制?如果我们认为艺术家应该得到同意和补偿,那么我们如何证明让我们中的许多人最初接触艺术的非正式经济是合理的呢?

    一个特别超现实的转折是,英国广播公司上个月宣布,它已经使用人工智能来模拟阿加莎·克里斯蒂和其他去世已久的作家的写作课程。虽然该公司坚称只使用了公共领域的材料,但未经作者同意就变出作者声音的神奇效果引发了一场小小的文学恐慌。

    在这里,重要的是要问在模拟时代保存遗产意味着什么。由于人工智能可以将已故作者的风格重新融合到可盈利的产品中,我们必须明确这是致敬还是剥削。再说一遍,如果这些同样的克里斯蒂小说是你通往文学的大门,是在二手硬盘或一个可疑的文件共享网站上发现的呢?

    人工智能让这种矛盾更难以忽视:我们希望艺术和知识是自由和神圣的。我们希望机器是有道德的,但当人们出于正当理由违反规则时,我们也能接受。我们对企业的压榨感到愤怒,但对个人的抵制表示赞赏。我们相信公平工资,除非我们负担不起。

    事实是,知识产权一直是一个难以捉摸的概念。莎士比亚是一个混音者。民间故事是匿名的。嘻哈是建立在采样的基础上的。盗版使好莱坞紧张,但也使其全球化。而现在,人工智能就在这里,将一切与数学的冷漠中立重新混合在一起。

    那么我们该怎么办呢?

    这取决于你认为文化是用来干什么的。如果你认为艺术是一种商品,那么人工智能培训就必须支付许可费和许可。如果你相信艺术是公有的,那么获取比所有权更重要。如果你认为艺术是两者兼而有之,那么,欢迎加入混乱。

    在英国,对集体许可的呼吁是有希望的,但这并不是一个适用于所有人的解决方案。尤其是对于英语圈以外的作家来说,他们的作品可能会被废弃,但他们可能永远不会得到一分钱。这也不是解决下游文化问题的办法:课堂依赖盗版pdf,农村图书馆使用盗版数据训练的聊天机器人,下一个伟大的作家在非法电子书中成长。

    我们正处在一个清算的时刻,两个长期存在的观念发生了碰撞:创造力是神圣的,知识应该是免费的。人工智能并没有造成这种矛盾。它只是迫使我们去面对它。

    当盗版使访问民主化时,我们欢呼雀跃,当人工智能利用盗版时,我们嘲笑不已,现在我们陷入了知识产权悖论。无论你倾向于哪一方,问题都不再是谁拥有文化,而是谁使用文化,以及为什么使用文化。

    这是一个后书店、后真相、后一切时代的现代道德谜题:如果一台受过盗版小说训练的机器写出了一篇畅销小说,这个故事能因此赚到钱吗?如果是这样,谁会得到报酬?

    随着文化界努力应对人工智能(AI)不断扩大的足迹,出现了两个阵营,而且往往有重叠的成员:一些人谴责未经同意使用艺术家和作家的作品来训练人工智能,另一些人则以公平和反资本主义的名义热情地捍卫盗版学术和文学材料的获取。我们如何理解这个矛盾呢?

    Z-Library、LibGen、Anna’s Archive等网站长期以来一直是南半球资金不足的学生、工作过度的研究人员和缺书的读者的宠儿。他们免费提供大量的付费知识库和商业文献。2022年底,当联邦调查局(FBI)关闭Z-Library并逮捕其所谓的创始人时,随之而来的是一波网上愤怒,这并不是因为人们支持侵犯版权本身,而是因为它暴露了一个更深层次的问题:知识在商品化系统中难以获取。

    然而,快进到2025年,人们的愤怒已经发生了转变。人工智能公司正在抓取同样的盗版数据集:书籍、期刊、新闻文章,以训练大型语言模型。这包括OpenAI, Meta,谷歌,可能还有任何模型看起来很好读的公司。对此的反应是广泛的愤怒、抗议、版权诉讼,作者们对他们的作品未经许可就被剽窃感到愤怒。这是可以理解的。

    但这里有一个转折:一些曾经把安娜档案馆的数字罗宾汉浪漫化的人,现在对人工智能划出了明确的界限。我们必须想知道是什么改变了。

    认识你的新图书管理员

    ChatGPT、Claude和Perplexity等人工智能工具通常是在包含盗版或公开抓取材料的数据集上进行训练的。这意味着你的绝版诗集,你晦涩的研究论文,或者你精心制作的同人小说现在可能是模特大脑的一部分。对许多作家来说,道德上的冒犯不仅仅是他们没有得到报酬,而是他们没有被要求。

    今年4月,《卫报》报道了英国计划实施集体许可,以确保作者在人工智能培训中使用的作品得到补偿。这是向承认写作是一种劳动迈出的一步。但事情变得混乱的地方就在这里:如果人工智能必须付费进行数据训练,我们必须考虑这对Z-Library等免费访问档案的合法性意味着什么,在某种程度上支持公平访问的同时谴责使用相同材料训练的模型。

    这种困境不仅仅是作家的问题。上个月,一段模仿吉卜力工作室艺术风格的人工智能视频在网上疯传,引发了粉丝和吉卜力工作室的强烈反对。宫崎骏以坚决反对人工智能生成的艺术而闻名,他曾称机器生成的图像是“对生命本身的侮辱”。

    但我们不要忘记,吉卜力在全球的粉丝群体中,有很大一部分是通过盗版dvd、种子和未经授权的粉丝订阅诞生的。这同样适用于早期的动漫文化、朋克杂志、独立漫画和地下音乐。文化在成为主流之前总是要经历影子经济。

    有警告的反资本主义

    这一切揭示了盗窃的等级制度。为了访问而盗版是一种高尚的行为。为了实现自动化而进行盗版会让人觉得很榨取。许多人会说,区别在于权力。人工智能公司不是穷学生或苦苦挣扎的研究人员。它们是数十亿美元的实体,利用集体文化劳动。

    这种权力不平衡是真实存在的,但这并不能解决矛盾。如果我们相信信息应该是免费的,我们对这种自由有什么限制?如果我们认为艺术家应该得到同意和补偿,那么我们如何证明让我们中的许多人最初接触艺术的非正式经济是合理的呢?

    一个特别超现实的转折是,英国广播公司上个月宣布,它已经使用人工智能来模拟阿加莎·克里斯蒂和其他去世已久的作家的写作课程。虽然该公司坚称只使用了公共领域的材料,但未经作者同意就变出作者声音的神奇效果引发了一场小小的文学恐慌。

    在这里,重要的是要问在模拟时代保存遗产意味着什么。由于人工智能可以将已故作者的风格重新融合到可盈利的产品中,我们必须明确这是致敬还是剥削。再说一遍,如果这些同样的克里斯蒂小说是你通往文学的大门,是在二手硬盘或一个可疑的文件共享网站上发现的呢?

    人工智能让这种矛盾更难以忽视:我们希望艺术和知识是自由和神圣的。我们希望机器是有道德的,但当人们出于正当理由违反规则时,我们也能接受。我们对企业的压榨感到愤怒,但对个人的抵制表示赞赏。我们相信公平工资,除非我们负担不起。

    事实是,知识产权一直是一个难以捉摸的概念。莎士比亚是一个混音者。民间故事是匿名的。嘻哈是建立在采样的基础上的。盗版使好莱坞紧张,但也使其全球化。而现在,人工智能就在这里,将一切与数学的冷漠中立重新混合在一起。

    那么我们该怎么办呢?

    这取决于你认为文化是用来干什么的。如果你认为艺术是一种商品,那么人工智能培训就必须支付许可费和许可。如果你相信艺术是公有的,那么获取比所有权更重要。如果你认为艺术是两者兼而有之,那么,欢迎加入混乱。

    在英国,对集体许可的呼吁是有希望的,但这并不是一个适用于所有人的解决方案。尤其是对于英语圈以外的作家来说,他们的作品可能会被废弃,但他们可能永远不会得到一分钱。这也不是解决下游文化问题的办法:课堂依赖盗版pdf,农村图书馆使用盗版数据训练的聊天机器人,下一个伟大的作家在非法电子书中成长。

    我们正处在一个清算的时刻,两个长期存在的观念发生了碰撞:创造力是神圣的,知识应该是免费的。人工智能并没有造成这种矛盾。它只是迫使我们去面对它。

    当盗版使访问民主化时,我们欢呼雀跃,当人工智能利用盗版时,我们嘲笑不已,现在我们陷入了知识产权悖论。无论你倾向于哪一方,问题都不再是谁拥有文化,而是谁使用文化,以及为什么使用文化。

    0