【Meta涉嫌下载数十TB盗版电子书用于AI训练，面临严重法律风险和版权侵权问题】—快科技

图书作者指控Meta未经授权下载盗版电子书用于AI训练

2023年2月9日，据媒体报道，一名图书作者对Meta公司提起诉讼，指控其未经授权下载了大量盗版电子书，并将其用于训练AI模型。最新泄露的邮件显示，Meta承认从有争议的大型数据集LibGen中下载了数千万本盗版书籍。

根据法庭文件，Meta通过名为“安娜的档案”（Anna’s Archive）的渠道下载了至少81.7TB的数据，其中包括来自知名盗版网站Z-Library和LibGen的至少35.7TB的。此外，Meta还被指此前从LibGen下载了额外的80.6TB数据。作者指出，Meta的这一行为构成了非法的电子书库种子下载，且这些数据可能只是其盗版行为的冰山一角。

作者估计，这些盗版电子书库可能仅占Meta盗版版权作品总量的0.008%，这表明Meta的盗版规模可能远超目前所揭露的情况。邮件还显示，Meta公司员工也意识到其行为的法律风险。2023年4月，Meta的研究工程师尼古拉·巴什利科夫在邮件中表示：“用公司的笔记本电脑下BT感觉不妥。”

到2023年9月，巴什利科夫加大了抗议力度，并咨询了法律团队。他指出，使用Torrents意味着对文件进行“播种”，即对外共享，这在法律上是不允许的。尽管如此，Meta仍决定继续，并试图通过将数据集下载到非Meta服务器来避免被追溯的风险。

本文来源：