互联网面临挑战：探讨AI生成内容、内容农场与虚假账号如何影响搜索引擎结果及关联至学术造假的问题

AI生成泛滥：互联网面临新挑战

最近，一张微信群里流传的截图引发了广泛关注。有人爆料称，他们利用AI技术在小红书上创建了大量的虚假账号矩阵，并通过出售这些账号获利。这种现象并不罕见，你是否觉得现在的社交媒体上越来越难以区分真假？当你在浏览社交媒体、搜索信息或观看视频时，你能分辨出哪些是由人类创作的，哪些是由AI生成的吗？更令人担忧的是，你如何确定自己看到的事实不是AI制造的幻象？

AIGC（AI生成）正在引领一场互联网革命，但与此同时，它也带来了滥用的问题。大量的低质量、AI生成的充斥着网络，搜索引擎的结果页也变得不堪重负。小红书上的许多可能是AI生成的，音乐平台上充斥着AI翻唱的歌曲，Spotify上的AI乐队翻唱流行歌曲，与真实的艺术家作品一同播放，获得了数百万的播放量并获得版税。最近，美国北卡罗来纳州一名男子因用AI制作了数十万首歌曲并通过AI机器人刷播放量，获利超过1000万美元而被捕。甚至你在亚马逊上购买的电子书也可能出自AI之手。

#农场的崛起与AI时代的到来

“农场”是指为了牟取广告费等商业利益，快速生产大量网络文章来吸引流量。为了吸引眼球，一些账号甚至故意发布虚假信息或夸大事实，诱导用户点击。发布“西安突发爆炸”虚假新闻的账号所属机构，最高峰时一天能生成4000至7000篇假新闻，每天收入在1万元以上。现在，农场已经进入AI时代。AI工具使得生成成本大幅降低，单次浏览的广告收入即可覆盖成本。根据IT技术博主阮一峰的计算，使用某国产AI模型生成一篇文章仅需0.00138元，而单次浏览的广告收入约为0.00145元。这种模式使得农场比以往更容易盈利。

AI搜索引擎Perplexity的问题

AI搜索引擎Perplexity通过对搜索结果添加脚注，链接到互联网的实时信息源来确保结果的准确性。然而，根据AI检测平台GPTZero在今年6月进行的一项研究，Perplexity用户平均搜索三个关键词，就会遇到AI生成的。像“日本京都的文化节”、“人工智能对医疗行业的影响”、“泰国曼谷必尝街头美食”以及“值得关注的年轻网球选手”等搜索，返回的结果中包含了引用AI生成材料的答案。这项研究揭示了Perplexity这样的AI搜索产品在提供优质来源方面的一个缺陷，也反映出互联网正日益充斥着AI生成的。

#社区的困境

社区也是AI入侵的“重灾区”。Quora曾经是一个良好的问答社区，但现在却成为一个信息垃圾场，充斥着无意义的AI生成。起初，一些用户使用ChatGPT生成答案，后来Quora直接在页面上集成了ChatGPT生成的答案，这些错误的答案又传播到了谷歌的搜索结果中。开发者也在借助AI SEO获取流量，Eightify.app和Glarity.app是两个YouTube视频总结插件，通过AI技术批量生成图文并茂的文章，在短时间内获得了巨大的流量增长。然而，这种做法最终引起了谷歌的人工干预。

学术界的挑战

日益增多的AI生成不仅影响了社交媒体和搜索引擎，还悄然渗透到了学术领域。西安交通大学的一篇论文因使用AI生成的配图而被撤稿，相关图片中大鼠长出了诡异的器官，细胞信号传导图像电路板。在谷歌学术上搜索“截至我上次知识更新”或“我没有访问实时数据的权限”，会出现大量借助AI生成的论文。学生在AI的帮助下完成作业和论文已经成为一种常态。

AI训练的恶性循环

AI模型的准确性在很大程度上取决于其训练数据的质量。随着AI生成的重新流入互联网，最终又成为训练未来AI模型的一部分数据，这个过程可能导致输出质量越来越低。谷歌在Google I/O 2024大会上演示了AI简要概括未读邮件，并生成新邮件以供回复的功能。不难推断，收件人将利用AI来阅读这些邮件，并生成新的AI回复。这类功能普及后，每个人的收件箱是否会充斥着没有人真正会去阅读或撰写的邮件？

本文来源：