AI生成泛滥:互联网面临新挑战
最近,一张微信群里流传的截图引发了广泛关注。有人爆料称,他们利用AI技术在小红书上创建了大量的虚假账号矩阵,并通过出售这些账号获利。这种现象并不罕见,你是否觉得现在的社交媒体上越来越难以区分真假?当你在浏览社交媒体、搜索信息或观看视频时,你能分辨出哪些是由人类创作的,哪些是由AI生成的吗?更令人担忧的是,你如何确定自己看到的事实不是AI制造的幻象?
AIGC(AI生成)正在引领一场互联网革命,但与此同时,它也带来了滥用的问题。大量的低质量、AI生成的充斥着网络,搜索引擎的结果页也变得不堪重负。小红书上的许多可能是AI生成的,音乐平台上充斥着AI翻唱的歌曲,Spotify上的AI乐队翻唱流行歌曲,与真实的艺术家作品一同播放,获得了数百万的播放量并获得版税。最近,美国北卡罗来纳州一名男子因用AI制作了数十万首歌曲并通过AI机器人刷播放量,获利超过1000万美元而被捕。甚至你在亚马逊上购买的电子书也可能出自AI之手。
#农场的崛起与AI时代的到来
“农场”是指为了牟取广告费等商业利益,快速生产大量网络文章来吸引流量。为了吸引眼球,一些账号甚至故意发布虚假信息或夸大事实,诱导用户点击。发布“西安突发爆炸”虚假新闻的账号所属机构,最高峰时一天能生成4000至7000篇假新闻,每天收入在1万元以上。现在,农场已经进入AI时代。AI工具使得生成成本大幅降低,单次浏览的广告收入即可覆盖成本。根据IT技术博主阮一峰的计算,使用某国产AI模型生成一篇文章仅需0.00138元,而单次浏览的广告收入约为0.00145元。这种模式使得农场比以往更容易盈利。
AI搜索引擎Perplexity的问题
AI搜索引擎Perplexity通过对搜索结果添加脚注,链接到互联网的实时信息源来确保结果的准确性。然而,根据AI检测平台GPTZero在今年6月进行的一项研究,Perplexity用户平均搜索三个关键词,就会遇到AI生成的。像“日本京都的文化节”、“人工智能对医疗行业的影响”、“泰国曼谷必尝街头美食”以及“值得关注的年轻网球选手”等搜索,返回的结果中包含了引用AI生成材料的答案。这项研究揭示了Perplexity这样的AI搜索产品在提供优质来源方面的一个缺陷,也反映出互联网正日益充斥着AI生成的。
#社区的困境
社区也是AI入侵的“重灾区”。Quora曾经是一个良好的问答社区,但现在却成为一个信息垃圾场,充斥着无意义的AI生成。起初,一些用户使用ChatGPT生成答案,后来Quora直接在页面上集成了ChatGPT生成的答案,这些错误的答案又传播到了谷歌的搜索结果中。开发者也在借助AI SEO获取流量,Eightify.app和Glarity.app是两个YouTube视频总结插件,通过AI技术批量生成图文并茂的文章,在短时间内获得了巨大的流量增长。然而,这种做法最终引起了谷歌的人工干预。
学术界的挑战
日益增多的AI生成不仅影响了社交媒体和搜索引擎,还悄然渗透到了学术领域。西安交通大学的一篇论文因使用AI生成的配图而被撤稿,相关图片中大鼠长出了诡异的器官,细胞信号传导图像电路板。在谷歌学术上搜索“截至我上次知识更新”或“我没有访问实时数据的权限”,会出现大量借助AI生成的论文。学生在AI的帮助下完成作业和论文已经成为一种常态。
AI训练的恶性循环
AI模型的准确性在很大程度上取决于其训练数据的质量。随着AI生成的重新流入互联网,最终又成为训练未来AI模型的一部分数据,这个过程可能导致输出质量越来越低。谷歌在Google I/O 2024大会上演示了AI简要概括未读邮件,并生成新邮件以供回复的功能。不难推断,收件人将利用AI来阅读这些邮件,并生成新的AI回复。这类功能普及后,每个人的收件箱是否会充斥着没有人真正会去阅读或撰写的邮件?
本文来源: 硅星人Pro公众号【阅读原文】