标签:数据墙

AI领域遭遇数据墙挑战:高质量语言数据短缺或致模型训练进展减缓及机器学习模型崩溃风险

随着技术的发展,AI领域正面临着一个前所未有的挑战:“数据墙”。据快科技8月1日的报道,互联网上的高质量数据资源正在迅速枯竭,这给AI大模型公司带来了严峻考验。权威研究机构Epoch AI预测,到2028年,互联网上的所有优质文本数据将被彻底采集;而对于语言数据集而言,这一时刻甚至可能提前至2026年。这无疑给AI行业的快速发展蒙上了一层阴影。 然而,在这一看似悲观的情景中,一些科学家却保持着乐观的态度。他们指出,在语言模型领域,仍然存在大量未被充分利用的数据资源,这些资源富含差异化的信息,有望为构建更加精...