标签:数据耗尽

突破数据耗尽困境:大型语言模型与人工智能的2028年算力挑战 – Epoch AI预示文本数据合成新时代

在人工智能领域,训练数据的重要性不言而喻,尤其是对于大型语言模型(LLM)。然而,Epoch AI的最新论文揭示了一个令人惊讶的预测:互联网上的人类文本数据可能在2028年耗尽。这篇论文指出,尽管算力不断提升,数据已经成为AI发展的关键制约因素。OpenAI在训练GPT-5时已遇到数据短缺问题,考虑使用YouTube视频转录文本作为补充。Epoch AI预测,未来十年内,数据增长速度无法满足大型模型的需求,2028年可能面临“数据耗尽”的局面。 Epoch AI是一家专注于人工智能趋势研究的非营利机构,其工作受到政府报告和智库的重视。论文...