标签:机器学习

AI领域遭遇数据墙挑战:高质量语言数据短缺或致模型训练进展减缓及机器学习模型崩溃风险

随着技术的发展,AI领域正面临着一个前所未有的挑战:“数据墙”。据快科技8月1日的报道,互联网上的高质量数据资源正在迅速枯竭,这给AI大模型公司带来了严峻考验。权威研究机构Epoch AI预测,到2028年,互联网上的所有优质文本数据将被彻底采集;而对于语言数据集而言,这一时刻甚至可能提前至2026年。这无疑给AI行业的快速发展蒙上了一层阴影。 然而,在这一看似悲观的情景中,一些科学家却保持着乐观的态度。他们指出,在语言模型领域,仍然存在大量未被充分利用的数据资源,这些资源富含差异化的信息,有望为构建更加精...

第二届「简约学习与低维结构会议 (CPAL)」在斯坦福大学:探索机器学习与数据驱动学习的最新进展,现正征稿

CPAL年度学术会议:探索简约与低维结构的新维度 一、会议概览 CPAL(Conference on Parsimonious and Low-dimensional Structures in Learning)是一个年度性的国际学术会议,聚焦于机器学习、信号处理、优化等领域的简约性和低维结构的研究。会议旨在构建一个多学科交流平台,汇聚来自全球各地的专家学者,共同探讨如何利用简约模型理解世界的复杂结构。首届CPAL会议于2024年初在香港大学成功举办,吸引了众多参会者。 二、CPAL 2025:展望未来 第二届CPAL会议计划于2025年3月末在美国斯坦福大学举行,由斯坦福大学数据...

机器学习颠覆摩尔定律:Epoch引领的AI计算趋势与数据潮流,硬件性能提升与成本增长分析

Epoch AI近期发布了关于机器学习未来趋势的最新研究报告,深度探讨了计算、数据、硬件、算法和成本等多个关键领域的趋势。这家专注于人工智能发展和治理趋势研究的机构,与多个学术机构合作,提供了市场上相对权威的预测。报告指出,前沿AI模型的训练计算量每年以4-5倍的速度增长,这一速度远超过去。此外,数据趋势显示,预计在2028年前,可用于训练的人类文本Token将耗尽。硬件性能方面,ML硬件的FLOP/s性能每2.3年翻一番,而算法性能方面,语言模型性能每5到14个月就能翻一番。成本趋势上,模型训练成本每9个月几乎翻一番...

NeurIPS开辟高中赛道引爆争议!网友:代理人战争要开始了

今年起,知名人工智能会议NeurIPS开辟了一条特别的路径,面向高中生征集关于“机器学习的社会影响”的论文。这个新举措引发了广泛的讨论和争议。被选中的优秀作品将在NeurIPS官网上展示,部分作者将有机会参加在温哥华举行的大会。然而,担忧的声音也不少,有人担心这会导致教育资源不均,增加低质量论文的数量,甚至加剧学术界的“内卷”现象。反对者指出,这可能会催生“家长代练”现象,使得学术圈面临更多垃圾论文的困扰,同时加重审稿人的负担。尽管如此,也有人支持这一决定,认为参与学术研究能帮助高中生探索未来方向。类...

50+国内外大模型专家齐聚,全球机器学习技术大会第二批嘉宾阵容公布!

全球机器学习技术大会即将迎来一批重量级嘉宾,其中包括众多国内外知名AI专家。小米的Daniel Povey博士,被誉为“Kaldi之父”,以其在语音识别和声学建模的贡献获得IEEE Fellow荣誉。尤洋教授,是ImageNet训练速度记录保持者,其成果广泛应用在科技巨头中。阿里巴巴通义实验室的李永彬,专注于大模型研究,打造了多个智能应用。北京大学的袁粒,研究多模态深度学习,ChatExcel等垂直领域语言模型是其代表性应用。微软亚洲研究院的刘树杰,从事自然语言处理,其研究成果广泛应用于微软产品。宋磊博士在人工智能和工业优化方面有...

药石科技:公司新药发现服务中应用AI技术目前处于早期研发阶段

药石科技在人工智能与新药研发的融合上不断创新。该公司透露,他们利用先进的人工智能机器学习算法,打造出一种独特的动态化学空间和活性化合物AI筛选系统。这个解决方案涵盖了分子生成、活性筛选和类药性评估等多个环节,旨在提升化合物库的构建效率,帮助客户挖掘具有潜力的苗头化合物,从而提高创新药物筛选的成功率,减少早期研发阶段的成本。尽管如此,药石科技也指出,其在新药发现服务中运用AI技术仍处于初期研发阶段,可能存在研发进度滞后于预期的风险。当前,相关订单规模有限,对近期业绩的影响微乎其微。

给AI Agent完整的一生!港大NYU谢赛宁等最新智能体研究:虚拟即现实

香港大学的Jihan Yang和纽约大学的谢赛宁等科研人员近期发布了一项创新成果——V-IRL项目,旨在构建更强大的AI Agent。V-IRL通过模拟真实世界的地图、街景等信息,为智能体创造了一个与现实无异的虚拟环境,使它们能在其中执行复杂任务。该平台利用API将AI嵌入全球真实城市,提供大规模、多样性的测试场景,包括Google街景的海量图像。 V-IRL智能体如Peng、Aria、Vivek、RX-399、Imani、Hiro、Ling和Diego展示了各种实用技能,如路径规划、餐厅推荐、房地产搜索、城市导航和协作解决问题。通过这种方式,V-IRL展示了如何利用...
12