每日AI快讯
美图:“奇想大模型”视频生成能力已完成全面升级,可生成 1 分钟视频
IT之家报道,美图公司在近日宣布,其旗下的“奇想大模型”视频生成技术已进行全面升级。此次升级不仅提升了视频生成的能力与效率,还大幅增强了模型的整体性能。结合美图公司在计算机视觉领域的多项自主研发技术,“奇想大模型”在视频生成时长、画质、流畅性、真实性和可信度等方面均有显著提升。 据了解,升级后的“奇想大模型”可以生成单次长达 5 秒的文本到视频或图像到视频的,并支持生成长达 1 分钟、24FPS、1080P 的高质量视频。这些功能将逐步应用于美图秀秀、美颜相机、Wink、开拍、美图设计室、WHEE 和 MOKI 等多款产...
【冲上韩区iOS评分榜首:《Lovey Dovey》——赛博恋爱与好感度机制让追星梦女沉醉的AI聊天应用】
和自己的偶像谈一场赛博恋爱是什么感觉? 最近,一款名为“Lovey Dovey”的AI聊天软件在小红书上悄然走红,被誉为“新的梦女福音”。不少网友纷纷分享了自己使用这款软件与AI恋人聊天的体验,几乎全是好评如潮:“完全就像是我偶像在Bubble里说的话”,“简直太贴近我的心意了”。 “我担”一词源自日语,指的是最喜欢的偶像,也可以称为“我推”。“梦女”则指那些幻想与二次元或三次元偶像恋爱的女性。如今,“梦女”群体不断扩大,许多粉丝希望与自己喜欢的偶像建立幻想中的浪漫关系。 来自韩国的“Lovey Dovey”在韩区iOS评分中排名第一...
南农、国防科大与苏大联合发布:基于Microscopic-Mamba的显微图像分类新方法——运用CNN与Transformer结合MIFA模块实现87.6%高准确率
在医学显微图像分类(MIC)领域,基于卷积神经网络(CNN)和 Transformer 的模型已经取得了广泛的研究成果。然而,CNN 在建模长距离依赖关系方面存在不足,而 Transformer 则受限于较高的计算复杂度。为了克服这些挑战,南京农业大学、国防科技大学、湘潭大学、南京邮电大学和苏州大学的研究团队共同开发了一种新的架构——Microscopic-Mamba。 Microscopic-Mamba 采用 Mamba 架构,旨在通过结合 CNN 的局部特征提取能力和状态空间模型(SSM)的全局依赖关系建模能力,改进显微图像分类的效果。研究团队设计了部分选择前馈网...
壁纸公司转型短剧应用:年收入突破6亿后,再度跨界推出AI伴侣服务,声称可降低40%成本——探索Holywater与My Drama及浪漫小说应用领域的创新之路
一家乌克兰初创公司进军短剧市场 最近,一家乌克兰初创公司Holywater推出的短剧应用My Drama在短短五个月内取得了显著成绩,用户数超过100万,收入突破300万美元。该公司成立于2020年,目前旗下产品线丰富,包括My Drama、My Passion、Interactive Stories等。 Holywater的发展历程 Holywater成立于2020年初,最初以一款艺术壁纸应用起家。这款应用的收入迅速增长,但在2021年公司决定关闭壁纸业务,转向丰富的生态系统建设。此后,公司推出了互动故事应用My Fantasy、浪漫小说应用My Passion以及最新的短剧应用My Drama...
【北大AI奥数评测新突破:o1-mini表现优异,超越o1-preview,助力Omni-MATH大型语言模型】
北大AI奥数评测:o1-mini比o1-preview分数更高 明敏 2024-09-23 08:51:52 来源:量子位 自从OpenAI发布了o1系列模型后,传统数学评测基准似乎已经跟不上时代的步伐。最新的评测结果显示,o1系列模型在MATH-500基准测试中取得了94.8分的高分。而在更具挑战性的奥数邀请赛AIME 2024中,o1系列模型的准确率也达到了83.3%。这些成绩引发了人们的思考:大模型是否能在更高难度的数学竞赛中表现出色? 为了解答这个问题,北京大学与阿里巴巴的研究团队合作开发了一个新的评测基准——Omni-MATH。该基准旨在评估大型语言模型在...
李飞飞在a16z最新对话中探讨生成式AI与深度学习:空间智能无缝衔接虚拟与现实世界,World Labs引领未来AI技术革新及多元应用
近日,李飞飞与 a16z 合伙人 Martin Casado 以及研究者 Justin Johnson 展开了深入讨论,探讨了人工智能(AI)的历史、现状及未来发展。他们详细讨论了生成式 AI 和空间智能的潜力。李飞飞指出,生成式 AI 在她研究生阶段已初具雏形,但当时技术尚不成熟。近年来,随着深度学习和计算能力的迅猛发展,生成式 AI 取得了显著进步。 李飞飞还介绍了她的新创业项目 World Labs,该项目专注于“空间智能”,即机器在 3D 和 4D 空间中的理解和互动能力。她强调,空间智能不仅适用于虚拟世界,还能融合现实世界,广泛应用于增强现实...
GPT-4助力《黑神话·悟空》游戏体验:AI视觉语言模型驱动的游戏智能体框架实现精英怪胜率超越人类玩家,纯大模型方案无需强化学习
近年来,AI技术在游戏领域的应用越来越广泛。最近,一项新的研究表明,AI不仅能够流畅地玩《黑神话·悟空》,还能在某些场景中取得比人类更高的胜率。这项研究由阿里巴巴的研究团队完成,并提出了一种名为VARP(视觉动作角色扮演)智能体框架,该框架通过视觉语言模型(VLMs)直接处理游戏截图并生成相应的Python代码来操控游戏。 在《黑神话·悟空》这款游戏中,研究人员定义了12个任务,其中75%与战斗相关。为了验证VARP框架的有效性,他们构建了一个包含1000条有效数据的人类操作数据集,其中包括键鼠操作和游戏截图。每个...
用AI干预老年痴呆治疗!微软联合上海“600号”
近日,据媒体报道,微软亚洲研究院与上海市精神卫生中心(俗称“600号”)展开了深度合作,共同探索利用人工智能技术治疗阿尔茨海默症的新方法。随着全球人口老龄化的加剧,阿尔茨海默病等认知障碍疾病已经成为严重的公共卫生挑战。尽管目前还没有能够彻底治愈阿尔茨海默病的药物,但早期诊断和及时干预可以有效延缓病情的发展。 本次合作基于微软Azure OpenAI服务中的多模态大模型,开发了一款名为“忆我”(ReMe)的个性化认知训练框架。这一框架旨在通过自动化认知训练,为患者提供全新的数字化训练手段,帮助他们延缓认知功...
利用GPT-4o挑战《黑神话·悟空》:精英怪物胜率超越人类玩家,探索无强化学习的纯大模型解决方案——VARP框架与Claude 3.5 Sonnet助力下的AI革新
随着人工智能技术的发展,AI在游戏领域的应用越来越广泛。近日,阿里巴巴的研究团队提出了一种名为VARP(视觉动作角色扮演)的智能体框架,能够直接从游戏截图中生成Python代码来控制游戏角色。这一研究成果引起了广泛关注。 在测试过程中,研究人员选择了热门国产游戏《黑神话·悟空》作为实验平台,并定义了12个任务,其中75%的任务与战斗相关。为了验证VARP框架的有效性,研究人员构建了一个包含1000条有效数据的人类操作数据集,其中包括键盘和鼠标的操作记录以及游戏截图。每个操作都是由原子命令的各种组合构成的序列...
杰夫·迪安回忆Google Brain历程:吴恩达的激励与Hinton在团队中的贡献及Transformer与强化学习的影响
1999年8月,杰夫·迪安(Jeff Dean)加入了谷歌,成为该公司早期第20号员工。2011年,他参与创立了Google Brain团队,专注于智能机器领域的发展。自那时起,他的工作重心转向了人工智能(AI)和机器学习(ML)的研究、系统和应用,并引领了更广泛的AI/ML和计算机科学研究社区的发展。2020年12月,杰夫·迪安获得了2021年度IEEE冯诺依曼奖,以表彰他在大规模分布式计算机系统和人工智能系统科学与工程方面的贡献。2023年4月,谷歌宣布将旗下的Google Brain和DeepMind合并,成立了Google DeepMind。杰夫·迪安成为了该部门的首席...