每日AI快讯
Sora刷屏背后:企业AI视频的爆发需求,与100元的付费意愿
近日,Sora产品的发布引起了广泛关注,它能依据文本描述生成长达60秒的连贯视频,正迎合了当前高涨的视频市场需求。然而,尽管需求强劲,企业愿付费用却呈急速下滑态势,半年内从每月千元降至约100元。据见实调查,AI生成视频的需求占比达到34.9%,成为企业第三大需求。无论是个人还是企业,大部分已有付费意向。Sora的诞生可能引领2024年企业降低成本、提高效率的新变革。 业内预测,Sora或将颠覆短视频直播领域,大幅削减制作成本。用户期待着由文字直接生成电影的新时代到来,内容创新和故事情节将更加关键。目前,AIGC...
Sora爆火48小时:杨立昆揭秘论文,参数量或仅30亿
OpenAI的新型大模型Sora引发热议,成为科技界的焦点。该模型引起马斯克等科技领袖的评论,并引发视频、影视等行业对职业前景的思考。Sora基于扩散Transformer论文,可能运用了谷歌的NaViT技术,参数量约为30亿。视频展示中,Sora展现了生成各种场景的能力,但也存在明显的技术瑕疵。 OpenAI CEO阿尔特曼的营销策略备受赞赏,有人猜测他选择在谷歌发布Gemini 1.5时推出Sora以抢占话题度。同时,OpenAI可能寻求超过800亿美元的估值,反映出对资金的紧迫需求。 专家们对Sora的看法各异,有的惊叹其潜力,如周鸿祎预测它将颠覆...
苹果的AI时代将至:爆料称将推AI编程工具 WWDC成焦点时刻
据最新消息,苹果正悄然布局AI领域,准备在Xcode新版本中集成类似GitHub Copilot的AI工具,以提升iOS平台的编程效率。这一举措意味着苹果将与微软在AI开发工具上展开竞争。苹果加速测试和开发进程,预计年内可能开放给第三方开发者使用。借鉴GitHub Copilot的功能,该工具可自动完成编码、修复错误及编写注释等任务。 苹果的年度盛会WWDC将于6月举行,届时AI将成为关注焦点。面对市场对AI技术的期待,苹果股价承受压力,高层已承诺展示其AI战略。软件工程副总裁克雷格·费德里吉已要求团队在iOS更新中强化AI元素。苹果高层已...
支付宝春节数据显示:6亿人次参与AI年俗,年轻人热衷“赛博过年”
《春节消费新潮流:“赛博过年”与“特色经济”交织》 今年的春节,新一代年轻人以独特的“赛博过年六件套”——电子接财、AI红包等创新方式,赋予传统年味以现代气息。随着“8+1”超长假期的到来,春节消费展现出“繁花经济”与“冰雪经济”的双重热度。上海景区因黄河路年夜饭预订火爆,消费额同比增长8倍;哈尔滨的冰雪魅力吸引了大量南方游客,尤其是广东、浙江、上海的民众。 年货消费亦呈现新风尚,直播间成为采购新平台。支付宝年货直播间内,纸巾、酒水和黄金销售显著增长,分别提升3倍、1倍和2倍。同时,境外游客在中国的消费金...
谷歌开源 Magika:毫秒级识别内容类型,百万文件测试准确率超 99%
谷歌开源AI新成果:Magika,提升文件识别效能 谷歌近期公开了一项重大进展,他们决定开源其创新项目——Magika,这是一款运用人工智能技术实现快速且精准的文件格式和内容识别工具。Magika的源代码现已在GitHub上开放,供全球开发者参考和使用。 Magika的核心是一个特别设计并高度优化的深度学习模型,能在CPU上运行时,在极短的几毫秒内确定文件类别。据谷歌透露,经过对超过100万份涵盖100多种格式的文件进行基准测试,Magika的表现超越现存工具约20%,准确性和召回率均高达99%以上。 在实际应用中,谷歌已借助Magika强化...
OpenAI首个视频生成模型发布 一句话生成1分钟高清视频
OpenAI近日推出了创新的Sora模型,这是一款革命性的文生视频工具,它基于DALL·E 3的技术,能依据文本描述产出长达1分钟的高清视频。该模型深入模仿实际物理环境,显著提升了AI解析和参与真实世界情境的能力。 在实例展示中,Sora成功地根据'中国龙年春节'创建了一段生动的节日场景,舞龙活动栩栩如生,人群动态自然。另一部作品则展示了东京雨后的城市景象,水洼反射和霓虹灯效极其逼真,让人难以分辨是否出自AI之手。 OpenAI致力于教导AI理解并复制物理运动,期望借此解决涉及实际交互的难题。Sora已能创造包含多角色和复...
效果炸裂!OpenAI首个视频生成模型发布,1分钟流畅高清,网友:整个行业RIP
近日,奥特曼推出OpenAI的创新成果——视频生成模型Sora,这是继DALL·E 3后的又一力作,可生成长达1分钟的高清视频。Sora展现了强大的场景构建能力,如热闹的春节、雨后东京的光影效果,甚至能模拟好莱坞电影预告片的质感。模型能理解并执行复杂的指令,如群体动态和物理交互,如纸飞机在森林中的飞行。 然而,Sora尚存不足,如物理模拟精度和因果理解,有时会出现对象数量变化或空间细节混淆等问题。技术上,Sora基于扩散模型,采用Transformer架构,能处理不同格式的视觉数据,并利用DALL·E 3的重述提示词技术增强指令遵循...
48个文生视频+技术报告,揭秘OpenAI最强视频GPT
OpenAI推出了创新的文本生成视频模型Sora,这款模型可根据文字指示生成长达1分钟的高清视频,展现卓越的视觉效果和细节处理。Sora的独特之处在于其深度理解文本,能在单一视频中创建多个镜头,维持角色一致性。它还能理解物理属性,处理复杂场景,并支持文本指令、图像输入和视频编辑。 Sora采用Transformer架构,可扩展性强,能一次性生成或延长视频。通过多帧预见能力,保证主体在视线外时依然保持不变。相较于传统模型,Sora在原尺寸数据上训练,增加了灵活性和构图改进。它拥有强大的语言理解能力,通过训练高度描述性...