标签:多模态应用

TE2024:探索生成式AI时代的实时互动与多模态应用,声网全面发布RTE+AI能力全景图

TE2024:聚焦Gen AI 时代的 RTE,声网发布 RTE+AI 能力全景图 10月25日,由声网和 RTE 开发者社区联合主办的第十届实时互联网大会(RTE2024)在北京正式开幕。本届大会以“AI 爱”为主题,涵盖AI、出海、社交泛娱乐、IoT、Voice AI、空间计算等20多个行业和技术分论坛。声网成立十周年之际,实时互动技术已从理念发展成为行业,推动了社交泛娱乐、在线教育、IoT、企业服务等多个领域的成长,支撑了电商直播、互联网医疗、秀场直播等互联网风口的进化。 在生成式AI时代,RTE与AI将迎来更多可能性。大会主论坛上,声网创始人兼...

中国大模型时代:顶级AI投资人探讨生成式AI、多模态应用与AGI的十大前沿趋势及具身智能超级应用

生成式AI正引领着一场科技革新,2024年的进展表明,这一领域在成本、效果和用户留存方面面临挑战。启明创投作为AI投资先驱,已投资数十家相关企业,其中多数集中在大语言模型、多模态模型和AI基础设施。生成式AI在生产力工具、创意和陪伴三个领域取得显著成果,逐渐从提高效率转向提供娱乐体验。多模态应用比例上升,新应用类别不断涌现,同时,AI在视频生成、多智能体技术等方面展现出巨大潜力。 周志峰预测,2024年生成式AI将融合GPT和扩散模型,数据获取和组织将显著影响新模型,多智能体技术将提升效率,图文联合扩散模...

万亿级AI新市场,中国企业还能“卷”赢吗?

随着中国AIGC(人工智能生成内容)应用市场规模预计在2023年达到200亿元,并有望在2030年扩展至万亿元级别,该领域展现出巨大的发展潜力。报告显示,B端产品贡献了约80%的营收,而C端产品近半数以免费模式运营。AI原生应用比例超过X+AI,占比接近57%,显示出多模态应用的广泛需求,这类产品的比例接近50%。产品成功的关键在于场景和技术的匹配,技术成熟度直接影响落地速度。投资资源向AIGC产业头部企业集中,应用层成为潜在资本关注的重点。 尽管中国在互联网时代通过产业链优势迅速崛起,但在AI领域,企业是否能复制以往...

国产视频大模型奋起直追 Pika、阿里同日发布“对口型”利器

在AI多模态的激烈竞争中,视频生成成为科技巨头和新兴企业的焦点,尤其是AI视频生成技术。近日,PIKA推出了唇形同步功能,合作方ElevenLabs提供AI语音支持,而阿里巴巴则发布了更为先进的EMO框架,能生成包含丰富表情和姿势变化的视频。尽管PIKA目前限制在3秒分段同步,EMO则可生成任意时长且细节丰富的视频。值得注意的是,EMO的技术路径不同于Sora,基于Stable Diffusion 1.5改造,而非Transformer。 AI视频生成被认为是多模态应用的关键,如阿里Animate Anyone、字节跳动Magic Animate和微软GAIA等产品已显现其潜力。视...