标签:字节跳动
科大讯飞与字节跳动迎战GPT-4:端到端大模型引领语音AI技术革新与生死挑战
引言 最近,OpenAI 推出了 GPT-4 的高级语音功能,引发了新一轮的关注。这项功能不仅提升了语音交互的真实感,还加入了多种新特性,如自定义指令、记忆功能以及五种新声音。更重要的是,GPT-4 的语音交互变得更加自然,用户可以在任何时候打断对话,即便不说话时,系统也会保持安静。这一切都让 GPT-4 的交互体验更加贴近人类。 国内语音AI的发展现状 尽管 OpenAI 在语音AI领域取得了显著进展,国内的大厂也在努力追赶。科大讯飞和字节跳动等公司纷纷推出了各自的语音AI产品。科大讯飞通过在教育、医疗等垂直领域的深耕细...
字节跳动推出AGILE框架:运用强化学习优化大语言模型(LLM)Agent端到端能力全面升级
大语言模型(Large Language Models, LLMs)的快速发展推动了LLM Agent的进步。为了增强LLM Agent的能力,最近的研究提出了多个关键组件和工作流。然而,如何将这些核心要素整合进一个统一的框架,并进行端到端优化,仍然是一个挑战。来自字节跳动(ByteDance)的研究人员提出了一种基于强化学习(Reinforcement Learning, RL)的LLM Agent框架——AGILE。 在AGILE框架下,Agent具备多种能力,包括记忆、工具使用、规划、反思、与外界环境交互及主动求助专家。通过强化学习,所有这些能力都能进行端到端的训练。特别是,AGILE...
AI视频生成技术引领新战场:字节跳动与快手竞逐,豆包视频大模型和可灵AI反击Sora
第一部分:字节跳动迎战Sora 字节跳动以性价比策略切入市场,引发了新一轮的价格竞争。然而,高性能模型依然保持着付费门槛。在B端市场,豆包视频大模型的接纳度仍有待观察,其商业变现能力和用户场景适配性成为关键考验。 9月24日,在2024火山引擎AI创新巡展深圳站上,字节跳动推出了两款AI视频模型——豆包视频生成-PixelDance和豆包视频生成-Seaweed,并面向企业市场开启邀测。自从Sora问世以来,已经过去了7个月,期间国产视频大模型层出不穷,纷纷围剿Sora。字节跳动在七个月后才正式加入这场竞争,面对的不仅仅是Sora...
字节跳动推出先进AI视频生成模型:多主体互动与高级审美带来前所未有的震撼体验
9月24日,字节跳动旗下的火山引擎在深圳举办了一场AI创新巡展,发布了两款视频生成大模型:PixelDance(简称P模型)和Seaweed(简称S模型)。这两款模型在审美和动态表现方面有了显著提升,并且解决了多主体互动和一致性的问题。 为了让大家更好地了解这两款模型的能力,我们进行了实际测试。首先展示的是一个10秒的视频片段:一位年轻女子微皱眉头,生气地戴上墨镜,此时男主角进入画面,紧紧抱住她。整个过程中,人物的表情变化自然流畅,没有出现任何虚化或崩坏的现象。另一段视频中,一只金毛小狗在草地上追逐泡泡,画...
安德里森·霍罗威茨点睛:全球消费级AI移动应用TOP 50榜单揭晓!美图秀秀强势挺进前十,字节跳动豆包新晋入榜位列26
安德里森·霍罗威茨发布最新AI应用榜单 8月23日消息,知名风投公司安德里森·霍罗威茨(简称a16z)近期公布了《Top 100消费级生成式AI应用》榜单,该榜单每六个月更新一次,旨在追踪全球范围内最具影响力的AI网络产品和移动应用。 a16z公司简介 安德里森·霍罗威茨是一家成立于2009年的美国私人风险投资公司,由马克·安德里森和本·霍罗威茨联合创办。公司总部位于加利福尼亚州门洛帕克。自成立以来,a16z一直是科技领域的活跃投资者,曾向Twitter等多家初创企业投资超过8000万美元。 报告亮点 本次报告对比2024年3月发布...
字节跳动AI新动向预览:文生图技术或将创新长视频产业,豆包大模型引领短剧制作,抢先布局的公司一览(附相关概念股)
在即将到来的7月19日,字节跳动计划披露其在人工智能领域的最新突破,包括创新的文生图技术与类似Sora的新视频模型。这些AI模型特别在长视频和高动态场景中展现出独特优势,可能与OpenAI的Sora模型形成竞争态势。据知情人士透露,字节跳动已将AI大模型视为集团最高优先级项目。 在新加坡举行的ByteDance AI Luminary Talks活动中,字节跳动的研究科学家周大权将详细介绍关于“连续高动态的长视频生成方案”的前沿研究。作为短视频行业的领头羊,字节跳动在AI技术的每一步发展都受到广泛关注。这次文生视频的布局预示着相关AI...
字节跳动AI技术新突破:7月19日揭晓文生图及长视频模型重大进展,豆包大模型引领语音识别创新
在即将到来的7月19日,字节跳动科技公司计划在其人工智能(AI)技术领域迈出重要一步。据钛媒体AGI报道,该公司将在本周五首次大规模展示其先进的AI模型技术,其中包括文生图和类Sora新视频技术。这些创新技术尤其在长视频和高动态图像处理方面展现出强大的潜力,有可能与Sora效果相媲美。内部消息透露,字节跳动已将AI大模型列为集团最高优先级P0项目。 不仅如此,抖音和剪映等多个内部团队也正致力于研发AI视频模型的应用,并有望在不久的将来对外公布。字节跳动将在新加坡主办一场名为“ByteDance AI Luminary Talks”的活...
苹果Core ML新宠:字节跳动AI团队研发的Depth Anything V2模型,引领AI应用新潮流
在最近的更新中,苹果公司向HuggingFace平台推出了20款创新的Core ML模型和4个全新的数据集,其中引人注目的是字节跳动大模型团队研发的Depth Anything V2模型成功入选。这款先进的单目深度估计模型为苹果的开发者们提供了更为便捷的途径,以构建智能化且安全的AI应用程序。 Core ML,作为苹果的机器学习框架,允许开发者将模型无缝集成到iOS、macOS等平台,实现离线的高性能AI任务处理,增强了用户隐私保护,同时减少了响应时间。借助这些新发布的模型,开发者可以更轻松地打造高效能的应用。 Depth Anything V2相较于前...
AI+硬件时代来临:字节跳动、美团携手探索万亿市场,PICO与科大讯飞引领穿戴设备新潮流,百度小度学习手机与俏鱼乐伴AI耳机创新不断
在互联网巨头的探索中,“AI+硬件”正逐渐成为新的趋势。据透露,字节跳动旗下的PICO正在研发包括耳机和音响在内的多种穿戴设备,尽管有相关专利,但内部人士否认了实际生产计划。然而,字节的豆包团队正在进行大模型软硬件结合的初步探索。另一方面,美团也在研发名为“俏鱼”的AI业务,与儿童穿戴设备品牌“小天才”合作,将AI语音互动应用“俏鱼乐伴”应用于小天才手表。百度则在AI硬件领域走在前列,推出AI学习手机和学习机,销量表现良好。此外,科大讯飞也推出多款AI耳机,加强AI办公领域的布局。互联网大厂通过自研或合作方式...
不同 AI 大模型匿名打 PK:字节跳动扣子平台上线“模型广场”
字节跳动“扣子 Coze”推出模型广场,开启AI模型匿名对决新体验 在科技巨头字节跳动的“扣子 Coze”平台上,一项创新功能——“模型广场”已正式上线,为用户提供了一个独特的AI模型比拼的竞技场。这个“擂台”允许用户在三种不同的对战模式下测试模型的能力,分别是“随机 Bot 对战”、“指定 Bot 对战”和“纯模型对战”。 在随机 Bot 对战中,系统会自动匹配一个Bot,以评估模型在各种业务场景下的文本生成和知识应用技能。用户可以自由选择感兴趣的Bot,扣子Coze将挑选两个匿名模型进行较量,依据Bot的配置来回应用户的问题。 指定 B...