每日AI快讯

揭示AI唇语识别技术:Readtheirlips让视频转录变得轻而易举,隐私安全问题引发关注

随着人工智能技术的发展,一款能够解读唇语的AI软件引起了广泛关注。这款名为Readtheirlips的软件能够在视频中准确识别说话者的话语,即使是在小声说话的情况下也不例外。例如,在一段红毯视频中,布莱克·莱弗利低声说“好紧张”,尽管她的笑容使得肉眼难以辨别唇语,但AI却能轻松识别。就连侃爷这样说话时嘴巴动作不明显的人,其唇语也能被准确捕捉。 网友们对此反响热烈,有人希望将这一功能与Siri等语音助手结合,以便在无需大声说话的情况下进行操作;还有人表示想用它来测试“座机画质”的视频效果。然而,也有不少网友担...

蚂蚁集团的AI布局:支小宝如何革新理财与医疗领域的故事进展

随着AI技术的迅猛发展,各大互联网巨头纷纷加入这场技术革命。在2024年的Inclusion外滩大会上,蚂蚁集团一口气推出了三款AI产品:「支小宝」、「蚂小财」和「AI健康管家」,分别应用于生活服务、理财和医疗领域。其中,「支小宝」不仅可以在支付宝内使用,还拥有独立的APP,而「蚂小财」和「AI健康管家」则内置在支付宝中。 除了面向消费者的产品,蚂蚁集团还推出了面向企业的数字蚂力解决方案,并启动了支付宝智能体生态共建计划,推出了智能体开发平台“百宝箱”。这一系列动作展示了蚂蚁集团在AI战略上的提速。然而,尽管A...

港大发布OpenCity:利用Transformer与图神经网络实现智慧城市的交通预测与零样本预测的新突破

精确的交通预测与城市规划 精确的交通预测对于实现高效的城市规划和交通管理至关重要,有助于优化资源分配并改善出行体验。然而,现有的预测模型在面对未知区域和城市的零样本预测任务,以及长期预测时,表现并不理想。这些问题主要源于交通数据在空间和时间上的异质性以及显著的分布变化。为了解决这些挑战,我们开发了一个多功能、强鲁棒性和高适应性的时空基础模型——OpenCity。 OpenCity的设计与特点 OpenCity结合了Transformer和图神经网络,以捕捉和规范来自不同数据源的潜在时空模式,从而增强在不同城市环境中的零...

探索iPhone 16的重大革新:Apple Intelligence引领的相机控制键变革与滑动触控功能的完美融合

苹果新推出的 iPhone 16 系列带来了一项重要更新:相机控制键 根据最新报道,苹果公司最近发布的 iPhone 16 系列手机加入了一个全新的相机控制键。这项功能不仅仅是为了提升用户的拍照体验,更重要的是为了更好地推广其“Apple Intelligence”服务。 全新的相机控制键提供了多种操作方式 这款新机型中的相机控制键不仅支持长按快速启动相机,还可以通过单击来触发快门。此外,还加入了滑动触控功能,方便用户调整拍摄焦距,从而提供更加多样化的操作体验。 苹果计划向第三方开发者开放该功能 苹果计划将这一相机控制键的...

【创新突破:从设计理念到用户体验,创始人倾情解析AI语音笔记背后的订阅模式与社交媒体推广策略】

一、对话背景与初心 2024年9月3日,我们与AI语音笔记应用「闪念贝壳」的创始人Ping进行了一次深入对话。作为一位有着丰富设计背景的创业者,Ping曾任职于久邦数码、阿里巴巴和爱范儿等知名公司。他的初衷是通过AI技术解决自己的需求,进而为用户提供便捷的笔记体验。 二、设计理念与实践 Ping一直认为设计不仅仅是视觉上的美化,更是将想法转化为实际产品的过程。无论是软件设计还是硬件设计,他始终坚持用最新的技术和设计理念满足用户需求。他提到:“我上学时就有写日记的习惯,现在依然保留着几十本笔记本。然而,随...

海通证券:洞察消费电子行业,AI赋能新产品引领全球经济周期中的技术创新与超额收益

9月12日,海通证券发布了一份研究报告,指出消费电子行业已经进入了成熟阶段,并逐渐展现出周期性和成长性的双重特征。具体来说,行业的存量市场受到全球经济周期的影响较大,而增量市场的拓展则依赖于技术创新的突破。 回顾A股市场中的消费电子板块,可以发现每当这一领域出现系统性行情时,通常伴随着多个基本面指标的好转。特别是在某些细分领域中,如果有特定的主题催化剂,这些板块往往会获得更高的超额收益。 展望未来,消费电子行业有两大关键的关注点:一是人工智能(AI)技术如何推动新产品的开发,并对整体消费...

【法国AI初创公司Pixtral 12B重磅发布:Sophia Yang引领开发的Mistral多模态AI模型,搭载120亿参数与24GB容量,基于Apache 2.0许可证开放使用】

近日,据IT之家报道,法国AI初创企业Mistral推出了其首款多模态AI模型——Pixtral 12B。这款模型具备处理图像和文本的能力,拥有120亿个参数,文件大小约为24GB。一般来说,参数越多,模型的性能越出色。Pixtral 12B基于文本模型Nemo 12B构建,能够回答关于任意图像的问题。 与其他多模态模型如Anthropic的Claude系列和OpenAI的GPT-4相比,Pixtral 12B同样具备为图像添加描述以及统计照片中物体数量等功能。用户可以免费下载并根据Apache 2.0许可证对Pixtral 12B进行微调。Mistral的开发者关系负责人Sophia Yang在X平台上透露...

黄仁勋表态:英伟达在必要时刻可选择放弃台积电,转向Blackwell架构以应对芯片短缺

北京时间9月12日,英伟达首席执行官黄仁勋(Jensen Huang)在高盛科技会议上表示,尽管英伟达目前主要依靠台积电进行芯片代工,但如有必要,公司也可以将订单转移到其他供应商。 黄仁勋指出,英伟达之所以选择台积电作为最主要的芯片制造商,是因为台积电在芯片制造领域的领先地位。然而,英伟达自身拥有强大的技术研发能力,可以在必要时将订单转移给其他供应商。不过,他同时也提到,这样做可能会导致芯片质量有所下降。 “台积电的灵活性和应对我们需求的能力非常出色,”黄仁勋说道,“因此我们选择让他们来生产芯片。但...

寒武纪开源Torch-MLU:实现原生PyTorch支持与大模型一键迁移,助力AI生态发展

今日,寒武纪正式开源了PyTorch设备后端扩展插件Torch-MLU,并实现了对其硬件的原生支持,极大地提升了开发者的使用体验和集成效率。 早在2018年,寒武纪便开始了与PyTorch框架的集成适配工作。从PyTorch 1.3版本开始,寒武纪MLU系列智能加速卡就被纳入PyTorch的加速后端,使得开发者能够高效地将原本基于GPU的深度学习网络迁移到寒武纪MLU平台。 随着PyTorch 2.4版本的发布,结合新版本(≥ V1.22)的Torch-MLU插件,寒武纪硬件实现了对PyTorch的原生支持。现在,开发者不再需要安装定制版的Cambricon PyTorch,只需基于官...

OpenAI投资的AI生物技术初创企业发布Chai-1,挑战AlphaFold3,引领药物发现领域的分子结构预测新标准

新型多模态基础模型Chai-1发布 近日,一家仅成立六个月的AI生物技术初创公司Chai Discovery发布了用于分子结构预测的新型多模态基础模型Chai-1,并附带了一份详细的技术报告。这份报告详细比较了Chai-1与其他模型如AlphaFold的性能。Chai-1能够统一预测蛋白质、小分子、DNA、RNA以及共价修饰等分子结构,在与药物发现相关的多种任务中达到了最新的技术水平。 Chai Discovery的联合创始人兼CEO Joshua Meier表示,Chai-1在多个基准测试中表现出色,成功率提升了10%到20%。他还提到,与AlphaFold相比,Chai-1在药物研发的关...
14849505152199