2024年,是AI应用集中爆发的一年。智能搜索、文生视频和日常聊天等技术已经融入我们的日常生活和工作中,为我们带来了极大的便利。然而,对于一些人来说,高调宣传的AI似乎并没有达到预期的效果。但如果你知道现在的AI能够判断煤气是否泄漏,让爱因斯坦出现在课堂上,甚至让李白“亲自”朗诵诗词,你是否会感到惊讶?这些看似天马行空的应用其实离我们越来越近。
科大讯飞展示最新AI成果
12月29日,中央广播电视总台首届《中国科技创新盛典》(简称“科晚”)播出,这场科技春晚以“新质生产力”为核心关键词,汇聚了新兴产业和科技企业的代表。科大讯飞董事长刘庆峰作为杰出代表出席,并展示了最新的AI技术成果。其中最引人注目的表演之一是主持人张腾岳的“分身”——由讯飞智作打造的AI虚拟数字人。这个虚拟人不仅能够与真人互动对话,还以其出色的方言朗诵能力惊艳全场,展示了跨越语言与方言的精彩表演。
AI张腾岳的多语言才华
在舞台上,AI张腾岳用陕西、广东、河南三地方言分别演绎了《静夜思》《望月怀远》《满江红》等经典诗词,字正腔圆、韵味十足。仿佛一位来自当地的文化传承者,将诗词中的情感与意境通过方言的独特魅力展现得淋漓尽致。此外,“AI张腾岳”还能自然流畅地与真人主持人互动,准确理解对方的话语并迅速做出恰当回应,其逼真的表情、流畅的动作和生动的声音表现让人几乎难以察觉这是一个虚拟的存在。
科大讯飞的技术积累与突破
“AI张腾飞”的成功离不开科大讯飞在语音合成、语音识别、语义理解、唇形预测和图像处理等前沿人工智能技术上的深厚积累。今年,科大讯飞凭借“多语种智能语音关键技术及产业化”项目获得年度国家科技进步一等奖,标志着中国在多语种AI技术领域已达到国际领先水平。多年来,科大讯飞在多语种技术领域屡获殊荣,包括连续5届获得国际多通道语音分离识别比赛CHIME冠军,在多个语音识别竞赛中斩获多项冠军。
虚拟数字人的广泛应用
随着大模型赋能数字人的快速发展,虚拟人开始在日常生活中承担起导游、客服、主播等多元角色,出现在金融、文旅、媒体、政企等多个场景。讯飞多场景虚拟数字人结合星火认知大模型的最新技术已经赋能多个领域,从国际赛事巴黎奥运会到非遗文化北京中轴线,从行业活动天津智博会到智慧展厅山东高速,都能看到其身影。平台化产品如AI虚拟人交互平台已在央国企、教育培训、文化旅游、电子商务、金融服务等多个行业成功落地,应用广度与深度持续拓展。
AI在教育领域的创新应用
在本次科晚上,刘庆峰还演示了AI在教育领域的能力。利用AI多模态理解技术,智慧黑板可以直观呈现空间构图,进行图形分割,动态展示截面与立方体的空间变化,培养学生数学建构能力。虚拟人助教还可以与学生实时进行情景对话、语音评测,激发学生的好奇心与求知欲。课下,虚拟人助教带领学生进行课间活动,助力实现五育并举。科大讯飞已为全国32个省级行政区的5万余所学校提供常态化应用,此次展示的星火智慧黑板获得全球智慧教育创新奖,并入选2024世界人工智能大会SAIL奖TOP30榜单。
工业安全巡检机器狗“小汐”
搭载声学成像仪的巡检机器狗“小汐”也在科晚舞台上亮相。刘庆峰展示了小汐在工业安全领域的可能性,在工厂模拟场景中,小汐仅用了几秒钟就精准锁定了泄漏位置,展现出其在工厂安全巡检和设备故障预警中的巨大潜力。小汐的成功得益于讯飞潮汐力的工业AI声学成像仪,融合高精度麦克风和超声波声源定位技术,实时展示声源分布状态,迅速辨别出细微声音。
科大讯飞的未来展望
在全球元宇宙和数字经济加速发展的背景下,科大讯飞凭借国家级技术背书、全球领先的多语种能力和成熟的产业生态,在直播、服务、影视、教育、电力、制造等众多行业成功打造了多个数字化转型标杆项目。未来,科大讯飞将继续以创新为驱动,不断拓展人工智能的应用边界,为生活、工作和社会发展带来更多的惊喜与变革,让人工智能成为推动人类进步的强大力量。
本文来源: 新熵公众号【阅读原文】