11月28日,猎户星空正式发布了开源的Orion-MoE 8x7B参数MoE模型,并与聚云科技共同推出了大模型数据服务——AI数据宝。猎户星空首席科学家韩堃表示,AI数据宝AirDS(AI-Ready Data Service)为企业提供全方位的大模型数据服务,涵盖了数据收集、清洗、标注、提示词工程以及评估等环节,是连接底层模型和上层应用的重要桥梁。
数据在大模型发展中的重要性
随着大模型产业的竞争加剧,数据的重要性愈发凸显。算法和算力的差距逐渐缩小,而高质量的数据成为大模型效果和应用开发的关键。傅盛在接受智东西等媒体采访时表示,数据是AI行业场景落地的制胜关键。猎户星空凭借其大模型能力和数据处理能力,成为业内唯一一家既做大模型又提供大模型数据服务的公司。
“炼丹”容易,“修仙”难
从去年至今,基于Transformer架构的ChatGPT引发了AI产业的革命。然而,算法和算力的竞争已经放缓,数据成为了各家企业争夺的关键。数据的质量和数量直接影响大模型在垂直行业的落地效果。企业不仅需要大量的数据,还需要对数据进行清洗、标注和优化,以确保模型的准确性和可靠性。
猎户星空与聚云科技的合作
猎户星空与聚云科技的合作,旨在提供全面的大模型数据服务。AI数据宝AirDS涵盖了数据清洗、标注、提示词工程和模型评估等环节,帮助企业快速构建高效的应用。聚云科技在出海企业服务方面的丰富经验,使得猎户星空能够更好地满足中国品牌企业的国际化需求。
商业化应用案例
AI数据宝AirDS已经成功应用于多个领域,包括移动通信终端、互联网娱乐、新能源汽车、互联网金融和消费零售等。例如,某全球化移动终端客户通过AI数据宝AirDS解决了多语言适配的问题,优化后的评测指标准确率超过95%。这表明大模型如何实现商业价值,是当前产业发展的重要课题,猎户星空已经找到了一条可行的路径。
猎户星空的技术积累
猎户星空自2016年成立以来,一直致力于全链条AI技术的研发。从最初的智能语音交互系统到现在的具身智能研究,猎户星空积累了丰富的技术经验。2021年底,猎户星空基于多年的技术储备,快速切入AI应用和模型微调服务。2023年,猎户星空推出了开源的Orion-14B模型,并于近日发布了Orion-MoE 8x7B-Base模型,进一步提升了模型的性能和效率。
聚云科技的出海服务优势
聚云科技成立于2020年,前身是猎豹移动的IT运维服务部门,拥有超过10年的出海运维经验。聚云科技已经服务了上百家中企出海品牌,是亚马逊云科技在中国首批获得生成式AI能力认证的高级咨询合作伙伴。猎户星空和聚云科技的合作,充分发挥了双方的优势,实现了模型、业务和数据的闭环。
未来展望
猎户星空与香港大学计算与数据科学学院签订了合作协议,双方将联合研发用于课程教学的AI应用教育工具,并开展具身智能相关的课程项目。这将进一步推动AI技术在应用领域的普及与应用。猎户星空正通过8年的技术积累,搭建起大模型发展与企业需求之间的桥梁,助力大模型的商业化落地。
本文来源: 智东西【阅读原文】