标签:大模型
办公软件赛道持续火热:AI成关键转点、金山入局企业赛道
随着AI技术的快速发展,特别是大模型的应用,AI助理已经成为各大应用软件竞相开发的新焦点,引领着应用智能化的新趋势。尽管大模型技术仍面临挑战,如全球算力短缺和各种能力的探索阶段,但微软等公司已证实,AI在提高工作效率方面显示出巨大潜力。在国内,办公应用软件市场竞争激烈,AI大模型的商业化被头部企业视为重点,如钉钉、金山办公和飞书等都在积极布局。钉钉近期推出AI助理市场,提供多样化的AI助理服务,而金山办公通过WPS 365加强AI能力和协作功能,飞书则在扩大其在企业协同办公的影响力。此外,腾讯文档发布智...
【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版体验
随着国内大模型竞争加剧,科大讯飞的讯飞星火大模型V3.5版本升级,提升了对长文本、长图文和长语音处理的能力。新版本新增了星火图文识别大模型、多情感超拟人合成技术和一句话复刻功能。据官方介绍,讯飞星火大模型在长文本处理上表现出色,能快速理解大量文本数据,并提供精准的行业问答答案。在IT之家的评测中,V3.5版本与GPT-4相媲美,甚至在逻辑推理和知识更新速度上具有优势。 长文本体验方面,讯飞星火大模型V3.5的“星火合同助手”组件能辅助用户快速起草合同,准确解读和回答复杂信息,如隐私政策和保险条款。对于长...
百模大战引爆「千卡集群竞赛」,“中国英伟达”交卷了
在当前AI领域,大模型的训练对算力需求激增,引发了AI算力荒,从芯片短缺演变为对AI算力集群的巨大需求。中国的智能算力供应面临严重不足,尤其是在GPU全球短缺的情况下。政策层面,北京市已提出支持建设超大规模智算集群以满足大模型训练,并鼓励使用自主可控GPU。国内企业如华为云和摩尔线程等正在加速布局大规模智算集群,以应对大模型的多样化需求。 摩尔线程作为国内AI芯片公司,已建成三座千卡智算中心,通过其夸娥智算中心解决方案,提供一站式的GPU算力管理和优化服务。这些智算中心支持多种大模型的训练和微调,提...
快速低成本构建应用,浪潮信息把企业大模型落地门槛打下来了
浪潮信息推出企业大模型开发平台元脑企智EPAI,旨在降低企业应用大模型的门槛。随着大模型进入2.0时代,算力、数据和算法成为关键,但高昂的成本和行业知识不足阻碍了落地。EPAI提供端到端解决方案,包含基础数据、自动化工具、高效微调功能,支持长文档处理,解决行业数据缺乏和模型幻觉问题。平台的易用性使得不同技术水平的开发者能快速上手,降低企业用工成本。EPAI还注重数据安全,确保模型和数据的安全。浪潮信息的全面布局,包括算力、存储和互联,将进一步推动大模型产业协作,促进大模型的普及和产业化落地。
商汤发布日日新 5.0 大模型:推理上下文窗口 200K,号称对标 GPT-4 Turbo
近日,商汤科技推出了全新的日日新5.0大模型,这款模型运用了MOE混合专家架构,显著提升了其在知识、数学、逻辑推理和编程能力方面的性能。经过超过10TB的数据训练,该模型拥有200K的推理上下文窗口,可与GPT-4 Turbo相媲美。日日新5.0不仅支持自然语言处理、图像生成等功能,还能进行定制化模型训练,满足不同领域的需求。 在文科应用上,模型的创新能力与推理总结能力得到增强,对教育和内容创作等行业有积极的辅助作用。而在理科领域,其强化了数理逻辑、代码理解和推理技能,为金融和数据分析等实际场景提供了坚实的技...
借势大模型,科大讯飞走出低谷了吗?
科大讯飞作为AI1.0公司,全情投入大模型的研发,尽管2023年营业收入和净利润有所增长,但扣除非经常性损益后的净利润大幅下降,现金流状况也不乐观。进入2024年,第一季度出现净亏损,亏损幅度扩大。科大讯飞在通用人工智能认知大模型上的巨额投资尚未显现显著成效,导致利润受到挤压。公司在大模型、国产算力底座和产业配套方面投入巨大,特别是星火大模型,已历经多次迭代,逐步追赶上行业领先水平。尽管与头部公司仍有差距,但科大讯飞在行业落地方面展现出了优势,特别是在教育、医疗等领域。公司计划通过星火大模型的持...
AI在用| 没错,树莓派5也能飙上Llama 3了!
在人工智能领域,以大模型和AIGC为代表的创新技术正在逐步重塑我们的生活方式和工作模式。为了帮助大众更好地理解和应用AI,我们推出「AI在用」栏目,分享直观、趣味且实用的AI案例,旨在揭示AI的运用方法,启发人们的思考。最近,Meta发布了Llama 3,被誉为“最强开源大模型”,在多项指标上超越其他领先模型,尤其擅长代码生成。Llama 3包括8B和70B两种参数规模版本,吸引了众多网友尝试。其中,一位名为@adamcohenhillel的网友成功在价格低廉的树莓派5上运行了Llama 3 8B模型,实现每秒1.89个token的速度,支持8K上下文窗口...
48小时烧脑角逐,吃住赛场,国内首个大模型极限挑战赛落幕
ATEC2023科技精英赛圆满结束,聚焦“科技助老”主题,开创了国内首个以大模型为基础的真实场景应用比赛。在48小时的紧张角逐后,东南大学、哈尔滨工业大学和华中科技大学的四位选手荣获冠军,并分享了100万元奖金。比赛通过《燃烧吧!天才程序员4》节目展示详细过程,吸引了众多顶尖高校参与,包括清华大学与蚂蚁集团共同设题。参赛者需利用大模型技术解决老年人异地就医的实际难题,如文档检索和用户需求响应。 此次比赛报名人数和名校选手比例均创新高,核心挑战集中在大模型的可用性、安全性和高效能。蚂蚁集团基础智能部...
商汤发布日日新5.0大模型 综合能力全面对标GPT-4
近日,商汤科技在其官方网站上推出了重大更新——全新的SenseNova5.0大模型,这是一款采用尖端MOE混合专家架构的AI模型,经过海量训练数据的洗礼,拥有200K的推理上下文窗口,实力直逼GPT-4 Turbo。商汤科技的董事长兼CEO徐立在发布会上强调,日日新5.0大模型在综合性能上已能与GPT-4相媲美,它的诞生不仅彰显了商汤科技的技术领先地位,更为生成式AI在各行业的广泛应用铺平了道路。 商汤的“日日新SenseNova”体系覆盖了多种功能,包括自然语言处理、图像生成、自动数据标注和定制模型训练等。此外,商汤还自主研发了中文语言...
大模型开源还是闭源好,周鸿祎与李彦宏针尖对麦芒
在大模型的开源与闭源之争中,360创始人周鸿祎与百度创始人李彦宏发表了不同的看法。李彦宏认为闭源大模型在能力和商业模式上优于开源,而开源可能无法聚集足够的资源。在百度AI开发者大会上,他进一步指出开源模型可能会落后。周鸿祎则坚信开源的力量,认为开源模型能推动技术进步,且发展迅速。然而,尽管开源模型在某些方面取得进步,如Llama3,但目前它们在技术和应用上仍落后于闭源模型,如GPT-4、Claude-3和Gemini Ultra。 周鸿祎支持开源可能是为了360智脑在市场竞争中的位置,鼓励创业者使用开源模型,避免重复研发...