智谱又有新AI模型上线了

智谱公司在29日下午的KDD2024会议上,悄然推出了多项重大更新。作为一名从泰国刚回来的技术爱好者,本打算休息一天,结果晚上又被迫加班研究这些新功能。智谱总是能在不经意间带来惊喜,这次也不例外。

大语言模型GLM-4-Plus

首先介绍的是全新的大语言模型GLM-4-Plus。经过测试,该模型的整体性能几乎与GPT-4持平,特别是在AlignBench(对齐和遵循指令能力)和MATH(数学能力)方面表现突出。此外,在长文本处理方面,GLM-4-Plus的表现也十分出色。例如,它能够准确解决复杂的调休问题以及经典的“农夫过河”问题。虽然价格略高于Claude 3.5,但其性能值得信赖。

图像和视频理解模型GLM-4V-Plus

接下来是图像和视频理解模型GLM-4V-Plus。这款模型不仅支持视频理解,还能直接将网页内容转换为HTML代码。虽然在MMMU-Val(多模态和多任务理解能力)方面稍显不足,但在其他功能上表现优异。遗憾的是,目前后台测试还不支持视频上传,希望未来能有所改进。

AI绘图模型CogView-3-Plus

智谱还更新了AI绘图模型CogView-3-Plus。尽管在细节和美感上仍有提升空间,但相较于之前的版本已经有了显著进步。虽然与Flux和Midjourney相比仍有一定差距,但在艺术性和实用性方面已有所改善。

智谱清言新增“视频通话”功能

最后值得一提的是智谱清言新增的“视频通话”功能。作为国内首个类似GPT-4的视频通话应用,用户可以通过摄像头与AI进行实时互动。尽管声音仍然有明显的TTS延迟,但能够随时打断并快速切换话题,使得这一功能具有很高的实用性。目前该功能仍在内测阶段,有兴趣的用户可以通过特定链接申请使用。

总体而言,智谱公司的这些新功能和技术令人印象深刻。与其他一些只停留在概念阶段的产品不同,智谱真正实现了技术的落地应用。希望未来能看到更多类似的创新。

本文来源: ​数字生命卡兹克公众号【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...