智谱又有新AI模型上线了

智谱公司在29日下午的KDD2024会议上，悄然推出了多项重大更新。作为一名从泰国刚回来的技术爱好者，本打算休息一天，结果晚上又被迫加班研究这些新功能。智谱总是能在不经意间带来惊喜，这次也不例外。

大语言模型GLM-4-Plus

首先介绍的是全新的大语言模型GLM-4-Plus。经过测试，该模型的整体性能几乎与GPT-4持平，特别是在AlignBench（对齐和遵循指令能力）和MATH（数学能力）方面表现突出。此外，在长文本处理方面，GLM-4-Plus的表现也十分出色。例如，它能够准确解决复杂的调休问题以及经典的“农夫过河”问题。虽然价格略高于Claude 3.5，但其性能值得信赖。

图像和视频理解模型GLM-4V-Plus

接下来是图像和视频理解模型GLM-4V-Plus。这款模型不仅支持视频理解，还能直接将网页内容转换为HTML代码。虽然在MMMU-Val（多模态和多任务理解能力）方面稍显不足，但在其他功能上表现优异。遗憾的是，目前后台测试还不支持视频上传，希望未来能有所改进。

AI绘图模型CogView-3-Plus

智谱还更新了AI绘图模型CogView-3-Plus。尽管在细节和美感上仍有提升空间，但相较于之前的版本已经有了显著进步。虽然与Flux和Midjourney相比仍有一定差距，但在艺术性和实用性方面已有所改善。

智谱清言新增“视频通话”功能

最后值得一提的是智谱清言新增的“视频通话”功能。作为国内首个类似GPT-4的视频通话应用，用户可以通过摄像头与AI进行实时互动。尽管声音仍然有明显的TTS延迟，但能够随时打断并快速切换话题，使得这一功能具有很高的实用性。目前该功能仍在内测阶段，有兴趣的用户可以通过特定链接申请使用。

总体而言，智谱公司的这些新功能和技术令人印象深刻。与其他一些只停留在概念阶段的产品不同，智谱真正实现了技术的落地应用。希望未来能看到更多类似的创新。

本文来源：