Kimi最新推出的k1视觉思考模型

近日,一款新的AI技术引起了人们的关注。只需提供一张图片,这款AI就能推测出一个人的性格特征。不仅如此,通过分析用户的音乐播放列表,AI还能大致推测出用户近期的心理状态。这一切都得益于Kimi最新推出的k1视觉思考模型

距离Kimi推出上一款数学模型k0-math并成功挑战o1仅过去了一个月,k1便迅速问世。与之前的k0-math相比,k1不仅具备更强的推理能力,还增加了视觉分析功能。这意味着用户可以通过拍照上传题目,让k1直接进行解答,其在数理化领域的表现甚至宣称能够匹敌或超越Open AI的o1。

此前,我们在测试k0-math时,已经见识了其强大的解题能力,尤其是在数学逻辑推理方面。然而,面对一些复杂的几何题目,k0-math的表现略显不足。而此次的k1则弥补了这一短板,不仅能够准确解答高中几何题,还在物理题目上表现出色。

为了验证k1的实际能力,我们首先给它抛出了一道今年高考的几何题。k1对题目的解析非常细致,迅速联想到了余弦定理,并最终得出正确答案。随后,我们又测试了一道稍显复杂的题目,k1同样给出了正确的解题步骤和答案。

接下来,我们尝试了一道逻辑陷阱题:一个西瓜进价50元,卖价70元,老板收了100元假币,最后亏损多少?这道题看似简单,但许多网友给出了不同的答案。k1不仅准确识别了题目的陷阱,还综合考虑了假币、找零和成本等因素,最终得出正确答案:亏损80元。

此外,k1在逻辑推理题上的表现也非常出色,尽管其解题思路与标准答案有所不同,但最终答案无误。这些测试充分证明了k1的逻辑推理能力和视觉识别能力。

除了学术领域,k1的应用范围也非常广泛。例如,它可以分析古钱币的真伪,甚至还能根据房间图片给出风水建议。在健康方面,k1还能计算餐食的卡路里摄入量。更令人惊讶的是,k1还能通过电影截图猜出电影名称,甚至解释一些复杂的梗图。

k1的强大能力主要归功于其采用的“思维链”(Chain of Thought, COT)技术,该技术模拟人类大脑的思考方式,将复杂任务拆解后逐步解决。此外,通过强化学习技术,k1能够在不断试错中进化,从而达到最佳效果。

Kimi选择从数学入手开发推理模型,是因为数学能够锻炼人的逻辑思维能力。在掌握了数学逻辑的基础上,k1将这种能力扩展到物理、化学乃至日常生活中的各个方面。随着数据量的增长,这种基于强化学习的技术路径有望让模型实现更好的效果。

最终,无论模型使用了哪些技术,用户更关心的是其实际应用效果。Kimi通过结合长文本生成和强化学习技术,不断调整自身工具属性,以更好地满足用户需求。当技术能够切实解决实际问题时,才真正实现了其价值。

本文来源: 快科技【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...