数学,作为人类智慧的结晶,不仅是知识活动留下的有力工具,更是许多现象的根源。爱因斯坦曾说过:“纯数学在某种意义上,是逻辑思想的诗篇。”上周,Kimi庆祝了其上线一周年,月之暗面为此举办了一场线下媒体会。会上,Kimi发布了其最新的数学推理模型——k0-math,该模型旨在全面对标O1。
根据Kimi官方的测试结果,k0-math在处理高难度竞赛题以外的数学问题上,表现优于O1-mini和O1-preview。作为一个体验派,我通常不会在没有亲身体验的情况下撰写评测。因此,尽管我很想在当天就写一篇评测,但还是决定等到亲自体验后再分享。
终于,在上周末的早晨,我收到了Kimi团队的消息,迫不及待地打开了应用。左侧的侧边栏上出现了一个戴眼镜的小图标,那就是k0-math。我立刻开始了测试,与Kimi数学版进行了两天的互动。
测试结果显示,k0-math在数学推理和逻辑能力方面表现出色。虽然在高难度竞赛题(如AIME)上的正确率略低于O1,但在普通高数题和一些复杂问题上,k0-math的正确率非常高。更令人印象深刻的是,Kimi不仅能够提供正确的答案,还能展示完整的思维链,甚至带有“通人性”的感觉。
例如,当我问k0-math“1+1等于多少”时,它不仅给出了正确答案,还从多个角度进行了详细的推理,包括不同的进制、空间向量、哲学、形式数学和集合论等。这种多层次的思考方式让人感到仿佛在与一位严谨的数学家对话。
此外,k0-math在实际生活中的应用也非常有趣。例如,它可以科学地计算“拼多多砍一刀”的成功率,甚至用数学公式帮助用户决定第二天是否出门。这些独特的应用场景展示了k0-math的强大数学逻辑和思维能力。
总的来说,k0-math不仅在数学能力上表现出色,更重要的是,它展示了AI在“思考”方面的潜力。这种能力使AI不再仅仅是答案库,而是能够真正参与人类的思维过程,共同探索科学的奥秘。
本文来源: 数字生命卡兹克公众号【阅读原文】