支付宝推出AI应用“探一下”:开启视觉搜索新时代
最近,支付宝App中悄然上线了一款全新的AI应用——“探一下”。用户只需在“扫一扫”页面下方切换至“探一下”,即可体验其丰富的功能。与传统的识物、搜题等视觉搜索应用不同,“探一下”的核心亮点在于探索。它不仅能够识别物体,还能提供更深入的知识和灵感,成为用户的随身“视觉百科全书”。
多样化的应用场景
无论是在博物馆参观画作,还是在户外踏青时识别花朵,“探一下”都能提供详细的历史背景、艺术风格或植物信息。此外,它还可以识别同款商品、提供药物使用指南、翻译外文菜单,并链接到支付宝的丰富商业生态,如用车、医疗等服务,极大地拓展了使用场景。
探灵感功能:个性化配文与定制滤镜
当切换至“探灵感”模式时,“探一下”可以根据不同场景灵活生成文案,幽默、治愈等多种风格任选。在宠物、办公等场景下,还有“读心”、“卷王”等定制滤镜,为用户提供了更多晒图灵感。
从判别式到生成式的视觉搜索变革
随着GenAI(生成式AI)技术的发展,视觉搜索正经历着范式的转变。过去,视觉搜索主要依赖于图像识别技术,而现在则转向了多模态大模型驱动的智能推荐。谷歌的Google Lens已经成为全球最受欢迎的视觉搜索产品之一,每月调用量超过200亿次。在国内,支付宝推出的“探一下”有望成为对标甚至超越Google Lens的现象级产品。
视觉搜索赛道的竞争与突破
近年来,视觉搜索逐渐成为互联网科技企业的重点发力方向。相较于传统的文字搜索引擎,视觉搜索能提供更为直观和丰富的用户体验,激发新的创意与灵感。然而,国内尚未出现现象级的视觉搜索产品,许多厂商的产品仍停留在“识你所见”的阶段,未能实现全面破圈。
GenAI重新定义视觉搜索
在GenAI技术的推动下,视觉搜索不再仅仅是信息检索工具,而是进化为能够理解用户意图、提供个性化、激发创意灵感的下一代生成式视觉搜索。谷歌旗下的视觉搜索产品已经深度融合了大模型,支持视频提问、语音提问等功能,提供了更加智能的交互体验。苹果也在新款iPhone中加入了类似的视觉智能功能。
“探一下”的技术创新
“探一下”采用了多模态大模型结合mRAG(多模态检索增强生成)、基础视觉算法和Agent能力的技术方案,实现了快速响应和高精度识别。它不仅能识别特定场景中的多个主体,还能通过预训练的文本模板即时生成个性化的文案。同时,“探一下”在隐私与安全方面保持了金融级的安全合规标准。
链接支付宝生态:无限可能
作为支付宝生态系统的一部分,“探一下”不仅可以接入小程序、智能体等交互形式,还能与其他AI管家服务联动,如健康管家、生活管家等。未来,“探一下”将不断扩展应用场景,如旅游、户外、亲子等领域,进一步丰富生态,并在无障碍辅助等方面发挥更大的社会价值。
结语:“探一下”引领未来趋势
在生成式AI时代,视觉搜索将成为连接用户、信息、商业和服务的重要桥梁。蚂蚁集团入局AI视觉搜索,标志着其AI First战略的进一步加速。支付宝的“探一下”正在探索下一代AI视觉搜索的新范式,有望让AI像扫码支付一样便利每个人的生活,带来更智能、更丰富的服务体验。