标签:OCR识别

OpenBMB的MiniCPM-V2.6:一款国内领先的多模态大模型,超越GPT-4V,集OCR识别与视频理解于一体,已获超9000颗星认可

国内知名的开源社区OpenBMB近期推出了其最新研发的开源多模态大模型——MiniCPM-V2.6。这款模型拥有80亿参数,在单图像、多图像以及视频理解等方面的表现超越了GPT-4V;尤其在单图像理解上,其效果优于GPT-4o mini、Gemini1.5Pro 与 Claude3.5Sonnet 等同类模型。MiniCPM-V2.6不仅显著降低了模型的内存占用,还提高了推理效率,并且首次实现了在iPad等移动端设备上进行实时视频理解。 MiniCPM-V2.6基于SigLip-400M和阿里云的Qwen2-7B模型进行开发,相较于之前的版本V2.5,性能有了显著提升,并新增了多图像和视频理解的功能。...

防范信息泄露与安全风险:国家安全部警示文件传输助手及AI写作小程序的潜在云端存储隐患与OCR识别技术滥用问题

在日常的工作和生活中,许多人为了提高效率,常常借助各种便捷的小工具,例如微信中的“文件传输助手”功能。它可以帮助用户轻松地在不同设备间传输文件资料,极大地方便了我们的生活。然而,值得注意的是,这类工具在带来便利的同时也可能带来安全隐患,特别是对于涉及敏感信息的文件来说。 根据国家安全部公众号披露的信息,近年来由于使用在线办公工具而引发的失密事件频发,这暴露出了许多潜在的安全风险。以“文件传输助手”为例,该功能允许用户将文件存储在云端,从而可以在多种设备上访问这些文件。尽管这一特性极大地...