谷歌开源 Magika:毫秒级识别内容类型,百万文件测试准确率超 99%

谷歌开源AI新成果:Magika,提升文件识别效能

谷歌近期公开了一项重大进展,他们决定开源其创新项目——Magika,这是一款运用人工智能技术实现快速且精准的文件格式和内容识别工具。Magika的源代码现已在GitHub上开放,供全球开发者参考和使用。

Magika的核心是一个特别设计并高度优化的深度学习模型,能在CPU上运行时,在极短的几毫秒内确定文件类别。据谷歌透露,经过对超过100万份涵盖100多种格式的文件进行基准测试,Magika的表现超越现存工具约20%,准确性和召回率均高达99%以上。

在实际应用中,谷歌已借助Magika强化了用户安全。它已被广泛应用于Gmail、Drive及安全浏览,确保文件能被正确地送往安全和内容策略扫描器。相较于依赖人工规则的传统系统,Magika使文件类型的识别精度提升了50%。

此外,谷歌计划将Magika整合进VirusTotal,以增强其代码洞察功能的效率和准确性。Magika将在Code Insight分析文件前进行预过滤,而Code Insight则利用谷歌先进的生成式AI技术来检测潜在的恶意代码。

如需了解更多详情,可查阅谷歌官方发布的完整博文。请注意,本文中可能包含的外部链接仅用于提供更多信息,所有IT之家的文章均遵循这一声明。

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...