标签:视频异常检测
突破不可解释性!视频异常新检测框架精度90.67%拿下SOTA|华科&百度&密歇根大学
华中科技大学、百度和密歇根大学的研究团队联合推出了一款名为Holmes-VAD的创新视频异常检测框架,该框架不仅能够精准定位视频中的异常行为,还能提供详尽的异常分析和解释。这款系统借鉴了福尔摩斯的侦探智慧,能够在监控视频中快速识别出异常事件,如交通事故、爆炸等,并能给出合理的事件描述。 Holmes-VAD利用视频多模态大模型进行微调,结合精确的时序监督和丰富的多模态指令,以实现异常检测的高精度和全面解释。为支持这一框架,团队还创建了首个大规模多模态VAD指令数据集——VAD-Instruct50k,包含半自动数据引擎生...