基于局部多片段的轻量级行为识别网络MLNet

   发布时间: 2022-07-09    访问次数: 17

《基于局部多片段的轻量级行为识别网络MLNet

技术简介:

针对传统3D卷积神经网络(CNN)对医学和自然场景视频中的动作识别存在输入片段帧数少、正向推理速度慢、网络层数浅、参数量和计算量大的问题,基于2D深度卷积和1D卷积设计了局部时空深度分离卷积模块(LSDW)和时序卷积模块(TCM),进而提出了轻量级局部多片段网络MLNet。首先,MLNet的输入是视频中的多个局部片段,这些片段通过间隔采样得到;其次,将输入中的多个局部片段通过LSDW提取相应的时空特征;最后,通过TCMLSDW输出特征在时序维度进行融合,得到视频动作的全局表示。实验结果表明,利用该方法在公开数据集UCF101HX上测试,其识别精度分别达到了76%94.23%,与时序3D卷积网络方法(T3D)相比,识别率分别至少提升了4.894.6个百分点,在拥有低的参数量和计算量的同时提高了识别精度和网络的正向推理速度。


研发人员:徐传淇;姚宇;王浩然;胡智翔;徐传健;