语言:
🇨🇳
🇺🇸
«C3D» 复现了论文Learning Spatiotemporal Features with 3D Convolutional Networks
提出的视频分类模型
C3D
扩展了卷积核的维度,通过加入时间维度,将卷积核从空间感受野(HxW
)扩展到时空感受野(TxHxW
),能够有效的捕捉视频片段中的动作信息
训练命令如下:
$ export CUDA_VISIBLE_DEVICES=1
$ export PYTHONPATH=.
$ python tools/train.py --config_file configs/c3d_hmdb51.yaml
本工程使用了PyTorch
实现的HMDB51
和UCF101
数据集类,其解析和加载速度非常慢
- zhujian - Initial work - zjykzj
欢迎任何人的参与!打开issue或提交合并请求。
注意:
GIT
提交,请遵守Conventional Commits规范- 语义版本化,请遵守Semantic Versioning 2.0.0规范
README
编写,请遵守standard-readme规范
Apache License 2.0 © 2020 zjykzj