Apache MXNet 教程¶
有兴趣开始接触新的计算机视觉 (CV) 领域?这里有一些教程可帮助你入门。
注意:对于图像分类或目标检测任务,请随意探索 AutoGluon MultiModalPredictor 中的教程,该工具在 PyTorch 中提供更好的支持。
图像分类¶
关于如何在 CIFAR10 上使用预训练模型并将其应用于真实图像的基础知识
CIFAR10 上的分类模型训练实践
关于如何在 ImageNet 上使用预训练模型并将其应用于真实图像的基础知识
使用 ImageNet 预训练模型在自己的数据集上进行训练。
ImageNet 上的分类模型训练实践
目标检测¶
使用预训练的 SSD 模型检测真实世界图像中的目标
Pascal VOC 数据集上的 SSD 模型训练实践
提升 SSD 模型性能的训练技巧。
使用预训练的 Faster R-CNN 模型检测真实世界图像中的目标
在 Pascal VOC 上进行端到端 Faster R-CNN 训练
使用预训练的 YOLO 模型检测真实世界图像中的目标
Pascal VOC 数据集上的 YOLOv3 模型训练实践
在自己的数据集上微调预训练模型。
在网络摄像头上运行目标检测模型。
实例分割¶
使用预训练的 Mask R-CNN 模型对真实世界图像执行实例分割
MS COCO 数据集上的 Mask R-CNN 模型训练实践
语义分割¶
使用预训练的 FCN 模型对真实世界图像执行语义分割
Pascal VOC 数据集上的 FCN 模型训练实践
使用预训练的 PSPNet 模型对真实世界图像执行语义分割
ADE20K 数据集上的 PSPNet 模型训练实践
使用预训练的 DeepLabV3 模型对真实世界图像执行语义分割
在 Pascal VOC 数据集上进行 DeepLabV3 模型训练,并达到最先进的准确率。
使用预训练的 ICNet 模型对真实世界图像执行语义分割
姿态估计¶
使用预训练的 Simple Pose 模型估计真实世界图像中的人体姿态
使用预训练的 AlphaPose 模型估计真实世界图像中的人体姿态
从你的网络摄像头视频流估计人体姿态
在 COCO 数据集上训练姿态估计模型
动作识别¶
使用预训练的 TSN 模型识别真实世界视频中的人体动作
UCF101 数据集上的 TSN 动作识别模型训练实践
使用预训练的 I3D 模型识别真实世界视频中的人体动作
Kinetics400 数据集上的 I3D 动作识别模型训练实践
使用预训练的 SlowFast 模型识别真实世界视频中的人体动作
Kinetics400 数据集上的 SlowFast 动作识别模型训练实践
在你自己的数据集上进行 SOTA 视频模型的微调实践
从预训练模型中提取自己视频的特征
使用预训练模型对你自己的视频进行推理并保存预测结果。
一个高效灵活的视频读取器,用于训练深度视频神经网络。
目标跟踪¶
使用预训练的目标跟踪模型估计真实世界视频中的单目标跟踪。
在 VID、DET、COCO、Youtube_bb 数据集上训练 SiamRPN 并在 Otb2015 上测试
使用预训练的 SMOT 模型在真实世界视频中执行多目标跟踪。
深度预测¶
使用 Monodepth2 从单张图像预测深度。
使用 Monodepth2 从图像序列或视频预测深度。
在 KITTI 数据集上训练 Monodepth2。
在 KITTI 数据集上测试 Monodepth2 PoseNet。
数据集准备¶
自动化模块¶
分布式训练¶
在 Kinetics400 数据集上进行 SlowFast 模型分布式训练的实践。