以下是用于深度预测任务的模型动物园。
KITTI 数据集¶
下表列出了在 KITTI 上训练的预训练模型。
提示
测试脚本 下载 test.py
可用于评估模型(KITTI RAW 结果使用官方服务器进行评估)。例如 monodepth2_resnet18_kitti_stereo_640x192
python test.py --model_zoo monodepth2_resnet18_kitti_stereo_640x192 --pretrained_type gluoncv --batch_size 1 --eval_stereo --png
注意
我们的预训练模型复现了近期最先进方法的成果。请查阅参考论文了解更多信息。
Modality
(模态)是指训练期间使用的方法。Stereo
(立体)表示我们使用立体图像对计算损失,Mono
(单目)表示我们使用单目图像序列计算损失,Mono + Stereo
(单目+立体)表示同时使用立体图像对和单目图像序列计算损失。
Resolution
(分辨率)是指训练期间模型的输入尺寸。640x192
表示我们将原始图像 (1242x375) 缩放到 640x192。
名称 |
模态 |
分辨率 |
绝对相对误差 |
delta < 1.25 |
哈希值 |
训练命令 |
训练日志 |
---|---|---|---|---|---|---|---|
monodepth2_resnet18_kitti_stereo_640x192 [1]_ |
立体 |
640x192 |
0.114 |
0.860 |
83eea4a9 |
||
monodepth2_resnet18_kitti_mono_640x192 [1]_ |
单目 |
640x192 |
0.121 |
0.858 |
c881771d |
||
monodepth2_resnet18_kitti_mono_stereo_640x192 [1]_ |
单目 + 立体 |
640x192 |
0.109 |
0.872 |
9515c219 |
PoseNet¶
Monodepth2 通过自监督方式同时训练深度和姿态模型。因此,我们在此也提供了我们预训练模型的复现结果。
提示
测试脚本 下载 test_pose.py
可用于评估模型(KITTI Odometry 结果使用官方服务器进行评估)。例如 monodepth2_resnet18_posenet_kitti_mono_stereo_640x192
python test_pose.py --model_zoo_pose monodepth2_resnet18_posenet_kitti_mono_640x192 --data_path ~/.mxnet/datasets/kitti/kitti_odom --eval_split odom_9 --pretrained_type gluoncv --batch_size 1 --png
请查看完整的教程 使用预训练 Monodepth2 Pose 模型从图像序列测试 PoseNet。
注意
我们的预训练模型复现了近期最先进方法的成果。请查阅参考论文了解更多信息。
Sequence 09
和 Sequence 10
分别表示模型在 KITTI Odometry 数据集的序列 9 和序列 10 上进行测试。结果显示平均绝对轨迹误差 (ATE) 和标准差,单位为米。
名称 |
模态 |
分辨率 |
序列 09 |
序列 10 |
---|---|---|---|---|
monodepth2_resnet18_posenet_kitti_mono_640x192 [1]_ |
单目 |
640x192 |
0.021±0.012 |
0.018±0.011 |
monodepth2_resnet18_posenet_kitti_mono_stereo_640x192 [1]_ |
单目 + 立体 |
640x192 |
0.021±0.010 |
0.016±0.010 |