使用卷积神经网络计算立体匹配成本的过程; 在立体匹配任务中训练卷积神经网络的步骤; 和 基本立体方法(基于交叉的成本聚合、半全局匹配、, 左右一致性检查、中值滤波器和双边滤波器);
@文章{zbontar2016立体声, title={通过训练卷积神经网络来比较图像补丁的立体匹配}, author={Zbontar,Jure和LeCun,Yann}, journal={机器学习研究杂志}, 体积={17}, 页数={1--32}, 年份={2016年} }
$cp生成文件.proto生成文件 $制造
$wget-P净值/ https://s3.amazonaws.com/mc-cnn/net_kitti_fast_-a_train_all.t7(网址:https://s3.amazonaws.com/mc-cnn/net_kitti_fast_-a_train_all.t7) $ ./ main.lua kitti fast-a predict-net_name net/net_kitti_fast_a_train_all.t7-left samples/input/kittiL.png-right samples-input/kittiR.png-disp_max 70 向右书写。笔尖,1 x 70 x 370 x 1226 向左书写.bin,1 x 70 x 370 x 1226 书写显示框,1 x 1 x 370 x 1226
$luajit样本/bin2png.lua 正在写入left.png 向右书写.png 正在写入disp.png
$ ./ main.lua kitti fast-a predict-net_name net/net_kitti_fast_a_train_all.t7-left samples/input/kittiL.png-right samples-input/kittiR.png-disp_max 70-sm_terminate cnn 向右书写。笔尖,1 x 70 x 370 x 1226 书写左侧。笔尖,1 x 70 x 370 x 1226 书写显示框,1 x 1 x 370 x 1226
-
卢阿 需要“火炬” 左=焊炬。 浮子张量(火炬浮子存储('../left.bin')):视图(1,70,370,1226) 右=焊炬。 浮子张量(火炬浮子存储('../right.bin')):视图(1,70,370,1226) disp=火炬。 浮子张量(火炬浮子存储('../disp.bin')):视图(1,13701226) -
蟒蛇 将numpy导入为np left=np.memmap('../left.bin',dtype=np.float32,shape=(1,703701226)) right=np.memmap('../right.bin',dtype=np.float32,shape=(1,703701226)) disp=np.memmap('../disp.bin',dtype=np.float32,shape=(1,1371226)) -
Matlab语言 left=memmapfile('../left.bin','Format','single')。 数据; 左=排列(重塑(左,[1226 370 70]),[3 2 1]); right=memmapfile('../right.bin','Format','single')。 数据; 右=置换(重塑(右,[1226 370 70]),[3 2 1]); 视差=memmapfile('../disp.bin','Format','single')。 数据; 视差=重塑(视差,[1226 370])'; -
C类 #包括<fcntl.h> #包括<stdio.h> #包括<sys/mman.h> #包括<sys/stat.h> #包括<sys/types.h> int main(无效) { 整数fd; float*left、*right、*disp; fd=打开(“../left.bin”,O_RDONLY); left=mmap(空,1*70*370*1226*sizeof(浮点),PROT_READ,MAP_SHARED,fd,0); 闭合(fd); fd=打开(“../right.bin”,O_RDONLY); right=mmap(NULL,1*70*370*1226*sizeof(float),PROT_READ,MAP_SHARED,fd,0); 闭合(fd); fd=打开(“../disp.bin”,O_RDONLY); disp=mmap(空,1*1*370*1226*sizeof(浮点),PROT_READ,MAP_SHARED,fd,0); 闭合(fd); 返回0; }
这个 2012年KITTI 数据集并解压缩 进入之内 data.kitti/unzip (你应该以一个文件结束 data.kitti/unzip/training/image_0/000000_10.png )和 这个 KITTI 2015年 数据集并解压缩 进入之内 data.kitti2015/unzip (你应该以一个文件结束 data.kitti2015/unzip/training/image_2/000000_10.png ).
$ ./ 预处理_kitti.lua 数据集2012 1 ... 389 数据集2015 1 ... 400
$ ./ main.lua kitti slow-一列火车 基蒂慢-一列火车 转换(输入=1,输出=112,k=3) cudnn公司。 ReLU公司 转换(输入=112,输出=112,k=3) cudnn公司。 ReLU公司 转换(输入=112,输出=112,k=3) 库登。 ReLU公司 转换(输入=112,输出=112,k=3) 库登。 ReLU公司 nn。 重塑(128x224) nn。 线性(224->384) cudnn公司。 ReLU公司 nn。 线性(384->384) cudnn公司。 ReLU公司 nn。 线性(384->384) cudnn公司。 ReLU公司 nn。 线性(384->384) cudnn公司。 ReLU公司 nn。 线性(384->1) cudnn公司。 乙状结肠 ...
$ ./ main.lua kitti慢-一辆火车
$ ./ main.lua kitti2015慢速-一列火车
$ ./ main.lua kitti fast-一列火车
净额$ls/ ... net_kitti2012_fast_action_train_tr.t7 ...
$ ./ 下载_ middlebury.sh
$mkdir data.mb.不完美_灰色 $ ./ 预处理_mb.py不完美灰色 阿迪朗达克 背包 ... 测试H/楼梯
$ ./ main.lua mb slow-一列火车
$ ./ main.lua kitti fast-a test_te-net_name net/net_kitti法斯特-a_train_tr.t7 kitti fast-a test_te-net_name net/net_kitti_fast-a_train_tr.t7 0.86836290359497 0.0082842716717202 ... 0.73244595527649 0.024202708004929 0.72730183601379 0.023603160822285 0.030291934952454
$ ./ main.lua kitti fast-a test_te-网络名称net/net_mb_fast_a-train_all.t7 kitti fast-a test_te-net_name net/net_mb_fast_a-train_all.t7 2.1474301815033 0.0071447750148986 ... 1.4276049137115 0.024273838024622 1.4282908439636 0.01881285579564 1.408842086792 0.021741689597834 0.031564540460366
$ ./ main.lua kitti fast-a提交-net_name net/net_kitti_fast_a-train_all.t7 kitti fast-a提交-net_name net/net_kitti_fast-a_train_all.t7 加上:000038_10.png(平减0%) 添加:000124_10.png(收缩0%) ... 加上:000021-10.png(平减0%)
$ ./ main.lua kitti slow-一列火车tr-l1 2-fm 128-l2 3-nh2 512 基蒂慢-一列火车tr-l1 2-fm 128-l2 3-nh2 512 转换(输入=1,输出=128,k=3) cudnn公司。 ReLU公司 转换(输入=128,输出=128,k=3) cudnn公司。 ReLU公司 nn。 重塑(128x256) nn。 线性(256->512) cudnn公司。 ReLU公司 nn。 线性(512->512) cudnn公司。 ReLU公司 nn。 线性(512->512) cudnn公司。 ReLU公司 nn。 线性(512->1) cudnn公司。 乙状结肠 ...
$ ./ main.lua kitti快-一次 kitti快速-一次 转换(输入=1,输出=64,k=3) cudnn公司。 ReLU公司 转换(输入=64,输出=64,k=3) cudnn公司。 ReLU公司 转换(输入=64,输出=64,k=3) cudnn公司。 ReLU公司 转换(输入=64,输出=64,k=3) nn。 规格化2 nn。 立体声连接1 0.73469495773315
$ ./ main.lua kitti fast-a time-sm终止cnn kitti fast-a time-sm终止cnn 转换(输入=1,输出=64,k=3) cudnn公司。 ReLU公司 转换(输入=64,输出=64,k=3) cudnn公司。 ReLU公司 转换(输入=64,输出=64,k=3) cudnn公司。 ReLU公司 转换(输入=64,输出=64,k=3) nn。 规格化2 nn。 立体声连接1 0.31126594543457