只需2张照片就能2D变3D，这个AI能自己脑补蜡烛吹灭过程，一作二作均是华人 | CVPR 2022

明敏 2022-05-16 13:20:28 来源：量子位

属实是另类拯救废片了

明敏发自凹非寺

量子位 | 公众号 QbitAI

2张废片啪地一合！

错过的精彩瞬间立刻重现，还能从2D升到3D效果。

看，小男孩可爱的笑容马上跃然浮现：

吹灭生日蛋糕蜡烛的瞬间也被还原了出来：

咧嘴笑起来的过程看着也太治愈了吧~

咱就是说，这回相机里熊孩子/毛孩子的废片终于有救了！

而且完全看不出是后期合成的效果，仿佛是原生拍摄的一般。

这就是谷歌、康奈尔大学、华盛顿大学最近联合推出的成果，能只用2张相近的照片还原出3D瞬间，目前已被CVPR 2022收录。

论文作者一作、二作均为华人，一作小姐姐本科毕业于浙江大学。

用2张照片正反向预测中间场景

这种方法适用于两张非常相似的照片，比如连拍时产生的一系列照片。

方法的关键在于将2张图片转换为一对基于特征的分层深度图像 （LDI），并通过场景流进行增强。

整个过程可以把两张照片分别看做是“起点”和“终点”，然后在这二者之间逐步预测出每一刻的变化。

具体来看，过程如下：

首先，将两张照片用单应矩阵（homegraphy）对齐，分别预测两张照片的稠密深度图。

然后将每个RGBD图像转换为彩色的LDI，通过深度感知修复背景中被遮挡的部分。

其中，RGB图像即为普通RGB图像+深度图像。

之后用二维特征提取器修复LDI的每个颜色层，以获取特征层，从而生成两份特征图层。

下一步就到了模拟场景运动部分。

通过预测两个输入图像之间的深度和光流，就能计算出LDI中每个像素的场景流。

而如果想要两张图之间渲染出一个新的视图、并提升到3D，在此需要将两组带特征值的LDI提升到一对3D点云中，还要沿着场景流双向移动到中间的时间点。

然后再将三维的特征点投影展开，形成正向、反向的二维特征图及对应深度图。

最后将这些映射与时间线中对应时间点的权重线性混合，将结果传给图像合成网络，就能得到最后的效果了。

实验结果

从数据方面来看，该方法在所有误差指标上，均高于基线水平。

在UCSD数据集上，这一方法可以保留画面中的更多细节，如（d）所示。

在NVIDIA数据集上进行消融实验表明，该方法在提高渲染质量上表现也很nice。

不过也存在一些问题：当两张图像之间的改变比较大时，会出现物体错位的现象。

比如下图中酒瓶的瓶嘴移动了，不该发生变化的酒杯也摇晃了起来。

还有照片如果没有拍全的地方，在合成的时候难免会出现“截肢”的情况，比如下图中喂考拉的手。

团队介绍

该研究的一作为Qianqian Wang，现在在康奈尔大学读博四。

她本科毕业于浙江大学，师从周晓巍。

研究兴趣为计算机视觉、计算机图形学和机器学习。

二作是Zhengqi Li，博士毕业于康纳尔大学，本科毕业于明尼苏达大学，目前在Google Research。

曾获提名CVPR 2019最佳论文，谷歌2020博士奖研金，2020年Adobe Research奖学金，入围百度2021年AI华人新星百强榜单。

参与此项研究的还有华盛顿大学教授Brian Curless。

他还提出过另一种方法能够实现类似效果，同样只用到了2张照片，通过新型帧插值模型生成连贯的视频。

论文地址：
https://3d-moments.github.io/

CVPR 2022

明敏

只需2张照片就能2D变3D，这个AI能自己脑补蜡烛吹灭过程，一作二作均是华人 | CVPR 2022

用2张照片正反向预测中间场景

实验结果

团队介绍

相关阅读

根据文本描述从视频中"抠图"，Transformer:这种跨模态任务我最擅长

评审关上了你CVPR的门？这还有Rebuttal的窗，7个小技巧送上

CVPR大会现场纪念孙剑博士，最佳学生论文授予同济阿里，李飞飞获黄煦涛纪念奖

视频P图新SOTA：推理速度快近15倍，任意分辨率均可上演人像消失大法，来自南开大学｜CVPR 2022

商汤科技CVPR 2022再创佳绩用技术创新直击行业痛点

韩国AI团队抄袭震动学界！1个导师带51个学生，还是抄袭惯犯

热门文章

国产之光DeepSeek把AI大佬全炸出来了！671B大模型训练只需此前算力1/10，细节全公开

生成式AI技术栈排名，沙利文：商汤科技中国第一

OpenAI科学家：现有模型+后训练足以产生黎曼猜想的新证明

联想与火山引擎官宣合作，为AI桌面助手接入豆包大模型

大规模多构型具身智能新数据集和基准：5.5万条机器人轨迹数据，279项不同任务

只需2张照片就能2D变3D，这个AI能自己脑补蜡烛吹灭过程，一作二作均是华人 | CVPR 2022

用2张照片正反向预测中间场景

实验结果

团队介绍

相关阅读

根据文本描述从视频中"抠图"，Transformer:这种跨模态任务我最擅长

评审关上了你CVPR的门？这还有Rebuttal的窗，7个小技巧送上

CVPR大会现场纪念孙剑博士，最佳学生论文授予同济阿里，李飞飞获黄煦涛纪念奖

视频P图新SOTA：推理速度快近15倍，任意分辨率均可上演人像消失大法，来自南开大学｜CVPR 2022

商汤科技CVPR 2022再创佳绩 用技术创新直击行业痛点

韩国AI团队抄袭震动学界！1个导师带51个学生，还是抄袭惯犯

热门文章

国产之光DeepSeek把AI大佬全炸出来了！671B大模型训练只需此前算力1/10，细节全公开

生成式AI技术栈排名，沙利文：商汤科技中国第一

OpenAI科学家：现有模型+后训练足以产生黎曼猜想的新证明

联想与火山引擎官宣合作，为AI桌面助手接入豆包大模型

大规模多构型具身智能新数据集和基准：5.5万条机器人轨迹数据，279项不同任务

商汤科技CVPR 2022再创佳绩用技术创新直击行业痛点