4. DNNの動向(1/8)
• DNN時代以前の動向
– Perceptron, MLP, Neocognitron, BackProp, CNN
– DNNが流⾏る前の画像認識では局所特徴が使⽤
1st AI 2nd AI 3rd AI
F. Rosenblatt et al. “Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms” in 1961.
Rumelhart et al. “Learning representations by back-propagating errors” in Nature 1986.
K. Fukushima, “Neocognitron: A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position”, in
1980
Y. LeCun et al. “Gradient-based learning applied to document recognition” in IEEE 1998.
37. 引⽤されそうな論⽂(5/18)
• Learning from Simulated and Unsupervised Image
through Adversarial Training(CVPR Best Paper)
– 合成画像を現実に近づけるRと実画像/合成画像を⾒分ける
Dの繰り返しにより合成画像をよりリアルにする
– 学習データとして使⽤すると識別器の精度が向上
少量の実画像があれば⼤規模データの作成可能?
79. Shuran Song, Fisher Yu, Andy Zeng, Angel X. Chang, Manolis Savva,
Thomas Funkhouser, “Semantic Scene Completion from a Single Depth
Image”, in CVPR, 2017. (oral)
【18】
Keywords: 3D Completion, Semantic Segmentation
新規性・差分
概要
・KinectのようなDepthセンサにより⽣じる(計測に
対して物体の反対側の)⽋損を、3Dのセマンティック
セグメンテーションを⽤いて補完する研究。オクルー
ジョン(e.g. 異物体同⼠、セルフオクルージョン)や
計測による⽋損が⽣じていても意味情報を使⽤して
CNN(Semantic Scene Completion Network:
SSCNet)により⽋損を補うモデルとした。学習は意味
情報・⽋損を含む距離空間・(簡易的な)3次元モデル
とした。
・Depthの⽋損を補完するネットワークである
SSCNetを提案
・意味情報・⽋損を含む距離空間と3次元モデルを
対応付けて学習することにより⽋損を補完するモ
デルとした
・右下図ではGT・SSCNetによる推定・(GTとの)
差分が⽰されている
Links
論⽂ https://arxiv.org/pdf/1611.08974.pdf
プロジェクト http://sscnet.cs.princeton.edu/
コード https://github.com/shurans/sscnet
動画 https://www.youtube.com/watch?v=Yjpmouaap6M
80. Tommaso Cavallari, Stuart Golodetz, Nicholas A. Lord, Julien Valentin,
Luigi Di Stefano, Philip H. S. Torr, “On-the-Fly Adaptation of Regressioin
Forests for Online Camera Relocalisation”, in CVPR , 2017. (oral)
【19】
Keywords: Camera Pose Estimation, Random Forests
新規性・差分
概要
カメラ姿勢推定をランダムフォレスト(Regression Forests)
にて⾏う研究である。対応点のマッチングは2D(RGB and
D)から3Dの空間に対して⾏う。推定された2D-3Dの対応
点はKabsch[17]やRANSAC[8]により3次元のカメラ姿勢推
定を⾏う。あらかじめ学習したモデルが⼿に⼊ればカメラ姿
勢推定は⾼速(under 150 ms)に⾏われる。
・2Dから3Dのカメラ姿勢推定をランダムフォレストによ
り⾼速(150ms)に⾏った
・右側の表は7-Scnees dataset[34]の結果である
Links
論⽂ https://arxiv.org/pdf/1702.02779.pdf