《日経Robo》キヤノンが取り組んだディープラーニング技術とは

図3 CNN-SLAMの処理の流れ 入力のRGB映像からキーフレームのみを抽出し、学習済みのCNNで距離画像を推定。その後、その距離画像をRGB-D向けvisual SLAMに掛け、複数フレームの運動視差などを基にしたグローバルな3次元復元を行う。CNNの学習時には、RGB画像を入力、距離画像を教師データとして使う。CNNはGPU、vSLAMはCPU上に実装した。(写真:TUM)
図3 CNN-SLAMの処理の流れ
入力のRGB映像からキーフレームのみを抽出し、学習済みのCNNで距離画像を推定。その後、その距離画像をRGB-D向けvisual SLAMに掛け、複数フレームの運動視差などを基にしたグローバルな3次元復元を行う。CNNの学習時には、RGB画像を入力、距離画像を教師データとして使う。CNNはGPU、vSLAMはCPU上に実装した。(写真:TUM)

カーソルキー(←/→)でも操作できます