映像メディア処理特論
第一回 チュートリアル
- 教科書輪読 + 課題演習
- 1章を1-2人で分担
- 発表者だけやって聞いてるだけだと悲しい
- ポジティブなコメント期待
- 授業前に質問, 不明点をリストアップして答える
- コンピュータビジョンは基礎理論・技術基盤の実験場
- プレゼン(3) + 態度(3)(質問, 姿勢) + レポート(4)
- オンラインなら毎回質問とか
ガイダンス
-
キャプション生成も触れるよ
-
ss2 カメラキャリブレーション
-
ss3: 3次元復元: フォトグラメトリー, 自動運転にも関連
-
ss4: AR, 位置姿勢の推定, SALM 位置同期
-
(ss5: 陰影情報から形を推測)
-
ss6: 近似最近傍探索の手法, CVと関係ない
-
ss7: マルコフ確率場: 統計寄り, 最適化より, 難しい
-
ss8: 凸最適化: ロバスト主成分分析
-
(ss9: 顔認識, 簡単)
-
(ss10: 人物属性認識)
-
ss11: 行動認識, CNN
-
(ss12: 重要領域, attention)
-
ss13: RGBDカメラ(e.g. Kinect)で物体認識
-
ss14: 動画キャプションの自動生成, 新しい, RNN
第二回
- 万能近似定理: NNが任意の関数を表現できる話
- 隠れそうのweighted出力が図示されている
- s1 > s2 の時多値関数になるのはバグ?
自動微分
記号微分↔ 数値微分
第4回
3次元復元: 光学投影の逆問題を解くことになる
推定手法を: SfM=Structure from Motion
ロボティクスではSLAM=自己位置推定と環境地図を推定
3.2 カメラ幾何の基礎知識
3.2.3 エピポーラ幾何
3次元を撮影した画像間には拘束条件がある
基礎行列 F: 画像座標系の拘束条件
基本行列 E: カメラ座標系の高速条件
8点アルゴリズム
5点アルゴリズムの方がアウトライア: 外れ値を含む確率が低い
RANSACと相性がいい