読者です 読者をやめる 読者になる 読者になる

gocha124の日記

ごちゃごちゃ書きます

コンピュータビジョン

オライリーのコンピュータビジョンを読みました。

職場でまわりの人たちが画像認識、画像分析をやってるのですが、チンプンカンプンだったので勉強です。

画像からの特徴量抽出、画像分割、物体認識のさわりがぼんやりわかりました。今回読んだだけなのですが、pythonによるサンプルコードが充実しているので、理解の定着には是非手を動かしてみるとよいと思います。が動かせてません。

 

以下内容備忘のキーワードメモ。

 

2.画像の局所記述子
Harrisコーナー検出器
SIFT

 

3.画像間の写像

アフィン変換

 

4.カメラモデルと拡張現実感
カメラキャリブレーション
姿勢推定

 

5.多視点幾何学
エピポーラ線
エピ極
エピポーラ幾何
SVDで最小二乗推定

 

6.画像のクラスタリング
k平均法
階層クラスタリング
スペクトラルクラスタリング
特徴量ベクトルに平均RGB値とPCA係数

 

7.画像検索
SIFT記述子のような局所記述子
ビジュアルワード
bag_of_visual_wordrモデル

 

8.画像認識
k近傍法
密なSIFT特徴量ベクトル
ベイズ分類器
次元削減にPCA
SVM
多クラス問題の例、数独光学文字認識
マスの抽出、枠線
画像の位置合わせ

 

9.画像の領域分割(セグメンテーション)
前景、背景。個々の物体。
グラフカット

 

10.OpenCV
SURF特徴量
オプティカルフローは2枚の連続する画像間での物体の動き。画像上での移動を表す2Dのベクトル場
動画圧縮、動き推定、物体追跡、画像の領域分割に応用
コーナーの特徴点を追いかける

 

以上。

 

 

実践 コンピュータビジョン

実践 コンピュータビジョン