大域特徴

画像全体の特徴を表すもの.

ツェルニケモーメント

画像に対する回転不変特徴量. 回転および反転には強いが中心がずれるのと拡大縮小には弱い. ので位置合わせとスケール合わせは重要.

定義式

ツェルニケ多項式

ただしは偶数

ツェルニケモーメント

を画素値として, なので とする.

ツェルニケモーメントの大きさは回転不変である. あたりまでを使って類似度評価ができる.

高速化

ツェルニケ多項式は画素値に依存しないためあらかじめ計算しておくことが可能.

はm=0のとき常に1.

参考文献

  • Mukundan, Ramakrishman: "FAST COMPUTATION OF LEGENDRE AND ZERNIKE MOMENTS", Pattern Recoginition, Vol. 28, No. 9, pp. 1433-1442, 1995.
  • 杉村,飯国,足立:”ツェルニケモーメントを特徴量とする2次元動的計画法を用いたイメージマッチング”,電子情報通信学会論文誌 D-II Vol. J80-D-II No. 1 pp. 101-108, 1997.

Tamura features

人間の視神経の特性を考慮した特徴量.

特徴量の詳細

以下の六つの要素から特徴ベクトルを構成する.

Coarsness

まず各点の サイズの近傍の平均を求める. 1-32あたりまでを使う? 点 近傍の平均は以下のように求められる.

は点 のグレーレベル.

次に自分の点を中心として対称となる位置にある 重なり合うことの無い領域同士の平均の差分を 各方向において各点で計算する.

水平の場合は (???何方向くらいいるだろうか???)

次に各点において を最大化する を求め,ベストなウインドウサイズを求める. 1-Lはkの範囲.

最後に画像中の各ピクセルのの平均をとる. m,nは有効な画素範囲を示す.

(???Fとfの違いは何???)

Contrast

コントラストの定義は の gray-level spatial dependence matrix (???この上の定義は触れただけで使っていないのでは???)

画像中のグレーレベルの分布から 尖度を以下のように求める. は四次モーメント, は分散, は標準偏差. nは実験的に1/4がよいらしい.

Directionality

各画素のエッジのマグニチュードと角度を求める. はそれぞれ水平,垂直方向のPrewittフィルタをかけた画像.

次にヒストグラム を求める.

kは0から(n-1)まで. 且つ を満たす点の数.

元の文献ではn=16,t=12としている.

ここから を以下のように求める. はピークの数, のp番目のピーク, はp番目のピークの範囲, に関連した正規化要素, は0からn-1までの方向をあらわすコード.

ただし,ピークが二つ以上のときは考慮していない.

の三条件を満たすなら,そうでないなら. ここで はピーク の間の極小値の位置. はピーク の間の極小値の位置.

(???サイクリックなので成り立つということか???) (???二つのピークはどう決めるか???)

Line-likeness

の local direction co-occurrence matrix of points at distance. ここのnというのはDirectionalityで作ったnと同じ,つまりエッジ勾配の方向を表している. i,jもエッジ勾配の方向で,つまり画像中の各点において, ある点pにおける勾配方向がiであったときにその勾配方向にdだけ移動し, そのときの点qの勾配方向をjとする.これで(i,j)を決定できる. そのときのp,qにおける勾配の大きさがを満たすなら+1.

(???ここの解釈は果てしなく怪しい???) (???dの決め方についてはd=4でRosenfeldのd4距離関数を使っていると書いてあるように読める???)

Regularity

上の四つの各特長量の標準偏差から計算する. (???標準偏差はどうやって計算するの???) (???一般的かどうかを見ているということだから複数の画像から出揃ったところで計算するもの???)

Roughness

Coarsness と Contrast の和.従属変数?

参考文献

  • Tamura, H., Mori, S., & Yamawaki, T. (1978). Textural features corresponding to visual perception. IEEE Transaction on Systems, Man, and Cybernetics, 8(6), 460–472.

局所画像特徴(SIFTおよび眷属)

画像のある一点に対する特徴を表すもの. 特にSIFTは回転拡大について不変な特徴量として設計されている. 一方SIFTは特許が取得されており,その回避としてSURFが考案されたが, そのSURFも特許が取得されていたことが後に判明し, 現在ではその代替となる特徴量も複数提案されている.

SIFT

Scale Invariant Feature Transformation. ガウシアンの差分を用いた特徴量.一つの特徴点を128次元の特徴ベクトルであらわす. まったく異なる時刻,カメラ姿勢において取得された画像同士のマッチングを行うことができる. 考案者により特許が取得されている.

藤吉先生の解説が非常にわかりやすい. 後のSURFやFASTなども解説されている.

画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ - - 中部大学

アルゴリズム

以下の3つのプロセスからなる.

  • 特徴点検出
  • 特徴ベクトル計算
  • 特徴点マッチング

SIFT様のアルゴリズムと呼んでいるものはSIFTのアルゴリズムに倣っている.

特徴点検出

Differential of Gaussianをもちいて画像中の特徴点を検出する. 画像を倍しながら求めたLaplacian of Gaussianの差分を取りつつ, その際の拡大率=スケールを差分の極から求めている.

特徴ベクトル計算

特徴点検出の結果得られた座標とスケールを元に画像勾配から点の向きを計算し, その向きに沿って4x4に分割された窓を決め, 更にそれぞれの窓の中で8方向の勾配のヒストグラムをとる. つまり4x4x8 = 128次元のヒストグラムが特徴ベクトルとして算出される.

特徴点マッチング

異なる画像間での特徴点対応は,単純にベクトル間の距離でとることができる.

参考

SURF

Speeded Up Robust Feature. SIFTと同様の機能を提供する. 特徴点検出でヘッセ行列を使い, 特徴ベクトル計算にHaar Waveletを使うところがSIFTと異なる. 4x4分割x4次元 = 64次元ベクトルで特徴ベクトルを構成する.

SIFTの特許を回避するために用いることができると目されていたが, 後にSURFも特許が取得されていたことが判明し,大問題となる.

参考