FC2ブログ
--.--.-- --:-- | EDIT
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
Category: スポンサー広告
Permanent Link | Comment(-) | Trackback(-) | PageTop↑
2014.11.25 23:50 | EDIT
J.C.Niebles, H. Wang, L. Fei-Fei, “Unsupervised Learning of Human Action Categories Using Spatial-Temporal Words”, in IJCV2008.

トピックモデリングを用いた行動認識特徴量の分解であり,学習ステップと識別ステップに分けられます.

学習ステップ:特徴量にはDollarらのCuboid Feature[Dollar, PETS2005]を適用する.Cuboid Featureはxyt空間におけるxy特徴点のt方向特徴点追跡とその周辺領域からの特徴記述である.Bag-of-words(BoW)化した特徴量をトピックモデリングの入力とする.トピックモデリングでは基本的に非ゼロのBoWの番号を入力としており,各トピックに含まれるWord番号が出力として返却される.(例:Topic1: BoW1, BoW2, Topic2: BoW2, BoW3) あらかじめCuboid Featureにより構成されたBoWをトピックモデリングにより解析して各トピックとWord番号を分解しておく.この論文では,各トピックがそれぞれの行動の特徴的な動作(ここでは行動 > 動作として扱う)として抽出される.

識別ステップ:入力ベクトルvが入力された時にどのトピックに一番似ているかの判断を行い認識を行う.入力ベクトルは学習ステップと同じくCuboid FeatureをBoW化したベクトルである.トピックモデルにより分解された特徴は例として「腕を上下に振る」や「歩行時の足の往復」等,プリミティブな要素を抜き出している.一番の特徴的な動作要素を抜き出すことにより,余計な特徴の評価をする必要がなく,精度を向上させている.

ここで評価されているデータセットであるKTH datasetでは6種類の行動(walking, jogging, running, boxing, hand waving, hand clapping)であり,どれも簡単な動作要素により構成されているため,特徴も分解しやすく精度が上がったとみられる.この論文で使用されている他のデータセットについても同じことが言える.


現在の行動認識の特徴からすると,比較的スパースでありノイズも多少なりとも含まれているものの,それをトピックに分解してベストマッチする動作要素のみで比較するというかなり上手く設定されている手法だと感じました.ノイズの除去や有効な特徴量での比較を同時に達成して,特徴量の部分集合適用でより効果的な手法としているところに強みを感じます.Nieblesらは2006年に初期版の論文を出していますが,IJCVのジャーナル版ではトピックモデルにpLSAだけでなくLDAを適用しても同じような結果が得られることや,特徴量の評価を重点的にやっているようですね.

スポンサーサイト
コメント:
コメント:を投稿する

トラックバック:
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。