バックナンバー

--.--.-- --:-- | EDIT
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
Category: スポンサー広告
Permanent Link | Comment(-) | Trackback(-) | PageTop↑
2013.12.19 13:33 | EDIT
スポンサーサイト
2013.12.04 15:41 | EDIT
ICCV2013にて,Dense Trajectoriesの改良版が提案されていました!

H. Wang, C. Schmid, "Action Recognition with Improved Trajectories", International Conference on Computer Vision (ICCV), 2013.

というわけでしばらく更新していなかった論文紹介を更新します.

まず,Dense Trajecotiresは前回の投稿でも記述しましたが,現在行動認識の研究では識別精度が最も高い手法として認知されています.

ICCV2013と同時開催のワークショップTHUMOSにおいてもランキングの1位を獲得しています.THUMOSでは,UCF101という,101の行動クラスの分類問題を扱う課題を解くコンペティションが行われ,その中でDense Trajectoriesは85.9%という驚異的な識別率を叩き出し,1位を獲得しています.

ワークショップのコンペティションでも実証された,ICCV2013のアイディアとは,
- カメラモーションの推定
- 人物検出の導入
- Fisher Vectorの導入
をしています.

今回はより実利用化を想定して,改良に取り組んできたという印象です.

前回までのDense Trajectoriesでは,確かに密なオプティカルフローの記述により大量の特徴記述を実現しました.

しかし,それと同時に煩雑な環境,複数人物を含む場面やカメラが動く場面においてはノイズを多く含む結果を招いていました.

今回は,それを
①SURFを使いHomographyを推定することでカメラモーションを推定,人物以外から取得していると思われるフローは除去
②人物そのものを検出することで,それ以外の領域からのフローは除去
の実装により解決しています.
余分なフローの除去により,カメラの動きに依存せず,しかもフローが除去できるのでHOFやMBHはより鮮明なエッジが抽出できるという点でも優れています.

ここで,人物の検出には以下の手法を使っているようです.
A. Prest, C. Schmid, V. Ferrari, "Weakly supervised learning of interactions between humans and objects", TPAMI, 2012.
パーツごとのモデルの繋がりを考慮することで姿勢変動があっても人体を検出できるようにした仕組みです.
Felzenszwalbさん(Deformable Parts Modelの考案者)の論文を引用しています.

また,実験の章ではBag-of-featuresを使うよりもFisher vectorを適用すると精度が上がる事にも触れています.

結局,上記3つの改良を施し,IJCV2013の時よりも
Hollywood2: 59.9% -> 64.3%
HMDB51: 48.3% -> 57.2%
Olympic sports: 77.2% -> 91.1%
UCF50: 85.6 -> 91.2%
と全てのデータセットにおいて精度向上が見られました.

あとは高速化が実現すれば,監視映像や生活空間においても実装ができそうです.

参考
THUMOS: The First International Workshop on Action Recognition with a Large Number of Classes, in conjunction with ICCV '13, Sydney, Australia.
 | ホーム | 
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。