2018.06.24 18:21 | EDIT
ソルトレイクシティにて開催されたCVPR 2018に参加して、レポートを書きました。



産総研、筑波大学佐藤雄隆研究室、慶應義塾大学青木研究室、東京電機大学中村研究室、早稲田大学森島研究室、中部大学藤吉・山下研究室、岐阜大学加藤研究室の皆さんで構成したメンバーで書いております。ご協力頂きまして誠にありがとうございました!
スポンサーサイト
2018.05.25 20:07 | EDIT
ロボティクス/オートメーションのトップ国際会議 ICRA 2018 (IEEE International Conference on Robotics and Automation; https://icra2018.org/ )の参加速報を書きました。



この資料には下記の項目が含まれています。
・ICRA 2018の概要
・ICRA 2018での動向や気付き
・ICRAの重要技術/重要論⽂?
・AIST関連の論文
・今後の方針
・論文まとめ(100本あります)
2018.05.05 18:50 | EDIT
cvpaper.challengeの始まりであった「CVPR 2015 完全読破」から3年が経ち、2018年5月現在メンバーは約30名、自ら執筆した論文がメジャーな国際会議やジャーナルに突破するまでになりました [Homepage]。ここで、初心に立ち返り、さらにはメンバー(特に初年度メンバー、学部生/修士学生)の研究能力向上のためにCVPR 2018 完全読破チャレンジを3年ぶりに行うことにしました。

当時の論文数は全602本でしたが、2018年に関しては全979本の論文をまとめなくてはなりません。しかし、参加人数の面においても当時は10名(片岡、修士学生数人、半分が学部生)でしたが、現在は30名のメンバー(修士学生/学部生を中心に、片岡、含:助教/ポスドク/博士課程学生)を擁し、論文をまとめて投稿する体制を整えています。そこで今回に関しては、論文の速報性を保つために締め切りを設ける(〜2018年8月31日)のみならず、グループとして論文を読破する行為自体の統計解析、CV分野を出来る限り俯瞰したいと思っております(昨年のCVPR/ICCV 2017 速報の続編も投稿します)。これに関しては、秋以降の学会やシンポジウムなどで公表していきたいと思っております(講演のご依頼もぜひお願いします)。そのほか、メンバーが面白いと思うようなチャレンジを次々と仕込んでいきます!(プロジェクトに参加したいというメンバーに関しても、もちろん募集しております)

**スライド(や取り組み自体)に関して質問、訂正、ディスカッションなどございましたら、お気軽にIssue立てください! => CVPR2018_Survey/Issues**

ホームページ: CVPR 2018 完全読破チャレンジ
GitHubリポジトリ: CVPR2018_Survey
論文まとめ: Slide Page
メンバー募集ページ: http://hirokatsukataoka.net/project/cc/recruit.html



2016.01.05 10:27 | EDIT
2015年12月21日に開催されたPRMUにて,DeepSurveyを発表しました.
昨年のcvpaper.challengeで読んだCVPRの論文を入力として論文化まで目指す仕組みです.



特徴は下記の通りです.

入力:読んだ論文を入力(知識)
1st アイディア:各自でアイディアを考案(知識をアイディアへ)
1st 議論:グループで議論(アイディアの集約)
2nd アイディア:集約した内容を基にさらに考案
2nd 議論:さらにアイディアの洗練化
1st 実装:ピックアップとハッカソン
2nd 実装:本格的な実装と実験
出力:論文

一般的なCNN (Convolutional Neural Networks) [1]と比較して,
「アイディア:畳み込み層」 「議論:プーリング」 「実装:全結合層」
と見ていただければわかりやすいです.
プーリング(議論)では,複数のアイディアをまとめたり良いアイディアをそのまま次の層の入力に与えているので,MaxプーリングやAverageプーリングの性質を同時に保有するLpプーリングに近いです.アイディア考案と議論を繰り返し,煮詰まってきたら実装に入るという戦略です.
現在の層の数の数え方は畳み込み層と全結合層なので,アーキテクチャとしては4層構成です.

そして,一番の特徴は「自らがニューロンの一部になる」という手法です.この枠組みにおいては,バーチャルではなくリアルな空間でグループ全体がひとつのニューラルネットのアーキテクチャとして動くことで最終的には論文を書くことができます.グループで考え,手を動かし,論文を書くことで成長してさらにネットワーク自体が成長するという性質も持っています.

今年度は実装や論文化の時間が少なくなってしまいましたが,次はより洗練させた論文の執筆や新規問題設定の提案まで踏み込めたらいいですね.
最近ではアーキテクチャの構造もよりディープになりつつある(VGGNet[2]: 16/19層,ResNet[3]: 50/101/152層)ので,より多くのアイディア考案,より多くの議論を重ねて,さらに洗練されたアイディア・問題設定・論文を出力できたらと思います.

現在,アーキテクチャについても議論を重ねている状況です.
次回作にもご期待ください.

[1] Y. LeCun, L. Bottou, Y. Bengio and P. Haffner: Gradient-Based Learning Applied to Document Recognition, Proceedings of the IEEE, 86(11):2278-2324, November 1998.
http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf

[2] K. Simonyan, A. Zisserman: Very Deep Convolutional Networks for Large-Scale Image Recognition, ICLR, 2015.
http://arxiv.org/pdf/1409.1556.pdf
http://www.robots.ox.ac.uk/~vgg/research/very_deep/

[3] K. He, X. Zhang, S. Ren, J. Sun: Deep Residual Learning for Image Recognition, arXiv technical report, 2015.
http://arxiv.org/pdf/1512.03385v1.pdf
http://research.microsoft.com/en-us/um/people/kahe/ilsvrc15/ilsvrc2015_deep_residual_learning_kaiminghe.pdf
2015.12.14 08:49 | EDIT
2015年12月11日にTensorFlowによる画像認識Deep Learning(特にConvolutional Neural Networks, CNN)アーキテクチャ構築とその簡単なPythonによるサンプルコードを公開しました.

TensorFlowチュートリアルのアルゴリズムを参考にしておりますが,入力やアーキテクチャなど,できる限り簡易的な表現を加えております.

SlideShare資料
「TensorFlowによるCNNアーキテクチャ構築」


Pythonによるサンプルコード
tar.gz版
http://www.hirokatsukataoka.net/temp/TensorFlow/my_cnn.tar.gz
zip版
http://www.hirokatsukataoka.net/temp/TensorFlow/my_cnn.zip