データセット、Annotation関連論文読み
We don't need no bounding-boxes: Training object class detectors using only human verification
https://arxiv.org/abs/1602.08405
BBを人間が設定しないアノテーション。
提案に対して、人間がYes/NoもしくはYes/No/Part/Container/Mixed/Missedなど、
関連情報を付加した回答をさせることで領域を推定する。
Annotationが物体認識を回し、物体認識がAnnotationを回し、
鶏と卵の疑似形みたいな印象。
fine-grained visual categorization(FGVC)
http://www.nlab.ci.i.u-tokyo.ac.jp/projects/recognition.html
上記論文で知らない単語が出てきたので、調べる。
詳細画像認識。ドメインを絞る代わりに、一般的な人間の知識を
大きく超える能力を実現することを目指しているらしい。
毒キノコ判定とか?不良品検知とかもこの方向性に近い気が。
引き続き学習。
Microsoft COCO: Common Objects in Context
https://arxiv.org/pdf/1405.0312.pdf
MSのデータセットCOCO作成に関する論文。
今後、データセットを独自作成は必須案件となりそうなので、参考に。
例えば、Webベースで情報を集めると、
iconic view(象徴的な見方)になりがちである、との記載がある。
この点に関しては、私も実際に感じている。
ウェブベースの手法で独自データセットを自作した際に、
固定的な外観および障害物の無い白背景など、偏った画像が多くなることがあった。
TensorFlow's Object Detection APIを使ってチュートリアルお試し
tensorflow-gpuのバージョンが違ったり、なんだかんだ詰まったが、
何とかお試し完了。
チュートリアル中はpip使ってたけど、混在しない方が良いと思ったので、
condaのみで押し通した。
チュートリアルで対象となっている9,10,J,Q,K,Aの認識精度はまぁまぁ。
1枚のカードに対して、重なった2枚判定になることもしばしばあり。
対象外のトランプカードも試してみたが、
こちらもA辺りに認識されてしまう。
それどころか、名刺の裏の真っ白、大きさの違う展示会の案内もA。
恐らく、矩形で白地のものに対して、検出してしまう傾向あり。
80000epoch近く回してしまったので、過学習気味か。
異常検知等で利用するにしても負例の使いどころが重要か。
それっぽいものを検出する精度はあるが、ぽいで全部検知されてしまうので。
次は自作データセットでのお試しと以下の異常検知の論文に目を通す。
Object Detection APIエラー
TensorflowのObject Detection APIを試す
2f. Compile Protobufs and run setup.pyでエラー
.\object_detection\protos\calibration.proto: No such file or directory
実際、protosの中にこのファイルは存在せず。
このコマンドの意図としては、protos無いのprotoファイルを全部コンパイルするということと思われる。
https://github.com/tensorflow/models/issues/2930
以上の問答があったので、ワイルドカードで対応。
と思ったが、
object_detection/protos/*.proto: No such file or directory
???なぜ???
泣く泣く直接指定
無敵の思考
無敵の思考 ――誰でもトクする人になれるコスパ最強のルール21
- 作者: ひろゆき
- 出版社/メーカー: 大和書房
- 発売日: 2017/07/08
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (2件) を見る
読みました。
「やる目的」から先に決めるの項目は胸にグサッときました。何となくチュートリアルやって、結局何もアウトプットが無い状況ってかなりあります。