データセット、Annotation関連論文読み

We don't need no bounding-boxes: Training object class detectors using only human verification

https://arxiv.org/abs/1602.08405

BBを人間が設定しないアノテーション

提案に対して、人間がYes/NoもしくはYes/No/Part/Container/Mixed/Missedなど、

関連情報を付加した回答をさせることで領域を推定する。

Annotationが物体認識を回し、物体認識がAnnotationを回し、

鶏と卵の疑似形みたいな印象。

 

fine-grained visual categorization(FGVC)

http://www.nlab.ci.i.u-tokyo.ac.jp/projects/recognition.html

上記論文で知らない単語が出てきたので、調べる。

詳細画像認識。ドメインを絞る代わりに、一般的な人間の知識を

大きく超える能力を実現することを目指しているらしい。

毒キノコ判定とか?不良品検知とかもこの方向性に近い気が。

引き続き学習。

 

Microsoft COCO: Common Objects in Context

https://arxiv.org/pdf/1405.0312.pdf

MSのデータセットCOCO作成に関する論文。

今後、データセットを独自作成は必須案件となりそうなので、参考に。

例えば、Webベースで情報を集めると、

iconic view(象徴的な見方)になりがちである、との記載がある。

この点に関しては、私も実際に感じている。

ウェブベースの手法で独自データセットを自作した際に、

固定的な外観および障害物の無い白背景など、偏った画像が多くなることがあった。

 

TensorFlow's Object Detection APIを使ってチュートリアルお試し

https://github.com/EdjeElectronics/TensorFlow-Object-Detection-API-Tutorial-Train-Multiple-Objects-Windows-10

tensorflow-gpuのバージョンが違ったり、なんだかんだ詰まったが、

何とかお試し完了。

チュートリアル中はpip使ってたけど、混在しない方が良いと思ったので、

condaのみで押し通した。

 

チュートリアルで対象となっている9,10,J,Q,K,Aの認識精度はまぁまぁ。

1枚のカードに対して、重なった2枚判定になることもしばしばあり。

 

対象外のトランプカードも試してみたが、

こちらもA辺りに認識されてしまう。

 

それどころか、名刺の裏の真っ白、大きさの違う展示会の案内もA。

恐らく、矩形で白地のものに対して、検出してしまう傾向あり。

80000epoch近く回してしまったので、過学習気味か。

 

異常検知等で利用するにしても負例の使いどころが重要か。

それっぽいものを検出する精度はあるが、ぽいで全部検知されてしまうので。

 

次は自作データセットでのお試しと以下の異常検知の論文に目を通す。

https://arxiv.org/abs/1801.05365

TensorflowのObject Detection APIを試す

https://github.com/EdjeElectronics/TensorFlow-Object-Detection-API-Tutorial-Train-Multiple-Objects-Windows-10

 

2f. Compile Protobufs and run setup.pyでエラー

.\object_detection\protos\calibration.proto: No such file or directory

実際、protosの中にこのファイルは存在せず。

このコマンドの意図としては、protos無いのprotoファイルを全部コンパイルするということと思われる。

https://github.com/tensorflow/models/issues/2930

以上の問答があったので、ワイルドカードで対応。

と思ったが、

object_detection/protos/*.proto: No such file or directory

???なぜ???

Windowsワイルドカードでは駄目らしい・・・

 

泣く泣く直接指定

無敵の思考

 

無敵の思考 ――誰でもトクする人になれるコスパ最強のルール21

無敵の思考 ――誰でもトクする人になれるコスパ最強のルール21

 

 読みました。

「やる目的」から先に決めるの項目は胸にグサッときました。何となくチュートリアルやって、結局何もアウトプットが無い状況ってかなりあります。

Visual Studio CodeをAnaconda Promptにする

・きっかけ

WindowsでAnaconda環境においてデバックするとき、いちいちImport Errorとか出てめんどくさいなと思ったため

 

・やり方

「File」⇒「Preference」⇒「Setting」を押下

integrated shell辺りで検索して、

Terminal>Integrated>Shell: Windowsを「cmd.exe」に変更

 

同じく、

Terminal>Integrated>Shell Args:Windows

Edit in settings.jsonを押下して、

以下のように記載(私の環境では)

{
"terminal.integrated.shell.windows": "cmd.exe",
"terminal.integrated.shellArgs.windows": [
"/K",
"C:\\Anaconda\\Scripts\\activate.bat",
"C:\\Anaconda"
]
}

Windowsでpytorch版のCycleGANで引っかかる

github.com

前提がlinuxmacOSって何やねーん。

 

abrakatabura.hatenablog.com

おおむね、ここを参考に。

 

WSLでデータセットのダウンロードスクリプトを走らせる際に

文字コードエラーがあったため、無理やり変換して解決。

d.hatena.ne.jp

 

Windowsめんど。