第1回FR FRONTIER:ファッション画像における洋服の「色」分類にチャレンジ!!(1)

これは, 人工知能技術戦略会議等主催第1回AIチャレンジコンテスト[1]に引き続き, ユニクロを展開しているファーストリテイリング主催で今年4月～7月に開催された「第1回 FR FRONTIER ：ファッション画像における洋服の「色」分類」[2][3]にチャレンジしたときの取組みについて, 数回に分けて紹介するものである.

deepanalytics.jp

0. コンテストの概要
テーマ：画像認識
　ファッション画像における洋服の「色」を分類するための新規機械学習アルゴリズム提案

スケジュール：

２０１７年４月２８日（金）	コンテスト開始
２０１７年７月１４日（金）	コンテスト終了（14/7/2017 11:59 PM JST）
２０１７年７月１７日（月）	予測モデル等の提出締切（※入賞候補の連絡を受け取った方）
２０１７年７月２８日（金）	１次審査発表
２０１７年８月２８日（月）	最終プレゼン会／表彰式

コンテストの内容：
24色の色カテゴリの1つに分類
　学習データ：
　　・ラベル付き画像12,399画像
　テストデータ：
　　・9,801画像
　評価方法：
　　 ${\displaystyle Balanced Accuracy = \frac{1}{m}\sum_{j=1}^m Accuracy_ j}$
　　 $Accuracy_j = \frac{n(\{i|y_i=\hat{y_i}(i=1,2,...,n_j)\})}{n_j}$
　　　　 ${m}$ ：number of categories
　　　　 ${n(A)}$ ：number of elements in set A
　　　　 ${y_i}$ ：actual value of sample i of category j
　　　　 ${\hat{y_i}}$ ：predicted value of sample i of category j
　　　　 ${n_j}$ ：number of samples of category j

1. はじめに
1.1 データを見る

24色のカテゴリと各カテゴリの学習データ数は, 以下の通り.

id	カテゴリ	学習データ数	id	カテゴリ	学習データ数
0	white	589	12	beige	315
1	off_white	589	13	khaki	39
2	light_gray	200	14	brown	190
3	gray	1129	15	dark_brown	120
4	dark_gray	592	16	yellow	121
5	black	1582	17	light_green	87
6	pink	855	18	green	386
7	red	650	19	olive	211
8	wine	210	20	dark_green	181
9	orange	193	21	blue	2036
10	dark_orange	49	22	navy	1623
11	natural	138	23	purple	314

データの一例：
・Green

f:id:moonlight-aska:20170818162406p:plain:w50

f:id:moonlight-aska:20170818162528p:plain:w50

f:id:moonlight-aska:20170818162637p:plain:w50

(注) ファーストリテイリング様から画像利用許諾が得られませんでしたので, 服の色を表示.

実は, 以下にもGreenのラベルが...

f:id:moonlight-aska:20170818162956p:plain:w50

f:id:moonlight-aska:20170818163132p:plain:w50

f:id:moonlight-aska:20170818163245p:plain:w50

(注) ファーストリテイリング様から画像利用許諾が得られませんでしたので, 服の色を表示.

前回同様に今回も, 人間でも正しく分類できなさそうな画像がそこそこ含まれている.

1.2 目標設定

目標を設定するために, まずは学習済モデル+Fine Tuningで試してみた.

Model	Framework/Library	Accuracy
VGG16	Keras + TensorFlow	約0.65

5月中頃だったが, この時期Topは0.70くらいの精度であったので, 今回も分類率0.70以上を目標とした.
最終的にはTopは0.75程度にはなるのだろうけど...

画像分類においては, 学習済モデルのFine Tuning + アンサンブル学習で, 多くの場合それなりの高い分類精度が得られる.
それでは, 豊富なGPUリソースを持つ人が優位であり, 勝負にならない.
しかし, 今回は色識別なので, 物体認識用に学習した大規模な多層ネットワークが必ずしも有利ではないと思い, コンパクトなモデルでいかに高い分類精度が出せるかにチャレンジしてみることにした.
(最終的には識別精度を競うので, 学習済モデル + Fine Tuningについても, バッグアップ策として並行して進めていく.)

今回は, どんな内容のコンテストだったかを中心に紹介した.
次回は, 「色」分類ということで, データ利用方法について試したことをいくつか紹介する.

----
参照URL:
[1] 人工知能技術戦略会議等主催第1回AIチャレンジコンテスト
[2] 第1回 FR FRONTIER ：ファッション画像における洋服の「色」分類
[3] 最先端のビジネス課題にチャレンジ！