みらいテックラボ

音声・画像認識や機械学習など, 週末プログラマである管理人が興味のある技術の紹介や実際にトライしてみた様子などメモしていく.

第1回FR FRONTIER:ファッション画像における洋服の「色」分類にチャレンジ!!(1)

これは, 人工知能技術戦略会議等主催 第1回AIチャレンジコンテスト[1]に引き続き, ユニクロを展開しているファーストリテイリング主催で今年4月~7月に開催された「第1回 FR FRONTIER :ファッション画像における洋服の「色」分類」[2][3]にチャレンジしたときの取組みについて, 数回に分けて紹介するものである.

deepanalytics.jp


関連記事:
・第1回FR FRONTIER:ファッション画像における洋服の「色」分類にチャレンジ!!(1)
第1回FR FRONTIER:ファッション画像における洋服の「色」分類にチャレンジ!!(2)
第1回FR FRONTIER:ファッション画像における洋服の「色」分類にチャレンジ!!(3)
第1回FR FRONTIER:ファッション画像における洋服の「色」分類にチャレンジ!!(4)
第1回FR FRONTIER:ファッション画像における洋服の「色」分類にチャレンジ!!(5)

0. コンテストの概要
テーマ:画像認識
 ファッション画像における洋服の「色」を分類するための新規機械学習アルゴリズム提案

スケジュール:

2017年4月28日(金)コンテスト開始
2017年7月14日(金)コンテスト終了(14/7/2017 11:59 PM JST
2017年7月17日(月)予測モデル等の提出締切(※入賞候補の連絡を受け取った方)
2017年7月28日(金)1次審査発表
2017年8月28日(月)最終プレゼン会/表彰式

コンテストの内容:
24色の色カテゴリの1つに分類
 学習データ:
  ・ラベル付き画像12,399画像
 テストデータ:
  ・9,801画像
 評価方法:
  {\displaystyle Balanced Accuracy = \frac{1}{m}\sum_{j=1}^m Accuracy_
j}
  {\displaystyle Accuracy_j = \frac{n(\{i|y_i=\hat{y_i}(i=1,2,...,n_j)\})}{n_j}}
    {m}:number of categories
    {n(A)}:number of elements in set A
    {y_i}:actual value of sample i of category j
    {\hat{y_i}}:predicted value of sample i of category j
    {n_j}:number of samples of category j

1. はじめに
1.1 データを見る

24色のカテゴリと各カテゴリの学習データ数は, 以下の通り.

idカテゴリ学習データ数 idカテゴリ学習データ数
0white589 12beige315
1off_white589 13khaki39
2light_gray200 14brown190
3gray1129 15dark_brown120
4dark_gray592 16yellow121
5black1582 17light_green87
6pink855 18green386
7red650 19olive211
8wine210 20dark_green181
9orange193 21blue2036
10dark_orange49 22navy1623
11natural138 23purple314

データの一例:
・Green

f:id:moonlight-aska:20170818162406p:plain:w50 f:id:moonlight-aska:20170818162528p:plain:w50 f:id:moonlight-aska:20170818162637p:plain:w50
(注) ファーストリテイリング様から画像利用許諾が得られませんでしたので, 服の色を表示.

実は, 以下にもGreenのラベルが...

f:id:moonlight-aska:20170818162956p:plain:w50 f:id:moonlight-aska:20170818163132p:plain:w50 f:id:moonlight-aska:20170818163245p:plain:w50
(注) ファーストリテイリング様から画像利用許諾が得られませんでしたので, 服の色を表示.

前回同様に今回も, 人間でも正しく分類できなさそうな画像がそこそこ含まれている.

1.2 目標設定

目標を設定するために, まずは学習済モデル+Fine Tuningで試してみた.

ModelFramework/LibraryAccuracy
VGG16Keras + TensorFlow約0.65

5月中頃だったが, この時期Topは0.70くらいの精度であったので, 今回も分類率0.70以上を目標とした.
最終的にはTopは0.75程度にはなるのだろうけど...

画像分類においては, 学習済モデルのFine Tuning + アンサンブル学習で, 多くの場合それなりの高い分類精度が得られる.
それでは, 豊富なGPUリソースを持つ人が優位であり, 勝負にならない.
しかし, 今回は色識別なので, 物体認識用に学習した大規模な多層ネットワークが必ずしも有利ではないと思い, コンパクトなモデルでいかに高い分類精度が出せるかにチャレンジしてみることにした.
(最終的には識別精度を競うので, 学習済モデル + Fine Tuningについても, バッグアップ策として並行して進めていく.)

今回は, どんな内容のコンテストだったかを中心に紹介した.
次回は, 「色」分類ということで, データ利用方法について試したことをいくつか紹介する.

----
参照URL:
[1] 人工知能技術戦略会議等主催 第1回AIチャレンジコンテスト
[2] 第1回 FR FRONTIER :ファッション画像における洋服の「色」分類
[3] 最先端のビジネス課題にチャレンジ!




画像処理・機械学習プログラミング OpenCV 3対応

画像処理・機械学習プログラミング OpenCV 3対応


OpenCVによる画像処理入門 改訂第2版 (KS情報科学専門書)

OpenCVによる画像処理入門 改訂第2版 (KS情報科学専門書)



画像認識 (機械学習プロフェッショナルシリーズ)

画像認識 (機械学習プロフェッショナルシリーズ)