今回は, 前回[1]のひらがなデータを使って, Deep MNIST for Experts[2]で紹介されてるCNN(Convolutional Neural Network)を試してみた.
[モデル構造]
1.畳み込み層
2.プーリング層
3.畳み込み層
4.プーリング層
5.全結合層
6.Softmax Regression層
[学習]
- 対象文字:ひらがな73文字(小文字除く)
- 筆記スタイル:楷書
- 学習データ:9,874サンプル(約130サンプル/文字)
- 学習回数:ミニバッチ(100サンプル)×10,000回
- 学習ログ:
step 0, training accuracy 0
step 100, training accuracy 0.29
step 200, training accuracy 0.74
step 300, training accuracy 0.79
step 400, training accuracy 0.89
step 500, training accuracy 0.88
:
step 9400, training accuracy 1
step 9500, training accuracy 1
step 9600, training accuracy 1
step 9700, training accuracy 1
step 9800, training accuracy 1
step 9900, training accuracy 1
- 経過視覚化:
上:学習データの認識率, 下:損失
[評価]
- 対象文字:ひらがな73文字(小文字除く)
- 筆記スタイル:楷書
- 評価データ:2,010サンプル(最大30サンプル/文字)
- 認識結果:
--- No. 1 あ ---
* 1位 : あ (0.999999)
2位 : お (0.000001)
3位 : め (0.000000)
4位 : の (0.000000)
5位 : わ (0.000000)
--- No. 2 あ ---
* 1位 : あ (0.999975)
2位 : め (0.000025)
:
--- No. 2009 ん ---
* 1位 : ん (0.997757)
2位 : れ (0.002124)
3位 : へ (0.000077)
4位 : た (0.000024)
5位 : か (0.000008)
--- No. 2010 ん ---
* 1位 : ん (1.000000)
2位 : ぬ (0.000000)
3位 : ね (0.000000)
4位 : ふ (0.000000)
5位 : か (0.000000)
---------- Total Accuracy ----------
1位 : 96.22 % ( 1934 / 2010 )
2位 : 99.30 % ( 1996 / 2010 )
3位 : 99.65 % ( 2003 / 2010 )
4位 : 99.80 % ( 2006 / 2010 )
5位 : 99.85 % ( 2007 / 2010 )
対象文字が73文字と少ないこともあり, まずまずの認識性能が得られた. w( ̄▽ ̄;)wワオッ!!
次回は, 認識対象を漢字にまで広げてみようか...
(注)
評価データに学習データが含まれるなどの不備が見つかったので, 再度評価し直し内容を修正しました. (2016/6/29)
----
[1] TensorFlowで文字認識にチャレンジ(1)
[2] Deep MNIST for Experts - TensorFlow
IA/UXプラクティス モバイル情報アーキテクチャとUXデザイン
|
だから、そのデザインはダメなんだ。 WebサイトのUI設計・情報デザイン 良い・悪いが比べてわかる
|
UI GRAPHICS ?世界の成功事例から学ぶ、スマホ以降のインターフェイスデザイン
|
UIデザインの教科書 マルチデバイス時代のサイト設計-アーキテクチャからUXまで
|