みらいテックラボ

音声・画像認識や機械学習など, 週末プログラマである管理人が興味のある技術の紹介や実際にトライしてみた様子などメモしていく.

TensorFlowで文字認識にチャレンジ(8)

従来のオンライン手書き文字認識[1]では, 筆点列からストロークの最初/最終の筆点や変化点などの特徴点, 特徴点間の移動距離/方向などの特徴量を抽出し, DPマッチングやHMM(Hidden Markov Model)などの手法を用いて入力とモデルの照合を行っている.

前回[2]は, とりあえず筆点列から特徴点を抽出し, 特徴点間の移動距離とストロークのON/OFF情報を特徴量として, まずはCNNで認識可能か試してみた.
92%程度の認識性能が得られたので, CNNのモデル構造はそのままで, 筆点列をどのような特徴量で表現すればよいか少し検討してみた.

今回試したのは, 以下の2種類.

方式概要
前回[2] ・各軸方向への移動量
ストロークのON/OFF情報
f:id:moonlight-aska:20160706231502p:plain:w350
1・特徴点の座標値
・各軸方向への移動量
ストロークのON/OFF情報
f:id:moonlight-aska:20160706231534p:plain:w350
2ストロークのON/OFF別に, 各軸方向への移動量
f:id:moonlight-aska:20160706231518p:plain:w350

学習と評価
[学習条件]

  • 対象文字:漢字2,965文字種(JIS第一水準)
  • 筆記スタイル:楷書
  • 学習データ:53,244サンプル
  • 学習回数:ミニバッチ(100サンプル)×50,000回
  • モデル構造:前回と同じ

[認識条件]

  • 対象文字:漢字2,965文字種(JIS第一水準)
  • 筆記スタイル:楷書
  • 評価データ:11,762サンプル

[実験結果]

方式1位累積(5位)
前回[2] 92.54% 97.99%
1 93.92% 98.41%
2 94.75% 98.72%

ストロークのON/OFFを1つの特徴量で表現するより, 別の特徴量として表現する方がよさそうである.

----
参照URL:
[1] オンライン手書き文字認識の 最新動向 - 東京農工大学
[2] TensorFlowで文字認識にチャレンジ(7)




パターン認識と機械学習 上

パターン認識と機械学習 上


パターン認識と機械学習 下 (ベイズ理論による統計的予測)

パターン認識と機械学習 下 (ベイズ理論による統計的予測)


はじめてのパターン認識

はじめてのパターン認識


わかりやすいパターン認識

わかりやすいパターン認識