従来のオンライン手書き文字認識[1]では, 筆点列からストロークの最初/最終の筆点や変化点などの特徴点, 特徴点間の移動距離/方向などの特徴量を抽出し, DPマッチングやHMM(Hidden Markov Model)などの手法を用いて入力とモデルの照合を行っている.
前回[2]は, とりあえず筆点列から特徴点を抽出し, 特徴点間の移動距離とストロークのON/OFF情報を特徴量として, まずはCNNで認識可能か試してみた.
92%程度の認識性能が得られたので, CNNのモデル構造はそのままで, 筆点列をどのような特徴量で表現すればよいか少し検討してみた.
今回試したのは, 以下の2種類.
方式 | 概要 |
---|---|
前回[2] | ・各軸方向への移動量 ・ストロークのON/OFF情報 |
1 | ・特徴点の座標値 ・各軸方向への移動量 ・ストロークのON/OFF情報 |
2 | ・ストロークのON/OFF別に, 各軸方向への移動量 |
学習と評価
[学習条件]
- 対象文字:漢字2,965文字種(JIS第一水準)
- 筆記スタイル:楷書
- 学習データ:53,244サンプル
- 学習回数:ミニバッチ(100サンプル)×50,000回
- モデル構造:前回と同じ
[認識条件]
- 対象文字:漢字2,965文字種(JIS第一水準)
- 筆記スタイル:楷書
- 評価データ:11,762サンプル
[実験結果]
方式 | 1位 | 累積(5位) |
---|---|---|
前回[2] | 92.54% | 97.99% |
1 | 93.92% | 98.41% |
2 | 94.75% | 98.72% |
ストロークのON/OFFを1つの特徴量で表現するより, 別の特徴量として表現する方がよさそうである.
----
参照URL:
[1] オンライン手書き文字認識の 最新動向 - 東京農工大学
[2] TensorFlowで文字認識にチャレンジ(7)
|
|
|
|