みらいテックラボ

音声・画像認識や機械学習など, 週末プログラマである管理人が興味のある技術の紹介や実際にトライしてみた様子などメモしていく.

TensorFlowで文字認識にチャレンジ(8)

TensorFlow 文字認識

従来のオンライン手書き文字認識[1]では, 筆点列からストロークの最初/最終の筆点や変化点などの特徴点, 特徴点間の移動距離/方向などの特徴量を抽出し, DPマッチングやHMM(Hidden Markov Model)などの手法を用いて入力とモデルの照合を行っている.

前回[2]は, とりあえず筆点列から特徴点を抽出し, 特徴点間の移動距離とストロークのON/OFF情報を特徴量として, まずはCNNで認識可能か試してみた.
92%程度の認識性能が得られたので, CNNのモデル構造はそのままで, 筆点列をどのような特徴量で表現すればよいか少し検討してみた.

今回試したのは, 以下の2種類.

方式	概要
前回[2]	・各軸方向への移動量・ストロークのON/OFF情報
1	・特徴点の座標値・各軸方向への移動量・ストロークのON/OFF情報
2	・ストロークのON/OFF別に, 各軸方向への移動量

学習と評価
[学習条件]

対象文字：漢字2,965文字種(JIS第一水準)
筆記スタイル：楷書
学習データ：53,244サンプル
学習回数：ミニバッチ(100サンプル)×50,000回
モデル構造：前回と同じ

[認識条件]

対象文字：漢字2,965文字種(JIS第一水準)
筆記スタイル：楷書
評価データ：11,762サンプル

[実験結果]

方式	1位	累積(5位)
前回[2]	92.54%	97.99%
1	93.92%	98.41%
2	94.75%	98.72%

ストロークのON/OFFを1つの特徴量で表現するより, 別の特徴量として表現する方がよさそうである.

----
参照URL:
[1] オンライン手書き文字認識の最新動向 - 東京農工大学
[2] TensorFlowで文字認識にチャレンジ(7)

パターン認識と機械学習上

パターン認識と機械学習上

作者: C.M.ビショップ,元田浩,栗田多喜夫,樋口知之,松本裕治,村田昇
出版社/メーカー: 丸善出版
発売日: 2012/04/05
メディア: 単行本（ソフトカバー）
購入: 6人クリック: 33回
この商品を含むブログ (18件) を見る

パターン認識と機械学習下 (ベイズ理論による統計的予測)

パターン認識と機械学習下 (ベイズ理論による統計的予測)

作者: C.M.ビショップ,元田浩,栗田多喜夫,樋口知之,松本裕治,村田昇
出版社/メーカー: 丸善出版
発売日: 2012/02/29
メディア: 単行本
購入: 6人クリック: 14回
この商品を含むブログを見る

はじめてのパターン認識

はじめてのパターン認識

作者: 平井有三
出版社/メーカー: 森北出版
発売日: 2012/07/31
メディア: 単行本（ソフトカバー）
購入: 1人クリック: 7回
この商品を含むブログ (3件) を見る

わかりやすいパターン認識

わかりやすいパターン認識

作者: 石井健一郎,前田英作,上田修功,村瀬洋
出版社/メーカー: オーム社
発売日: 1998/08
メディア: 単行本
購入: 19人クリック: 110回
この商品を含むブログ (42件) を見る