みらいテックラボ

音声・画像認識や機械学習など, 週末プログラマである管理人が興味のある技術の紹介や実際にトライしてみた様子などメモしていく.

文字認識

TensorFlowで文字認識にチャレンジ(9)

TensorFlowによる日本語のかな/漢字の手書きデータの認識について, これまで何回かに分けて検討してきた. そして, ある程度の認識性能を実現できることも確認できた. 日本語のかな/漢字の認識については, 今回でいったん最後にしようと思うが, 最後に学習デ…

TensorFlowで文字認識にチャレンジ(8)

従来のオンライン手書き文字認識[1]では, 筆点列からストロークの最初/最終の筆点や変化点などの特徴点, 特徴点間の移動距離/方向などの特徴量を抽出し, DPマッチングやHMM(Hidden Markov Model)などの手法を用いて入力とモデルの照合を行っている.前回[2]は…

TensorFlowで文字認識にチャレンジ(7)

前回までは, 手書きの文字を28×28画素の画像とし扱い, CNN(Convolutional Neural Network)による文字認識や認識性能の改善について検討してきた. しかし, 現状ではJIS第一水準(2965文字種)を認識対象とすると, 約91%の1位認識率しか得られていない. そこで, …

TensorFlowで文字認識にチャレンジ(6)

今回も, 認識性能を改善するために, 前々回[1]記した1)のオンライン手書きデータの画像化/正規化を検討してみた.これまでの学習/評価で使用してきた手書きデータは, オンライン手書き文字認識の前処理を施したデータから28×28dotの画像を生成したものであっ…

TensorFlowで文字認識にチャレンジ(5)

今回は, 認識性能を改善するために, 前回[1]記した改善案2)のCNN構造について考えてみる.これまで試してきたモデルは, Deep MNIST for Experts[2]をベースにしており, 以下のような構造をとっていた. これまでの認識手法なら, エラーしたサンプルの処理過程(…

TensorFlowで文字認識にチャレンジ(4)

今回は, 前回[1]の漢字認識において, エラーしたデータを確認してみることに.前回の認識率: ---------- Total Accuracy ---------- 1位 : 88.31 % ( 10387 / 11762 ) 2位 : 94.68 % ( 11136 / 11762 ) 3位 : 96.58 % ( 11360 / 11762 ) 4位 : 97.39 % ( 1145…

TensorFlowで文字認識にチャレンジ(3)

今回は, 前回[1]の認識対象をひらがな73文字から漢字(JIS第一水準)2965文字に広げて試してみた.認識対象の文字種が約3,000字かつ学習データが約50,000サンプルということで, 私の環境(*1)ではメモリ不足でエラーとなった. *1:ホストマシン: CPU:Intel Core…

TensorFlowで文字認識にチャレンジ(2)

今回は, 前回[1]のひらがなデータを使って, Deep MNIST for Experts[2]で紹介されてるCNN(Convolutional Neural Network)を試してみた. [モデル構造] 1.畳み込み層 2.プーリング層 3.畳み込み層 4.プーリング層 5.全結合層 6.Softmax Regression層[学習] 対…

TensorFlowで文字認識にチャレンジ(1)

TensorFlowのチュートリアル[1]の中に, 手書きの数字認識を試すものがある. 数字であれば99%以上の認識性能を出すことができるが, 日本語のかな/漢字ではどの程度の認識性能が出るのだろうか? そこで, まずはひらがなで認識を試してみることにした.Deep Lea…