読者です 読者をやめる 読者になる 読者になる

みらいテックラボ

音声・画像認識や機械学習など, 管理人が興味のある技術の紹介や実際にトライしてみた様子などメモしていく.

ペットボトルを認識してみよう! (5)

今回は, 昨年の10月~12月に開催された「チームで学ぼう! TensorFlow(機械学習)実践編第2期」において, 私の参加した「チーム仲鶴後吉(仮)」の取り組んだ内容の番外編である.最近, AWSのGPUを使うようになり, 大規模なモデルの学習ができるようになったので,…

ペットボトルを認識してみよう! (4)

これは, 昨年の10月~12月に開催された「チームで学ぼう! TensorFlow(機械学習)実践編第2期」において, 私の参加した「チーム仲鶴後吉(仮)」の成果を数回に分けて紹介するものである. 前回までは, STEP1としてペットボトルが1本だけ含まれる画像のカテゴリ認…

おススメ! Deep Learning AMI

最近, Deep Learningを使った画像認識などにチャレンジしているのだが, 学習時間の短縮のために時々AWSのG2インスタンを使うことがある.G2インスタンスを使う場合, ここ[1]などのようにCUDAやcuDNNをインストールしてGPUを使えるようにし, その上でTensorFlo…

ペットボトルを認識してみよう! (3)

これは, 昨年の10月~12月に開催された「チームで学ぼう! TensorFlow(機械学習)実践編第2期」において, 私の参加した「チーム仲鶴後吉(仮)」の成果を数回に分けて紹介するものである. 前回までは画像データの収集や学習データの準備について紹介したが, 今回…

ペットボトルを認識してみよう! (2)

これは, 昨年の10月~12月に開催された「チームで学ぼう! TensorFlow(機械学習)実践編第2期」において, 私の参加した「チーム仲鶴後吉(仮)」の成果を数回に分けて紹介するものである. 前回は「データ収集と整備」について紹介したが, 収集できた画像は約450…

ペットボトルを認識してみよう! (1)

これは, 昨年の10月~12月に開催された「チームで学ぼう! TensorFlow(機械学習)実践編第2期」において, 私の参加した「チーム仲鶴後吉(仮)」の成果を数回に分けて紹介するものである. (勉強会からずいぶん時間が経ってしまったが....)0. メンバー紹介 メンバ…

データサイエンス・オンライン講座「社会人のためのデータサイエンス入門」の紹介

日本発のMOOCプラットフォームGacco[1]で, 12月13日からデータサイエンス・オンライン講座「社会人のためのデータサイエンス入門」[2]が始まっている. この講座は平成27年3月に開講されており, 今回は再開講とのこと.総務省統計局「社会人のためのデータサイ…

「14のフレームワークで考えるデータ分析の教科書」の紹介

「ビッグデータ」「データサイエンティスト」「アナリティクス」... ここ数年、データ分析に関する言葉を耳にする機会が急激に増えた. データ分析についてなんとなくは理解しているのだが, 一度データ分析手法などの基本を知ろうと思い読んでみた.この本を選…

「ゼロから作るDeep Learning - Pythonで学ぶディープラーニングの理論と実装」の紹介

SOLEIL DATA DOJO主催の「TensorFlow勉強会#10」[1]でこの本を取り上げていたので, 読んでみることに. 最近出版された機械学習関連本の中では, かなり評判のよい人気本である. 目 次 1章 Python入門 2章 パーセプトロン 3章 ニューラルネットワーク 4章 ニュ…

データサイエンス・オンライン講座「社会人のためのデータサイエンス演習」の紹介

日本発のMOOCプラットフォームGacco[1]で, 11月1日から始まったデータサイエンス・オンライン講座「社会人のためのデータサイエンス演習」[2]を受講してみた.総務省統計局「社会人のためのデータサイエンス演習」講座PV講義内容: 第1週 データサイエンスと…

「Amazon Web Servicesではじめる新米プログラマのためのクラウド超入門」の紹介

DeepLearningを試し始めると, GPU環境がほしくなってくる. GPUボード積んだ自作マシンを製作するか, AWSなどのクラウドを活用するか悩むところである. そこで, まずはAWSを試してみようと思い, AWSを使っている知人に相談しすすめられたのがこの本である. 目…

「ビッグデータと人工知能 - 可能性と罠を見極める」の紹介

最近, 人工知能(AI)関連の本が増えてきたが, ビッグデータと人工知能の活用で明るい未来社会をイメージさせるものが多い. 書店でこの本を手に取り, まえがきを見て, 他の本と少し違う感じがしたので読んでみることに. 目 次 第1章 ビッグデータとは何か 第2…

「Pythonで体験する深層学習」の紹介

発売前に, タイトルを見て面白そうと予約購入したのだが, 先日やっと読み終えた. (実は別の本を先に読んでいただけ...) 目 次 第1章 はじめに 第2章 Python 第3章 ニューラルネットワークの基盤となる考え方 第4章 深層学習理論 第5章 深層学習の現在 第6章 …

「事例+演習で学ぶ機械学習 ビジネスを支えるデータ活用のしくみ」の紹介

「事例+演習で学ぶ機械学習 ビジネスを支えるデータ活用のしくみ」(速水悟著)の本の紹介の中に, 「部屋の賃料の予測」「顧客の分類」といった身近な話題を用いて、線形識別や決定木などの基本的な手法について解説します。「Netflixによる映画の評価…

「機械学習と深層学習 C言語によるシミュレーション」の紹介

近年, Caffe[1], Chainer[2], TensorFlow[3]などの深層学習フレームワークを活用することで, 簡単に深層学習を試せるようになった. また, 深層学習に関する書籍もここにきて増えてきているが, 理論の展開や機械学習ライブラリ等の活用ものが多く, 具体的な処…

TensorFlowで文字認識にチャレンジ(9)

TensorFlowによる日本語のかな/漢字の手書きデータの認識について, これまで何回かに分けて検討してきた. そして, ある程度の認識性能を実現できることも確認できた. 日本語のかな/漢字の認識については, 今回でいったん最後にしようと思うが, 最後に学習デ…

TensorFlowで文字認識にチャレンジ(8)

従来のオンライン手書き文字認識[1]では, 筆点列からストロークの最初/最終の筆点や変化点などの特徴点, 特徴点間の移動距離/方向などの特徴量を抽出し, DPマッチングやHMM(Hidden Markov Model)などの手法を用いて入力とモデルの照合を行っている.前回[2]は…

TensorFlowで文字認識にチャレンジ(7)

前回までは, 手書きの文字を28×28画素の画像とし扱い, CNN(Convolutional Neural Network)による文字認識や認識性能の改善について検討してきた. しかし, 現状ではJIS第一水準(2965文字種)を認識対象とすると, 約91%の1位認識率しか得られていない. そこで, …

「進化計算と深層学習 創発する知能」の紹介

Amazonの「あなたのお買い物傾向から」で, 「進化計算と深層学習 創発する知能」(伊庭 斉志著)を進められたので, 読んでみた. 目 次 第1章 進化計算入門 第2章 ニューラルネットワークと学習 第3章 深層学習(ディープラーニング) 第4章 進化するネットワーク…

TensorFlowで文字認識にチャレンジ(6)

今回も, 認識性能を改善するために, 前々回[1]記した1)のオンライン手書きデータの画像化/正規化を検討してみた.これまでの学習/評価で使用してきた手書きデータは, オンライン手書き文字認識の前処理を施したデータから28×28dotの画像を生成したものであっ…

TensorFlow はじめの一歩(7)

今回は, TensorFlowのちょっとしたエラーの話である.TensorFlow r0.8で漢字認識[1]を試していると, 下記のように学習途中でトレーニングデータの認識性能が急に0になるような症状が時折発生した.学習ログ:--- Start Learning --- # Learning data num = 649…

TensorFlowで文字認識にチャレンジ(5)

今回は, 認識性能を改善するために, 前回[1]記した改善案2)のCNN構造について考えてみる.これまで試してきたモデルは, Deep MNIST for Experts[2]をベースにしており, 以下のような構造をとっていた. これまでの認識手法なら, エラーしたサンプルの処理過程(…

TensorFlowで文字認識にチャレンジ(4)

今回は, 前回[1]の漢字認識において, エラーしたデータを確認してみることに.前回の認識率: ---------- Total Accuracy ---------- 1位 : 88.31 % ( 10387 / 11762 ) 2位 : 94.68 % ( 11136 / 11762 ) 3位 : 96.58 % ( 11360 / 11762 ) 4位 : 97.39 % ( 1145…

TensorFlowで文字認識にチャレンジ(3)

今回は, 前回[1]の認識対象をひらがな73文字から漢字(JIS第一水準)2965文字に広げて試してみた.認識対象の文字種が約3,000字かつ学習データが約50,000サンプルということで, 私の環境(*1)ではメモリ不足でエラーとなった. *1:ホストマシン: CPU:Intel Core…

TensorFlowで文字認識にチャレンジ(2)

今回は, 前回[1]のひらがなデータを使って, Deep MNIST for Experts[2]で紹介されてるCNN(Convolutional Neural Network)を試してみた. [モデル構造] 1.畳み込み層 2.プーリング層 3.畳み込み層 4.プーリング層 5.全結合層 6.Softmax Regression層[学習] 対…

TensorFlow はじめの一歩(6)

TensorFlowで学習を行っていると, 学習の収束状況を確認するために, lossやaccuracyが学習とともにどのように変化していくか, 視覚化したくなることがある.そこで, 今回はスカラ値を視覚化する方法についてまとめておく.基本的な流れ[1] ⅰ) SummaryWriterの…

TensorFlowで文字認識にチャレンジ(1)

TensorFlowのチュートリアル[1]の中に, 手書きの数字認識を試すものがある. 数字であれば99%以上の認識性能を出すことができるが, 日本語のかな/漢字ではどの程度の認識性能が出るのだろうか? そこで, まずはひらがなで認識を試してみることにした.Deep Lea…

TensorFlow はじめの一歩(5)

TensorFlowでチュートリアルを試していると, - 学習の途中で学習パラメータを保存し, その学習パラメータを読み込みで継続学習をしたい. - 学習パラメータを保存し, その学習パラメータを読み込んで評価したい. といったことがある.そこで, 今回は学習パラメ…

TensorFlow はじめの一歩(4)

TensorFlowで何ができるかを知るには, やはりまずTensorFlowに触れてみることが大事です. とはいえ, API Documentationを見ながら自分で一からプログラミングするのは, なかなかハードルが高いです. そこで, まずは自分が興味のある分野のチュートリアル[1]…

「Pythonによるデータ分析入門 - NumPy、pandasを使ったデータ処理」の紹介

主にGoogle社のTensorFlowをベースに機械学習を試し始めているが, 機械学習のライブラリやフレームワークはPythonを利用するものが多い.これまで, 私はC/C++/C#やJavaなどによるプログラミングが多かったので, Pythonはまだまだ初心者である. こんな初心者の…

「ITエンジニアのための機械学習理論入門」の紹介

以前, パターン認識や機械学習を仕事で使っていたので, 最近の深層学習(Deep Learning)にはすごく興味がある. ただ, 久しく機械学習から離れていたので, 少し基礎的なことを思い出そうと「ITエンジニアのための機械学習理論入門」(中井悦司著)を購入し, 読ん…

TensorFlow はじめの一歩(3)

今回は, 数学関数[1]に関するPython APIをベースに, どのような演算できるか確認してみる. 注) TensorFlow : Python API 0.6.0ベース1. 四則演算 API機能 tf.add(x, y, name=None)加算 : x + y tf.sub(x, y, name=None)減算 : x - y tf.mul(x, y, name=None)…

TensorFlow はじめの一歩(2)

今回は, 定数/数列/乱数テンソル[1]に関するPython APIについて, 少しまとめておく. 注) TensorFlow : Python API 0.6.0ベース1. 定数テンソル API機能 tf.zeros(shape, dtype=tf.float32, name=None)すべての要素が0のTensorを生成 tf.zeros_like(tensor, d…

「TensorFlow」で学ぶDeep Learning講座の紹介

「GoogleとUDACITY、「TensorFlow」で学ぶディープラーニング講座を開設」[1]という記事を見つけた.www.itmedia.co.jp記事によると, Googleが無料オンライン学習プログラム(MOOC)UDACITYと協力し, ディープラーニングを学べる無料コース「Deep Learning : Ta…

機械学習プロフェッショナルシリーズ「深層学習」の紹介

深層学習(Deep Learning)について理解を深めようと, 機械学習プロフェッショナルシリーズの「深層学習」(岡谷貴之著)を読んでみた. 目 次 第1章 はじめに 第2章 順伝播型ネットワーク 第3章 確率的勾配降下法 第4章 誤差逆伝播法 第5章 自己符号化器 第6章 …

TensorFlow はじめの一歩(1)

Googleが2015年11月に深層学習フレームワーク「TensorFlow」をオープンソースとして公開した. Googleの画像検索をはじめ, いくつかのサービスで実際に使用しているということもあり, 大変注目を集めている.私自身を含め, TensorFlowがなんだか話題になってい…

「実践 機械学習システム」の紹介

最近の機械学習について知ろうと思い, 「実践 機械学習システム」(Willi Richert著, 他)を少し前に購入し, 読んでみた. 目 次 1章 Pythonではじめる機械学習 2章 実例の対象とした分類法入門 3章 クラスタリング:関連のある文書を見つける 4章 トピックモデ…

みらいテックラボ開設

管理者のMoonlight明日香です. ここ数年, よく人工知能という言葉を聞くようになった. 第3次ブームに差しかかっている感じ. 私は第2次ブーム(1980年代)に大学で人工知能を少しかじり, 某電機メーカーに就職した後も, しばらくはパターン認識や機械学習などに…