AnacondaによるTensorFlowインストール手順

Anacondaによるインストールは大変楽という噂がありますので試してみました。 AnacondaはデフォルトNumPy、 Pandas、 SciPy、 Matplotlib、 Jupyterなどが入っています。 他のパッケージ、例えばTensorFlow、 OpenCVも簡単にインストールでき、pyenv/virtualenvがいらなくなるのでおすすめです。 環境: Ubuntu 16.04 Anacondaインストール スクリプトダウンロード URL変える可能性があるのでまずHP確認してください。 https://www.continuum.io/downloads#linux $ wget https: »

最尤推定は何ができるの?

英語: Maximum Likelihood Estimation (MLE) 最近仕事で確率モデルを扱う機会があって、パラメータ推定には最尤推定を使うことがありました。 でもわかるような、わからないような状態なので、式を立てて一度整理したいと思います。 例1 問題 データ $D= { x^{(1)},..., x^{(N)} }$(母集団) が与えられるとします。 このデータが正規分布に従うと仮定したら、最尤推定でパラメータを推定しましょう。 回答 まず正規分布の式です。 $$ p(x) »

DeepLearning勉強会 - Assignment 6: LSTMs - Problem 1, 2

概要 深層学習勉強会の課題6(問題1+2)です。今回はLSTMを使って、言語モデルを作ることです。 課題の難易度が急に高くなりますね。 準備 データセットについて 学習データはtext8というデータセットを使います。 $ unzip text8.zip $ wc text8 0 17005207 100000000 text8 $ less text8 text8は17005207単語、100000000バイトというでかいテキストファイルです。最初の500文字を表示すると、 $ head »

MeCabをLambdaに動かすメモ

絶対忘れるので覚えるうちにメモをとります。 基本的はhttp://dev.classmethod.jp/cloud/aws-lambda-with-mecab/に沿って進めますが、ダウンロードURLが死んだり、pipのインストールパス変わったりしました。 0. Lambdaと同じ環境のEC2インスタンスを作る https://docs.aws.amazon.com/ja_jp/lambda/latest/dg/current-supported-versions.html サポートAMIが時々変わるようなので作るときは必ずチェックしておきましょう。 これからはEC2上に作業します。 »

MacでMongoDBメモ

機械学習で大量のデータを扱いにはデータベースが欲しくなります。SQLデータベースは設計が面倒なので今回はNoSQLのMongoDBを選択しました。 設定編 インストール $ brew update $ brew install mongodb データベースの保存先のディレクトリを作る $ sudo mkdir -p /data/db $ sudo chown -R 777 /data /data/dbはデフォルトなのでおすすめです。 777は多分危ないかもしれませんので、正しい権限を教えてください :bow: 起動 »

DeepLearning勉強会 - 講義ノート6

Sequences of Varying Length word2vecにより単語のモデルができました。次はテキスト(つまり単語のシーケンス)をモデル化しましょう。 今まで勉強したのは、入力いつもが固定サイズでした。固定サイズというのは入力をベクトル化できて、そのベクトルをニューラルネットワークに入れることができるとのことです。でも、テキストや音声などは固定サイズではなく可変長なシーケンスです。どうします? RNNs (Recurrent Neural Networks) CNN (畳み込みニューラルネットワーク)は空間的共有重みにより画像のパータンを抽出しました。 今イベントのシーケンスがあって、各時点で何が起こったのかを決定したい場合は、同じ共有重みのアイデアで、時間的共有重みも考えられます。 »

Elasticsearchチューニング作業

現在の情報を確認 $ curl -XGET 'http://10.0.15.74:9200/_nodes/stats' 設定変更 公式ドキュメントに沿って作業を進めます。 heap sizeを変更する ベストプラクティスはheap sizeをメモリの半分にすればよいです。但し、32GB以上に設定しないとのことです。 デフォルト値の確認: "mem":{ "heap_used_in_bytes":109944768, »

DeepLearning勉強会 - 講義ノート4

Convolutional Neural Networks(畳み込みニューラルネットワーク)の続きです。前半はこちら。 Convolutional Networks 主な概念 ストライド (stride): フィルタを順に適用していく際に、何ピクセルずらすのかという値です。 stride = 1: 出力が入力の大体同じサイズになります。 stride = 2: 出力が入力の大体半分のサイズになります。 大体といった理由は画像の端に何をするかによって変わるためです。 valid padding: 普通に画像の端からフィルタを適用していきます。こうすると、例えばstride = 1でも出力が入力より少し小さくなります。 »