2014年7月15日火曜日

Vrepロボットシュミレータを用いたDeepLearningによる強化学習(導入)

Vrep3Dロボットシュミレータを用いて、強化学習型DeepLearningを行なって、attenntionが生まれるか等、見ていきたいと思います。
さて、このシステムには何が必要か?
最初に必要なものを整理の意味も含めて列挙したいと思います。

1.Vrep:フリーの3Dロボットシュミレータ
   http://www.coppeliarobotics.com/

2.CDBN(ConvolutionalDeepBeliefNetwork):
DeepLearning!!
   http://web.eecs.umich.edu/~honglak/thesis_final.pdf

3.CUDA環境:
言わずと知れたGPU環境、DeepLearningには必須?
  (良いCPU使って最適化すれば十分という話も、、、)
   http://www.nvidia.co.jp/object/cuda-jp.html

4.RBMを用いた強化学習モデル:
あのHintonさんが10年前に既に作ってくれ
  てます。偉大すぎ(> <)
   http://www.ai.mit.edu/projects/jmlr/papers/volume5/sallans04a/source
/sallans04a.pdf


5.微分幾何:
NeuralNetの最大の問題点!中で何が起こってるのかわからない
  (汗)を回避する為に、、、
  (Bengio2011のdeep learningと階層的representationの論文に詳しいです)
  というか、自分の最終目標はこれを使って、現象を解析することです!
   おすすめ教科書(なぜこれかって? だってブルバキ記法嫌いでしょ?w)


上記5項目を、気の向くままに行なっていきます。なので、タイトルにはそれぞれの番号を振っていきます!



初回は、OSの選定だけしておきます、、、
GPU乗せているのがUbuntuなので、Ubuntuで作業します(以上w)
CUDAプログラムはMacのIDE上(nsight/cuda用)で作成し、Ubuntuに送りコンパイル&実行します(このときもlinux用nsight上で作業します)。CudaプログラムはWindowsでも作成可能ですが、Cデフォルトの乱数の出力がlinux.macとwindowsで違ったりと、デバッグとか面倒なので、今回Windowsは使いません。(でも、インストールはwindowsが一番楽です。)
IDE使うなよという話には対応できかねますw
私の本格的なプログラミング歴、まだ3年ちょっとなのでw
以下が環境の詳細です


Ubuntuマシン
CPU:cerelon(涙)
GPU:nvidia titan black
MEMORY:5GB(涙)

Macマシン
MacBook Pro 2009(涙)
GPU:nvidia
メモリ:4GB(涙)
HDD:SSD!!

それぞれ、CUDA5.5をインストール済み。

マシンしょぼすぎ、、、GPU以外全部私物だからねwww
結果出せてない院生の悲哀 orz

では、次回は1.Vrepの環境設定から、、、

ブログを始めるにあたって

ブログを始めるにあたって、いつまでも続けることをここに宣言しますw

はじめなので、取り急ぎ、ブログタイトルの説明をします。



これまで物理学は、基本的に位置と運動量を持つ「モノ」を説明してきました。
そして、素粒子物理学等では、このモノを説明する統一理論を目指しています。しかし、基本となる原理以外にも、物理学には多体系、複雑系といった、技術上の問題があります。つまり、人間程度の能力では、いくら原理がわかっても、それらが複雑にくみ合わさった、マクロな世界は予測できないと言う問題です。
わたしはこの問題に対して、人間の持っている「情報」という概念を使うことで乗り越えられるのではと考えています。つまり、量子力学的(ミクロ)現象もマクロで複雑な現象(温度とか?)も人間にとっては同じ情報だから、この視点でみれば良いんじゃね?ということです。
この視点でのわたしの試行錯誤をこのブログに記述していきたいと思います。


ちなみに、短期的には技術的特異点を目指します。(なんと傲慢なことでしょうw)
以下、前のブログからの引き継ぎ部分です。

技術的特異点とは、「強い人工知能」や人間の知能増幅が可能となったとき出現する。フューチャリストらによれば、特異点の後では科学技術の進歩を支配するの は人類ではなく強い人工知能やポストヒューマンであり、従ってこれまでの人類の傾向に基づいた人類技術の進歩予測は通用しなくなると考えられている。 (Wikipedia)

要は、人間の文明の成長速度が直線的であるのに対して、ムーアの法則などで有名なように、IT関連技術の発展速度が指数関数的であることから、人間のような人工知能ができたら、文明の発展速度が指数関数的になるということです。

このことに対しては、賛否両論ありますが、のび太君を信奉する私としては、「趣味は?」「仕事です」「奇特なご趣味をお持ちですね」という、働かなくていい世の中の実現は、素朴に大歓迎ですw

(参考)レイ・カーツワイル:今後現れるシンギュラリティ(技術的特異点)を学ぶ大学
http://www.ted.com/talks/lang/ja/ray_kurzweil_announces_singularity_university.html