はじめに
前提として以下のimport文を書いているものとします。
また対話的に実行をするためにeagerモードを用います。
GPUのメモリを必要な分だけ利用
GPU利用時に以下のコードでTensorFlowは必要な分のメモリを逐次利用していくようになります。このように明記しない場合には、TensorFlowはeager modeであろうがなかろうが、GPUのメモリを可能な限りほとんど全て専有してしまいます。
このモードではある計算を実行する際に、どれくらいメモリが消費されているのかをnvidia-smiなどで確認することができます。湯水のようにGPUを使える環境でない場合は、上記のconfigを用いるのがおすすめです。
GPU、CPU 、numpyとの変換
eagerモードでのGPU利用とCPU利用
eagerモードではGPUを利用するかCPUを利用するかを明示しなければなりません(eagerモードでない場合は、利用可能であれば自動的にGPUを利用する)。例えば、xにGPU上のtf.Tensorをもたせる場合以下のように書く必要があります(例として10×10の2DTensorを正規分布から生成)。また/gpu:番号はGPUを指定するインデックスです。
CPU上に値をもたせる場合には以下のようになります。
GPU上に配置した値をCPUへ転送、あるいはその逆を行うメソッドがtf.Tensorには備わっているため以下のようにそれぞれ実行することができます。
TensorFlowはGPUとCPUでほとんどシームレスに動作する事が(私の中では)強い売りであったので、最初このことに気づかずにCPUで計算を行っており、「eagerモード遅すぎ!」って勝手に思っておりました。改めてGPUの偉大さを実感しましたよ。
tf.Tensorとnumpy
tf.Tensorの中にはnumpyが入っており、tf.Tensor.numpy()によって取り出すことが可能です。
このとき、tf.TensorはGPU上にあってもCPU上にあっても構いません。
これはPyTorchには無い利点でした(PyTorchだと一々cpuに転送が必要でした)。
従って、上記のx_numpy1 == x_numpy2はしっかりTrueを返してくれます。
逆にnumpyからtf.Tensorへ変換する場合には以下の処理を行います。
tf.convert_to_tensorでもtf.constantでも構いません。with tf.deviceで指定を行わない場合にはcpuにtf.Tensorを配置することになります。
基本的な演算
四則演算
以下に四則演算やmodなどの重要な演算の関数についてまとめます。関数を使わなくとも、よく使い慣れている記号を用いても演算が実行可能です(あんまりTensorFlowの関数で四則演算を呼び出す機会は無いかと思います)。
論理演算
論理演算も地味に準備されています。ただし、tf.bool型を扱います。
商以下の最大整数と余剰
あとはプログラミングでよく出てくるここらへんも抑えてあります。
他にも不等式などもpythonに準じて用いることができます。
(偏)微分関数
TensorFlow eagerモードで独特(TensorFlowだと普通なのかな?)だと感じたのは微分関数の取り扱いです。まず初めに、流儀としてはpythonの関数で普通に数学の関数を書きます。
ここでは例として以下の関数を扱いましょう。
これをPython関数で
と書いておきます。
これに対して、
によって勾配関数、grad_fが返ってきますが、この中身は
となっていると考えると良いようです。
例えばを代入すればこの勾配関数は
となるはずであり、実際に以下のコードによって、このタプルが返ってきました。
多分ニューラルネットワークのパラメータ更新を行う際にはこれは使いません。
ニューラルネットのパラメータに関する微分を全部やってくれる関数が別で準備されているので、ここで紹介した微分関数はもっと細かいことを自分で書いたり、あるいは勾配を必要とする他のアルゴリズムをあれこれ書く時に使うものだと思われます。
学習で用いる微分関数
学習では、入力データと目標値を引数とする損失関数を構築し、この損失関数のパラメータに関する勾配がほしいということになります。
すなわち損失関数というのはという関数であり、を固定したの偏微分が欲しいということです。これがニューラルネットワークの学習の基本的形になります。
コードとしては以下のようになります。ここでニューラルネットワークは、単に入力との内積を取るだけのとしています(パラメータは)。
入力と目標値を引数に取る損失関数をpython関数でとして定義して、それをtfe.implicit_gradientsに渡します。
はあたかもの関数として書いていますが、当たり前のようにニューラルネットワークにはパラメータが存在するので、tfe.implicit_gradientsでは暗黙的にニューラルネットワークのパラメータに関する偏微分を実行してくれます(tensorflowではパラメータに対してtf.Variableの型を与えることで区別が付くようになっている。tfe.implicit_gradientsは、計算の中でtf.Variableの型による偏微分のみを持ってきてくれる)。
あとは適当なoptimizerを準備して(ここでは普通の勾配降下法)、パラメータ更新のためのメソッドapply_gradientsを実行することで学習を行うことができます。
ちなみにloss関数をpythonで書く時、modelがグローバルに扱われるのが気持ち悪ければ以下のように書くこともできます(数式で考えた時にはmodelのパラメータを引数として明示しているようなもの)。大抵はモデルを先に定義することが多いと思うのですが、まあ好みだと思います。
また、lossを逐次出力してログを取りたいということがあると思いますので、微分の計算時に同時にlossも吐いてくれる以下の関数(tfe.implicit_value_and_gradients)を活用することができます。
最後に
ChainerやPyTorchを使ってきた人なら、ここらへんまで抑えておけばトレーニングループを書くことは容易だと思います。ミニバッチ学習のためのイテレータはChainerやPyTorchではそれぞれ提供されていましたが、TensorFlowもきっと提供されていることでしょう(長らく触れていなかったのでよく分かりませんが)。
静的グラフを使う場合にはPythonでデータをfeed_dictで流すよりも、最初からイテレータの役割をするグラフを作ってしまってTensorFlowの世界だけで完結させるのが高速化の道だと思いますが、eagerモードだとどうなのだろう。
どっちにしても普通にPythonのインタプリタで学習ループ回す以外に方法が無いので、別にtensorflowが提供するデータローダみたいなのにはこだわらなくてもいいような。
ここらへんもうちょっと勉強してみてからまとめたいと思います。