ブログ更新がすっかり滞ってました (>_<)
「構造化データをツールで簡単に分析」というテーマで、ショートセッションしました。
2019年10月26日開催の 第3回 八王子 AI です。
Azure Machine Learning Service の Automated ML のトレーニング資料を GitHub で公開しました。
Automated ML は、教師データを与えるだけで自動的に複数回(アルゴリズムやハイパーパラメーターを変更しながら)の学習を自動的に実行してくれるものです。
もっとも精度が高い学習モデルを教えてくれるので、Docker イメージの作成やサービス化もワンストップで実現できます。
素晴らしい!
https://github.com/seosoft/Titanic_AutoML
Automated ML で二項分類 ~ タイタニック号から脱出できるか?
続きを読むAzure Batch AI は、名前の通り AI 用の Azure Batch サービスです。
高性能な GPU マシンを、学習モデルをトレーニングする時だけデプロイして使用できるもの です。
ジョブを開始すると自動的にデプロイされて、トレーニングが終了すると自動的にリソースが解放されるので、仮想マシンやリソースの課金を極力抑えることができます。しかも自動的にスケールする機能も持っています。
開発やデバッグを行うための環境ではないので、ローカルPCや DSVM (Data Science Virtual Machine) を使って事前にスクリプトやデータがきちんと用意する必要はあります。ハイパーパラメーターを変えながら、何度もトレーニングを繰り返す時に便利です。
突然ですが、AI ブームですね。
これまで Cogbot コミュニティで、Cognitive Services + Bot Framework に関連した活動をしてきましたが、ブームに乗って、私も Microsoft Cognitive Toolkit (CNTK) を始めました。(本当に始めたばかり・・・)
PC を用意しました、GPU対応の CNTK をインストールしました、まではいいのですが、Tutorial を実行しても、どうも GPU を使っているように見えません。
CNTK を始めたばかりの人限定の情報ですが(かつ NVIDIA の GPU を載せた PC を使っている人限定)、自分が悩んだ GPU を優先する方法の紹介。
ついでに CPU を優先する方法も紹介します。
※あえて CPU を使う理由はありませんが、人に説明する時に「ほら、こんなに違うでしょ」という話には使えるかと。
■ 対象のバージョン等の情報
対象のバージョンは以下の通りです。
Anaconda 3 は Visual Studio 2017 でインストールしました。CNTK については GPU wheel を pip インストールしただけ。
CUDA 周りは全く気にせずに環境が作れました。強い。
■ GPU を優先する方法
from cntk.device import gpu, try_set_default_device try_set_default_device(gpu(0))
■ (ついでに) CPU を優先する方法
from cntk.device import cpu, try_set_default_device try_set_default_device(cpu())
簡単ですが、知らないと PC のせっかくのパワーを活用できません。
これで楽しく深層学習しましょう。
しばらくブログを書けずにいました。
復活の一発目が CNTK とは・・・w