Azure Machine Learning Workspace のコンピューティング インスタンスに VSCode から SSH 接続

Azure Machine Learning Workspaceコンピューティング インスタンスに Visual Studio Code からリモート接続 する方法。

仕事の進め方がすっかり変わってしまって、自宅なりのリモートで仕事をすることが多くなったという人もいますね。
またはもともと出張とか外出が多い方も。

AI 関連のプロジェクトを担当している人は、オフィスには GPU を積んだ高性能な PC があるけど、自宅とか外出先だと開発できないというのはうれしくない。
そこでクラウド上の高性能なマシンで開発してみます。これなら場所も手元の PC も関係なく、いつでもどこでも GPU をバリバリ使って開発ができます。

以下はマシンごとの初期設定の話なので、一度環境を作ってしまえば次からはすぐに接続できます。
特に難しいことはないはずですが、SSH を知らない自分(恥)には初めての作業だったのでメモ。

続きを読む

データの相関係数を Azure Machine Learning の Notebook でサクッと視覚化する定石スクリプト

毎回自分が、過去のスクリプトからコピペするので、備忘録を兼ねて。
全然難しいことではないです。単に関数名とかパッケージ名を忘れるだけです(汗

データが機械学習の教師データとして使い物になりそうか?」をサクッと確認するためのスクリプトです。

サクッと確認することが目的なので、データサイエンティストにじっくり分析してもらう手前の簡単なデータチェックだと考えてください。
学習させる価値があるデータなのか “あたりを付ける” ことが目的。
十分な分析ではありませんが、イケそうなら後続の開発フローに早く流せるし、データの品質が良くないようなら何が問題かを明らかにして早めに再収集できますしね。

続きを読む

既存の py ファイルを #AzureML で実行・管理する方法

この投稿は、Azure AI Advent Calendar に参加しています。

Azure Machine Learning とは無関係に開発した、既存の py ファイルを AzureML のワークスペースで実行する方法と、そのメリットを紹介します。
おまけに VSCode の拡張機能込みでローカルの Azure ML 開発環境の作り方も紹介。公式の手順 も公開されてるし全然難しくないんですが、たまたま最近、環境構築でちょっと困っている人を見かけたので。

Azure Machine Learning のメリットと言えば

  • 基本的なライブラリや Azure ML に必要なライブラリが組み込まれた 仮想マシンを手間なく作成してくれる
  • Training Cluster は自動的にシャットダウンされるので、余計な課金を気にしなくてよい(設定にもよるけど)
  • 実験(=スクリプトの実行)の結果を自動的に管理してくれる

です。

メリットが強力なので、既存の py ファイルも Azure ML で実行するのがいいと思います。
既存のファイルに対して、ちょいちょいと簡単に対応できます。実験や結果の管理ができるのだから、やらない手はないでしょう。

続きを読む