Azure Machine Learning Studio でデータセットの列名を変更する方法

Azure ML Studio で学習モデルを作る際、データセットの列名を変更したいことがあります。

  • 既存データの列名が適切ではない場合・・・例えば、ありがちなのは“ID”列。「外部キーとして使いたいから名前が“XxxId”とかだと都合がいい」ということがあります
  • 入手したデータセットが列名なしのデータだった場合・・・例えば UC Irvine Machine Learning Repository のサンプルデータは列名なしの CSV ファイルで、ML Studio に取り込むと、自動的に Col1, Col2,  … と振られます

 

UC Irvine Machine Learning RepositoryIris Data Set を例に、列名をデフォルトの Col1, Col2, … から変更する方法を紹介します。
ちなみに Iris Data Set の  CSV データ はここ、列名などの情報は ここ にあります。

2017-02-18 0-17-44

2017-02-18 0-20-08

 


Iris Data Set の CSV ファイルを ML Studio にアップロードして、Experimental に読み込むとこんな風になります。

2017-02-18 11-00-59

2017-02-18 11-06-39

Col1, Col2, … となっています。これを Iris Data Set の列名情報の通り、

sepal length in cm, sepal width in cm, petal length in cm, petal width in cm, class

とします。

[Data Transformation]-[Manipulation]-[Edit Metadata] をドロップして、“All Columns”を指定します。

2017-02-18 11-47-28

2017-02-18 11-49-27

2017-02-18 11-48-50

“New column names” に “sepal length in cm, sepal width in cm, petal length in cm, petal width in cm, class”と入力します。

2017-02-18 11-50-16

これで期待通りの列名になりました。学習モデルが作りやすくなりますね。

2017-02-18 12-13-38

 


凝ったことでも難しいことでもないのですが、説明している資料が意外と見つからないので(Edit Metadata を見てみればわかることですが、私は苦労しました・・・)、機械学習の「学習」のお役に立てれば。

2017年3月に2週連続で勉強会を開催します。解説+ハンズオン(もくもく会)の形式です。
1週目は 3月4日 (土) に機械学習、2週目は 3月11日 (土) に Cognitive Services + Bot Framework を、それぞれ学習します。
これを書いている時点では 4日の機械学習編は定員に達していますが、今後キャンセルする人がいるかもしれません。興味のある方は早めにキャンセル待ち登録をお勧めします。11日の Cogbot 編はより実用的な内容を扱いいます。こちらもお申し込みをお待ちしています。

広告
カテゴリー: 機械学習 タグ: , パーマリンク

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中