Amazon Machine Learningで客数予想をしてみよう

イントロ

機械学習とか流行りですよねー。
AWSにもMachine Learningっていうサービスがあり、データを入れるだけで予想ができるようです。

ふーん、それは、俺が作ったEXCEL予測シートを超えるのか〜い?

 

と、無駄な対抗心が出てきたので試してみました。

 

準備

まずは、学習する日別客数を用意します。
だいたい、皆さんのHDDにはEXCELファイルで売上管理表とかがあると思いますので(えっ?)、それを使います。データの日付が10年前なのが、昔はスーパー経営してたんだぜー、的な時代を感じさせますねー。(しみじみ

weekday kyaku long seika fes posting newsp living weather year month day
Sun 302 1 0 0 0 0 0 rain 2006 10 1
Mon 326 1 0 0 0 0 0 sun 2006 10 2
Tue 294 1 0 0 0 0 0 sun 2006 10 3
Wed 317 1 0 0 0 0 0 sun 2006 10 4
Thu 269 1 0 0 0 0 0 rain 2006 10 5

この日別データを、学習用として1つ。そして予測したい日のデータとして1つ用意してください。

例としては、2014/01〜2015/12のデータを用意して、2016/01の予測をおこなう。みたいな感じです。

注意点として、データの一番上に見出しは英数字にしておく必要があります。また、各項目は0/1の分類なのか、数値なのかなどを考えておいたほうが良いです。

 

Machine Learningの使い方

準備

01初期画面

「Get started」から処理を始めます。この際、リージョンは、バージニア北部とアイルランドしか選べないので注意して下さい。

02スタート

データソース指定&モデル作成

03データ指定

この画面で学習データを指定します。データをまだ保存していない場合は、次の説明を参考に保存して下さい。

学習データ・予測データをS3へ保存

04S3バケット作成

S3にデータを保存します。バケットがない場合は作成からお願いします。なお、S3のパーミッションを設定していなかった場合は、YESを押すと自動的に設定されます。

05学習データ読み込み

 

データソース指定完了

06学習データ読み込み完了

 

スキーマ指定07スキーマ指定

ここでは各項目のデータタイプを指定します。結構重要なので、色々と変えて結果を比較することをおすすめしますよー

ターゲット指定08予測項目指定

予測する項目を指定します。
検索で一覧を絞り込みできるので、見間違いを軽減できますね!

ID指定09識別子指定

IDがある場合は指定可能です。IDに指定しておけば、学習に使わないとか書いているような?

確認画面10確認画面

データの設定を確認します。

MLモデルの設定11予測モデル指定

どういう方式で予測するかを決めます。客数予想の場合、デフォルトで大丈夫です。

確認画面12最終確認

MLモデルがデフォルトの場合はこれで完了です。

なお、作成完了までには結構時間がかかります。特に最後の1つが時間がかかるので、時々Refreshしながらお待ち下さい。

その間に、予測に使うデータのほうを読み込んでおくと時間短縮になります。先ほどと手順は同じですが、ターゲットの指定はなしになります。

13モデル作成〜evalition途中

予測開始

14予測開始

メニューを選びます。

予測作成開始

予測を作成します。15予想作成

モデルを選びます。16モデル選択

確認17確認

予測データを選びます。18予測データ指定

確認19予測データ確認

結果出力先を指定します。20保存先指定

作業完了21完了画面

あとはひたすら結果待ちです。

出力結果を確認

22保存データ確認

出来上がると、S3にデータが保存されていることが確認できます。

中にあるファイルをダウンロードし、数値の一覧を確認して実際と比較すると。

スクリーンショット_2016_03_08_17_29

こんな感じ。誤差20%以内なら100%的中。誤差10%以内で80%的中かな。

まぁ、もっと試してみないと分からないから、色々とやってみよう。

 

「Amazon Machine Learningで客数予想をしてみよう」への1件のフィードバック

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です