19
初ての Amazon Machine Learning (機械学習) 2016/10/01 JAWS-UG 白山 中道

Amazon Machine LearningJAWS-UG 北陸立ち上げのころから AWS を 触る。仕事(サシツマ開発)でも AWS を使 うことが多いです。• Facebook :やってます

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • 初めての

    Am

    azo

    n M

    ach

    ine

    Le

    arn

    ing

    (機械学習)

    20

    16

    /10

    /01

    JA

    WS

    -UG

    白山中道

  • 自己紹介

    -n

    km

    c

    •N

    km

    c(中道です)

    •白山市の創屋株式会社勤務

    •JA

    WS

    -UG北陸立ち上げのころから

    AW

    Sを

    触る。仕事(システム開発)でも

    AW

    Sを使

    うことが多いです。

    •Fa

    ceb

    oo

    k:やってます

  • 今日の内容

    •A

    ma

    zon

    Ma

    chin

    e L

    ea

    rnin

    g(A

    ML)のざっくりした説明

    •A

    MLで金沢市の気象データをもとに

    •明日雨が降るか

    •明日の天気

    •明日の平均気温

    を予測するハンズオン

    •機械学習についてちょっとだけ勉強

  • とっても参考になったサイト・情報源

    •ナレコム

    AW

    Sレシピ

    「A

    ma

    zon

    Ma

    chin

    e L

    ea

    rnin

    gを理解するために

    3つの方法で天気予測

    をしてみた」

    htt

    p:/

    /re

    cip

    e.k

    c-cl

    ou

    d.j

    p/a

    rch

    ive

    s/7

    69

    4

    •A

    WS今井さんのスライド

    htt

    p:/

    /ww

    w.s

    lid

    esh

    are

    .ne

    t/im

    aif

    act

    ory

    /am

    azo

    n-m

    ach

    ine

    -le

    arn

    ing

    -4

    74

    00

    14

    7h

    ttp

    ://m

    ed

    ia.a

    ma

    zon

    we

    bse

    rvic

    es.

    com

    /jp

    /su

    mm

    it2

    01

    5/d

    ocs

    /De

    v-

    03

    s-To

    kyo

    -Su

    mm

    it-2

    01

    5.p

    df

  • 機械学習ってなんだろう

    •機械学習とは、データから反復的に学習し、そこに潜むパターンを見

    つけ出すことです。

    •そして学習した結果を新たなデータにあてはめることで、パターンに

    したがって将来を予測することができます。

    •これは予測分析におけるモデル構築の自動化につながり、データサ

    イエンティストの人材不足を補うものになると、大きく期待されていま

    す。

    SA

    Sより引用

    htt

    p:/

    /ww

    w.s

    as.

    com

    /ja

    _jp

    /in

    sig

    hts

    /an

    aly

    tics

    /ma

    chin

    e-l

    ea

    rnin

    g.h

    tml

  • よく使われるものの例

    •ページランク

    •レコメンドエンジン

    •S

    PAMフィルター

    •ユーザー行動嗜好分析

    •ユーザー行動未来予測

  • Am

    azo

    n M

    ach

    ine

    Le

    arn

    ingの特徴

    •オンラインショッピングの「

    Am

    azo

    n」で実績のある機能

    •データサイエンティスト「ではない」人向けのサービス

    •使えるアルゴリズムは3種類

    •A

    WSマネージドなサービス

    •アプリケーション、

    AW

    Sサービスとの親和性

    •バッチ予測でまとまったデータを処理できる

    •リアルタイム予測でオンデマンドにデータを処理できる

  • Am

    azo

    n M

    ach

    ine

    Le

    arn

    ingの料金

    •料金は使用用途で

    3種類に分かれる

    •データ分析/モデルトレーニング/評価時

    •バッチ予測実行時

    •リアルタイム予測実行時

    •データ分析、モデルトレーニングおよび評価の時の料金

    •コンピューティング時間数に基づく(入力データ、データ量、アルゴリズムなど

    で変わる)

    •0

    .42

    US

    D/時

    •バッチ予測、リアルタイム予測についてはこちら

    htt

    ps:

    //a

    ws.

    am

    azo

    n.c

    om

    /jp

    /ma

    chin

    e-l

    ea

    rnin

    g/p

    rici

    ng

    /

  • AM

    Lで使える予測モデルとアルゴリズム

    •二項分類(

    Bin

    ary

    Cla

    ssif

    ica

    tio

    n):ロジスティック回帰

    •多クラス分類(

    Mu

    lti

    Cla

    ssif

    ica

    tio

    n):多項式ロジスティック回帰

    •回帰分析(

    Re

    gre

    ssio

    n):線形回帰

  • 各アルゴリズムの概要

    •二項分類(

    Bin

    ary

    Cla

    ssif

    ica

    tio

    n):ロジスティック回帰

    •対象が特定の属性を持つかで、

    2種類のグループに分類する

    •商品を購入するか・しないか

    •メールのスパム判定

    •今日のハンズオンでは

    •明日雨が降るか・降らないかを予測する

  • 各アルゴリズムの概要

    •多クラス分類(

    Mu

    lti

    Cla

    ssif

    ica

    tio

    n):多項式ロジスティック回帰

    •対象が属するグループに分類する

    •商品は衣類、食料品、文房具のどれか?

    •今日のハンズオンでは

    •明日の昼間の天気を予測する

  • 各アルゴリズムの概要

    •回帰分析(

    Re

    gre

    ssio

    n):線形回帰

    •***

    •特定商品の今月の売り上げを予測する

    •今日のハンズオンでは

    •明日の平均気温を予測する

  • ハンズオン

  • 気象庁のサイトから気象データをダウンロー

    ドする

    •h

    ttp

    ://w

    ww

    .da

    ta.j

    ma

    .go

    .jp

    /gm

    d/r

    isk

    /ob

    sdl/

    ind

    ex.

    ph

    p

  • 予め用意しておきました

    •ダウンロード、加工に時間がかかるので用意したものがこちら

    htt

    ps:

    //s3

    -ap

    -no

    rth

    ea

    st-

    1.a

    ma

    zon

    aw

    s.co

    m/p

    ub

    lic.

    nk

    mc/

    jaw

    sug

    _h

    aku

    san

    _h

    an

    dso

    n_

    20

    16

    10

    01

    .zi

    p

    •上記は加工済みですが、自分で用意する場合はファイルの加工が

    必要です。

    •文字コードを

    UT

    F8

    -Nにする

    •改行コードを

    LFにする

    •不要な行、不要列を削除する

  • 天気の概要の置換

    •A

    MLの初期設定では分類は

    10

    0種類までなので、削ります

    •*

    「、」以降を削除(雷あられを伴う等)

    •快晴

    →晴

    •薄曇

    →曇

    •霧雨、大雨、暴風雨

    →雨

    •あられ、みぞれ、大雪

    →雪

    •一時

    →時々、後時々

    →後

    •雨後雨、雨時々雨

    →雨

    •雪後雪、雪時々雪

    →雪

  • データ分析・トレーニングの待ち時間と料金

    •B

    ina

    ry C

    lass

    ific

    ati

    on

    1

    8m

    in•

    Da

    taS

    ou

    ce5

    min

    (4+

    4+

    5=

    13

    min

    )

    •M

    L m

    od

    el 2

    min

    •E

    valu

    ati

    on

    3m

    in

    •M

    ult

    i C

    lass

    ific

    ati

    on

    17

    min

    •D

    ata

    So

    urc

    e4

    min

    (4

    +4

    +4

    =1

    2m

    in)

    •M

    L m

    od

    el 2

    min

    •E

    valu

    ati

    on

    3m

    in

    •Li

    ne

    Re

    gre

    ssio

    n 1

    8m

    in•

    Da

    taS

    ou

    rce

    4m

    in (

    4+

    4+

    4=

    12

    min

    )

    •M

    L m

    od

    el 2

    min

    •E

    valu

    ati

    on

    4m

    in

  • さらに使いこなすために

    •レシピの変更

    htt

    p:/

    /de

    v.cl

    ass

    me

    tho

    d.j

    p/c

    lou

    d/a

    ws/

    am

    l-re

    cip

    e/

    •リアルタイム処理

    •バッチ処理

    •A

    WSの他サービスとの連携

  • 時間が余った人は

    •データをカスタマイズしてみましょう