AI 学習サービス Aidemy 受講メモ 01 「AI マーケター育成講座」(テキスト分析, DMP, クラスタリング, 強調フィルタリングによるレコメンデーション)

AI 学習サービス Aidemy (アイデミー) の、「Aidemy Premium Plan」を
一部体験させていただけることになりました！　なので、そこで学んだことを、皆さまにもシェアできればと思い、授業メモを取ることにしました。

私は昔から学校の授業とかで丁寧にノートを取ることが好きで、ノートを取ることで覚える（学習する）タイプです。
なので、せっかくなので自分用の学習ノートを公開して、誰かの学習のお役に立てればなと思っているのですが、
もちろん、当然、
私のこのノートを見るよりも 実際の Aidemy さんの動画教材 を見た方が理解度は高い です。図がたくさんあって分かりやすいです。

カリキュラム

（↓ 私はこれ全部受けられるわけじゃないけど、一応カリキュラム全部載せておく）

AIマーケター育成講座 (今日はこれ！)
機械学習概論
機械学習の種類
機械学習の流れ
機械学習にどれくらいデータが必要なのか
機械学習におけるデータ分割方法
Python入門
Numpy
Pandas
Matplotlib
オープンイノベーション実践のためのAIリテラシー
ビジネス数学
データサイエンティスト超入門
AIマーケター育成講座3-7
データクレンジング
機械学習におけるデータ前処理
教師あり学習（回帰）
教師あり学習（分類）
教師なし学習
自然言語処理
日本語テキストのトピック抽出
ディープラーニング基礎
RNN_LSTM
時系列解析Ⅲ（LSTM応用）売上予測
自然言語処理を用いた質問応答

今日のゴール

（今日は「AI マーケティング講座」なので、マーケ視点での AI の話になる）

AI をマーケティングに活用するステップが分かる
マーケティング活用のどんな部分に AI を活用できるのかが分かる
実際に AI を使ってどう解決するのかの概要が分かる

AI をマーケティングに活用する流れ

AI で解決する課題を特定する

まず大切なのは AI で解決する課題を特定することです。

大切な視点 3 つ

経験や条件によって判断や分類を行っているか
その経験や条件をデータとして取得できるか
そのデータ量が適切か

データの収集と蓄積

課題が特定できたら、データの収集と蓄積を行う。
様々なデータ（商品データや調査データ、SNS、購買データなど）を
収集ツールを使い、蓄積ツールに落とす。
その蓄積ツールに落としたデータを AI で分析することでマーケティング施策を行う

蓄積されたデータのプラットフォームを
「DMP (Data Management Platform)」と呼ぶ。

その DMP にたまったデータを使って、AI で分析して、マーケティングに応用していく、という流れになる。

マーケティング全体概要

この講座では、この図の右側の、大きく 6 つの例について紹介される。

(1) ユーザクラスタリング

どこのユーザ層に、どういった切口で、どこにターゲティングしていくのか。

プロモーションする対象を正確に把握するために、
ユーザの属性や行動情報から
自動で クラスタリング (似た属性ごとに分けて集めること) する。

（同じ施策を全ユーザーに行っても、反応は限られてしまう。そこで、ユーザーをクラスタリングし、それぞれに適した施策を行っていくべき。）

ユーザの属性としては、例えば、
性別、年齢、地域、購入品目、購入頻度、滞在時間、最終来訪日、など。

その情報を AI に渡すと、自動で
「〇〇層」「△△層」とクラスタリングしてくれて、
それぞれの層に対して施策 A 施策 B と適用していく。

ユーザークラスタリングのステップ

ユーザーに関係するデータを収集
(様々な場所に散らばったユーザーデータを DMP に集約する)
収集されたデータを前処理
(収集されたデータを、AI が処理できる形式に前処理する。例えば One-hot エンコーディング や欠損値の補完、「男性」を「1」、「40 歳」を「0.78」など)
前処理されたデータをもとに k-means 法 (教師無し学習のアルゴリズムの一種) により分類

ユーザークラスタリングの応用例

CV (コンバージョン) に近いユーザー (もう少しで商品買ってくれる人など) への訴求
(例えば、その CV に近いユーザーと同じクラスタのユーザに、もっと頻繁にメールとか送っても嫌がられない可能性が高い)
チャーン (解約) 予測
(例えば、解約済みユーザと属性が近いユーザは、近い将来解約する可能性が高い。このユーザーには解約を防止するようなメッセージを送ったりする)
LTV (Life Time Value) シミュレーション
(LTV (顧客生涯価値) : ユーザーが将来的にどれくらいの収益を生んでくれるかの予測)

(2) Product → SNS テキスト分析

製品に対しての評判を見ていく。
SNS のテキストを分析する。

Microsoft の AI サービスの一つの、テキストのネガティブ・ポジティブ分析やキーワード抽出のできる『Text Analytics API 』なんかも使われそうだなと思った。

SNS テキスト分析のステップ

Twitter から製品情報に関するツイートを取得
(Twitter API を使って、特定のキーワード (製品名など) に関するツイートを取得する。「松屋がうまい！🥰」など)
テキストデータの前処理
(収集されたデータを処理しやすくなるように前処理する。記号や絵文字の除去とか大文字小文字をそろえたりとか。「松屋がうまい」など)
形態素分析
(形態素への分割と品詞タグ付けの作業を行う。「'松屋' 'が' 'うまい'」など)
ツイートのベクトル化
(それぞれのツイートを分類できるようにベクトル化する。Doc2Vec など使う。 「'松屋' 'が' 'うまい'」 → [0.242, 0.95, 0.48]など)
生成されたモデルにつぶやきを入れて分類
(ユーザークラスタリングと同様に k-means 法 で分類)

テキスト分析の応用例

アンケート分析
レビュー分析（EC サイト、アプリストア）

(3) Price → ダイナミックプライシング (動的価格設定)

マーケティングの重要な目的のひとつに、価格を決定する、というものがある。
つねに一定の価格ではなく、条件によって価格を変えていく必要がある。

それが「ダイナミックプライシング」(商品やサービスの価格を需要と供給の状況に合わせて変動させる価格戦略) で、これも AI を用いて行うことができる。

例えば、Airbnb は、
場所、気候、宿泊者レビュー、イベント情報、宿泊日付、PV、時期、
などの条件を見て、変動する需要に合わせ、AI で最適な価格を算出している

ダイナミックプライシングのステップ

価格に関係するデータを収集
(様々な場所に散らばった価格に関するデータ (気候やページビューなど) を DMP に集約する)
収集されたデータで回帰モデル（価格予想モデル）構築
(過去のデータを使って適正な価格を算出するモデルを構築する。今回の場合、目的変数が「価格」、説明変数が上記に挙げた条件たちになる。代表的な回帰問題のアルゴリズムとして 線形回帰 や ランダムフォレスト などがある)
構築されたモデルを実システムへ導入
(構築したモデルを使って価格を算出し、各システムと連携する)

回帰モデルの応用例

サイトアクセス予測
広告出稿量の最適化

(4) Place → 来客予測

リアル店舗を持つビジネスだと、どういったところに出店し、

その出店を行った店舗にどれくらいお客さんが来るのか
を AI を使って予測する。

店舗の立地や時期、天候、競合情報、人口などから来客数の予測をする。
店舗の出店戦略や運営時の人員配置に役立つ。

(5) Promotion → レコメンデーション

どういったユーザに、どういった商品が適しているのか。
購買データの近いユーザを見つけ出し、購入しそうな商品をレコメンドする。

「この商品を買った人はこの商品も買っています」

レコメンドエンジンの種類

協調フィルタリング
(ユーザの行動パターンから人同士や商品同士の相関性を求め、それをもとにレコメンドしていく手法)
コンテンツベース
(レコメンドするコンテンツ (商品) の特徴から類似性を求め、それを元にレコメンドしていく手法。同じような商品を買った人はまた同じような商品を買う可能性が高い)
ベイジアンネットワーク
(ユーザの行動や商品の特徴を事象として見立てて、その発生確率が算出されるモデルを構築し、もっとも発生確率の高い商品をレコメンドする)

この講座では、一番上の協調フィルタリングを使ったレコメンドエンジンについての解説をする

レコメンデーションのステップ (協調フィルタリング)

購買に関係するデータを収集
(ユーザの購買情報を DMP に保存)
データをもとにユーザごとの類似度を算出
(購買情報をもとに類似度を計算。例えば同じような商品を買った人は似てるわけだけど、ユーザ A さんにどれくらい似てるか、この人と似てる人はいないか、という、類似度を見ていく。この「類似度」の計算に ユークリッド距離 や ピアソン相関係数 がある)
類似度を使ってコンテンツを重みづけ
(類似度をそれぞれの購買商品に掛けて重みづけをする。「購買情報」ｘ「類似度」→「ユーザ A に対する推薦度 (商品a: 0.47, 商品b: 0.13, ..)」。算出された推薦度に応じて商品をレコメンデーションできる)

(6) Promotion → 広告制作

広告に必要なメッセージや画像を、AI を使って自動生成する。（え、すごい、そんなことできるの！？）

商品データ（商品画像、カテゴリ、商品情報、訴求内容）を
AI に食わせて
バナー画像やキャッチコピー、商品説明文を吐き出す。

本講座では文章の自動生成について。

文章の自動生成のステップ

文章のもととなるデータを準備
(文章データを DMP に集約する)
文字ごとにインデックス化
(前処理の一部。文字情報を使いやすくするためにインデックス化 (数値化) する。例：A, B, C, .. → A:0, B:1, C:2, ..)
文章データの時系列化
(文章データを時系列データとして扱うために分割する)
文字列の予測モデルを生成
(分割したデータを使い、次の 1 文字を予測するモデルを生成。代表的な手法として LSTM (Long short-term memory) がある)
モデルを使って文章を生成
(モデルを使い、文字生成 (次の 1 文字は何？) を繰り返すことで文章を生成する)

まとめ

いろんなもので「これは AI で解決できる課題か」というのを考えていこう！

Next Step

次の記事：
『AI 学習サービス Aidemy 受講メモ 02 「機械学習概論」(人工知能, 機械学習, 深層学習)』

リンク

AI 学習サービス Aidemy の『AI マーケター育成講座』
画面ポチポチで機械学習ができるサービス『Azure Machine Learning』
Microsoft の AI サービスの一つの、テキストのネガティブ・ポジティブ分析やキーワード抽出のできる『Text Analytics API 』