商品購入ログから商品間の類似度取得・クラスタリング
商品購入ログを使って商品の共起分析。
以前行った実験と同じデータを使ってより高度な前処理を行う。
前回の実験↓
今回は下記の図に示すようにデータを加工していく。
ログデータのクロス集計までは前回と一緒。
その後、
- 共起行列
- PPMI
- SVD
と続く。
成果物として、
- アイテム間のコサイン類似度表
- アイテムのクラスタリングリスト
が得られる。
商品購入ログを使って商品の共起分析。
以前行った実験と同じデータを使ってより高度な前処理を行う。
前回の実験↓
今回は下記の図に示すようにデータを加工していく。
ログデータのクロス集計までは前回と一緒。
その後、
と続く。
成果物として、
が得られる。
商品購入ログから商品の推薦を行う。
「この商品を買った人はこれも買ってます」というやつ。
これは共起分析によって簡単に実現できる。
共起分析とは「共に起こる」の通り、同時に発生したかどうかを特徴として分析する手法。
具体的に今回の購入ログの例でいうと、
「あるユーザーが商品Aと商品Bを両方購入している」とか、
「ある商品をユーザーAとユーザーBが両方購入している」とか、
そういった情報を特徴として分析に使用する。
これによってある商品を買った人が一緒に何を買いがちか分かる、
この結果を任意の商品を買ったユーザーに伝えることで他の商品を推薦できる。
今回はPythonで実験する。
↓のようなログデータを一定時間ごとに集計したい。
datetime | type |
---|---|
2017-01-01 00:19:04 | 罠 |
2017-01-01 00:57:06 | 魔 |
2017-01-01 01:11:50 | モ |
2017-01-01 01:29:28 | 罠 |
2017-01-01 01:36:43 | 罠 |
2017-01-01 01:42:17 | 魔 |
2017-01-01 01:54:22 | 魔 |
2017-01-01 02:10:51 | モ |
2017-01-01 03:07:43 | モ |
2017-01-01 03:41:04 | 罠 |
2017-01-01 03:57:11 | 罠 |
2017-01-01 04:25:50 | 魔 |
2017-01-01 04:59:47 | 魔 |
2017-01-01 05:01:06 | モ |
2017-01-01 05:18:54 | モ |
2017-01-01 06:28:33 | 罠 |
2017-01-01 06:34:22 | 魔 |
2017-01-01 07:27:21 | 魔 |
2017-01-01 08:19:43 | モ |
2017-01-01 09:07:34 | モ |
Update your browser to view this website correctly. Update my browser now