推薦システム
1.2
- CTRを最大化したい推薦のときに、単純に平均値の推定だけを考えると、アイテムごとの推定CTRの分散の違いを無視することになる。
例:CTRのオフライン推定値はアイテム1に比べ2が小さいが、実際のCTRは2の方が大きいことがあり、これは2の推定CTRの分散が1より大きいことに現れていたりする。
分散がちがうのはアイテムごとにサンプルサイズが異なるのが原因。なので探索・活用戦略でサンプルサイズを平坦化する。
- CTRは移動平均や動的状態空間モデルなどの時系列手法でもとめる
時系列の本を別で読んだほうが良さそう
指数加重移動平均(EWMA)
ユーザーが興味ない同じアイテムが複数回表示されると良くないので、適当に割り引く