背景
行動ターゲティング広告では似た嗜好をユーザをセグメンテーションし,セグメントごとに適した広告を提示したい.
じゃあどんなデータからやるのか,ってなると普通に考えてユーザiが広告jをクリックした回数を要素に持つ行列かユーザiがクエリjを入力した回数を要素に持つ行列かのどっちかを使おうという話になる.
一番理想的なのはをそのまま使いたいが,そもそもユーザは広告なんかほとんどクリックしない.じゃあ代わりにを使うかというとちょっと苦しいし,データの質とスパースさのトレードオフ.というのが行動ターゲティング広告研究の現場.
提案手法
Translated Learning*1と呼ばれる手法がある(らしい.今回はじめて知った).これは source の feature に行列をかけて target の feature に変換してやるみたいなノリ.
今回はそれに似たアイデアを使う.具体的には変換行列を考えて とかやって新たな特徴行列を得る.この時の とし,また,とする.なのでここにスパースなad click logのデータを突っ込んでやって,クエリログと組み合わせる.
これには
- 広告に関係無いクエリの影響を小さくできる
- 似たクエリを同じ広告にマッピングできる
という2つのメリットがある.また,これはオリジナルのTranslated Learningとは違うらしい.
結果
CTR向上
次はTranslated Learning読むか.