Transfer Learning for Behavioral Targeting(WWW 2010) 読んだ

背景

行動ターゲティング広告では似た嗜好をユーザをセグメンテーションし，セグメントごとに適した広告を提示したい．
じゃあどんなデータからやるのか，ってなると普通に考えてユーザiが広告jをクリックした回数を要素に持つ行列 $U^{ad}_{i,j}$ かユーザiがクエリjを入力した回数を要素に持つ行列 $U^{query}_{i,j}$ かのどっちかを使おうという話になる．
一番理想的なのは $U^{ad}_{i,j}$ をそのまま使いたいが，そもそもユーザは広告なんかほとんどクリックしない．じゃあ代わりに $U^{query}_{ad}$ を使うかというとちょっと苦しいし，データの質とスパースさのトレードオフ．というのが行動ターゲティング広告研究の現場．

提案手法

Translated Learning*1と呼ばれる手法がある（らしい．今回はじめて知った）．これは source の feature に行列をかけて target の feature に変換してやるみたいなノリ．
今回はそれに似たアイデアを使う．具体的には変換行列 $T$ を考えて $U^{new} = U^{query}T$ とかやって新たな特徴行列を得る．この時の $T_{i,j} = R(a_j|q_i)$ とし，また， $R(a_j|q_i) = \frac{number \ \ of\ \ times\ \ a_i\ \ displayed\ \ in \ \ q}{number\ \ of\ \ times\ \ q_i\ \ used}$ とする．なのでここにスパースなad click logのデータを突っ込んでやって，クエリログと組み合わせる．
これには