Action prediction and identification from mining temporal user behaviors(WSDM 2011) 読むのを諦めた

Action prediction and identification from mining temporal user behaviors

概要

時系列っぽいようなユーザの行動データから，ユーザがあるアクションを起こすかどうかを判定する．
だいたいやってる事は掴めたが，俺の英語力が低すぎるせいで理解できない部分が多かった．

手法

予測したいアクションを $A$ ，positive userを過去に $A$ を行ったことがあるユーザとし，その集合を $U_{patt}$ とする．ついでにランダムにサンプリングしたユーザ集合を $U_{rand}$ とし，[U=U_{patt}\cup U_{rand}]とする． $U_{rand}$ にpositive userが入っても構わない．
ユーザの振る舞い（behavior）はエンティティの集合 $E=\{e_1,e_2,\cdots,e_m\}$ で現されるとする．各エンティティはユーザが訪れたwebページだったり，入力されたクエリだったりする．

$u \in U_{patt}$ について，各アクションにはタイムスタンプ（以下日付とする）が付与されているとする（ここでbehaviorではなくactionが言及される理由がわからない）．日付の集合を $(d_{p1},\cdots,d_{-1},d_{0},\cdots,d_{p2})$ とし， $d_{p1},d_{p2}$ はそれぞれユーザの振る舞いの開始と終了の日付， $d_0$ をユーザがアクション $A$ が起こった（？）日付とする．
ついでに，次のような $h_p^L$ を定義する．
$h_p^L=\left\{\begin{array}{l}(d_{p-L},\cdots,d_{-1},d_1,\cdots,d_{p-1},d_p),p\geq 0 \\(d_{p-L+1},\cdots,d_{p-1},d_p),p < 0\end{array}\right.$
何をやってるかというと，-Lから-pまでの期間の日付を取ってくる操作を考える． $p \geq 0$ であれば， $A$ が起こった日付を除外する（これ $p > 0$ では駄目なのだろうか）． $p < 0$ なら-L+1から-pまで，言ってみればアクション $A$ が起こる前までの任意の期間の日付を取ってくる．図にするとこんな感じ．

判別

判別は2段階に分かれる．
1段階目では，「アクションを起こしそうなユーザ」を特定する．具体的には $u \in U_{patt}$ なら $y=1$ を， $u \in U_{rand}$ なら $y=-1$ を返すようなモデルを学習する．モデルを作るときはユーザの履歴を遡る度合いに応じて判別式 $M_k$ を作る．図にするとこんな感じで，つまりはこれの度合いを変えてやればアクション直前のユーザの行動から，アクションから遠く離れた初期状態でのユーザの行動までを別々にモデルを作ってアンサンブルする．

2段階目ではアクションを起こしそうなユーザから"user who has finished the action"を特定する．しかし，ここの部分が何を言っているのか全く理解できなかった．論文に書いてある数式は
$(x,y)=\begin{eqnarray}\left\{\begin{array}{l}x(h_{p_k}^L,l),p_k<0,\,\,\,\,y=1,\,\,\,\,u \in U_{patt}\\x(h_{p_j}^L,l),p_j>0,\,\,\,\,y=-1,\,\,\,\,u \in U_{patt}\end{array}\right.\end{eqnarray}$
で正例負例を定め，また， $p_k < 0$ ， $p_j > 0$ となっている．
で，これらから
$P(y=1|u) = \sum_{k=1}^{K}\sum_{j=1}^J \pi_{kj}P(y=1|u,M_{kj})$
で判別すると言ってる． $pi_{kj}$ はアンサンブル時のパラメータなのでまだわかるが， $U_{patt}$ がAを起こした日付の前後でうんちゃらしてactionを起こすかどうかが判別できる理由がわからない．
ここで読むのを諦めた．誰かに教えてもらいたい．