糞糞糞ネット弁慶

読んだ論文についてメモを書きます.趣味の話は http://repose.hatenablog.com

Substitutes or complements: another step forward in recommendations(EC 2009) 読んだ

Substitutes or complements: another step forward in recommendations

概要

これもeBay Research Labs.しかもシャンハイにもあるらしい.1stはインターンで来ていた学生.
あとACM conference on Electronic commerceというものがあるのもはじめて知った.
レコメンデーションにおいて,アイテムについて代替財(Substitutes)と補完財(complements)という経済学における概念を導入して改善する.非常に面白かった.

問題定義

穴埋め問題としてのレコメンデーションの精度は上がっているが,むしろ精度(prec/recall)が上がりすぎている.特に協調フィルタリングにおいて,次のような3タイプの問題が生じている.

冗長

iPodを買ったらiPhoneやらiPod nanoやらiPod touchを推薦される.商品名や商品属性が似ているからアルゴリズム上薦められるのは当然だけど,そもそもたった今音楽プレイヤーを買ったばかりだというのに,同種の商品を推薦されても…….

見落とし

本来は付属品を推薦すべきであるが,そもそもiPodを買った人はすぐには高価な付属品を購入しない.よって推薦リストから見落とされてしまう.

不快な割り込み

ユーザが何か音楽プレイヤーを買おうとしているとする.そのユーザはきっとブラウジングの過程で音楽プレイヤーの比較を行うだろう.少なくとも,購入する前に付属品を見たり,別の家電を見に行ったりすることはないだろう.そんな時,推薦リストに「現在の目的とは」関係の無い商品(例えばミュージシャンのポスターなど.もちろんこれは音楽プレイヤーと関係があるために推薦されているのだが)が表示されたら邪魔なだけである.そのような推薦はユーザの商品決定を邪魔しているだけである.

代替財と補完財

ここで代替財と補完財という概念を経済学から持ってくる.学部でミクロ/マクロ共にCだったので解説は引用する.

代替財とは、どちらか一方があれば効用が得られる財のこと。例えばバターとマーガリンは、互いに代替関係にあるので代替財。

代替財とは 〜 exBuzzwords用語解説

補完財とは、互いに補完しあって効用を得る財のこと。例えばバターとパンは、互いに補完関係にあるので補完財。

補完財とは 〜 exBuzzwords用語解説

これら二つの概念は商品間に考えられる自然な関係である.なのでこれを導入する.

アルゴリズム

REL scores

カテゴリ間の類似度を考える.ユーザに対し,をカテゴリjを購入したユーザ集合とする.
jaccard係数
コサイン類似度
ピアソン相関係数
の3つの線形和でを計算する.ここまでは至って普通.

NAV scores

RELだけじゃ補完財か代替財かを判別するのは難しい.よって次にユーザのページ遷移を考慮する.まず,ユーザがアクセスしたページについて,商品ページをI pages,それ以外のページ(ログイン,検索結果,カートなど)をN pagesとしておく.
次に,ある「購入」ページから次の「購入」ページまでの画面遷移をサイズの窓で区切り,2つの標品カテゴリが含まれているものだけを見ていく.
例として,といったページ遷移があったとする(はカテゴリkの商品ページ).
この遷移に対して,とすると,という,2種類のページ遷移が抽出できる(は重複).よって,


とする.

補完財・代替財の特定

とする.

  • が小さければカテゴリは代替財の関係にある.なぜならば,へのアクセスが多いのに,それらが同時に購入されている事が少ないからである.つまりは,片方を購入してしまえばユーザは満足しているということである.これは代替財の特徴である.
  • が大きければ,カテゴリは補完財の関係にある.ユーザはを相互比較しているわけではなく,iを購入後にjを購入する可能性が高い.これは補完財の特徴である.

2つの閾値を考える.ならば代替財,ならば補完財と見なす.どれでもなければunsureとする.

もうちょっとアルゴリズムを洗練させる

実際の運用

カテゴリiについて,RELとNAVが高いカテゴリを推薦候補に集め,そこからが高いM件を補完財,低いN件を代替財として表示する.

閾値の決定

を動的に決定する.をそれぞれの平均,標準偏差として


とする(実験ではa=bとした).

窓のサイズ

ページ遷移の窓サイズを決める.

RELとNAVの正規化

RELが[0,1]なのに対してNAVは数え上げなのでスケールがそもそもおかしい.なので

としてやる(これで本当に正規化できるんだろうか).

実験

人手でのタグ付けと比較.prec70%ぐらいで補完財/代替財であると予測できたらしい.

感想

論文を途中まで読んでようやく「ああこれはあの経済学で出てきたアレを指しているのか」と理解できた.手法が比較的単純なのに実現できていてウワースゲーってなった.とここまで書いてて思ったのは特にrecommendationに特化しているというわけでもなく,ECサイトにおける商品分析としての手法であった.