論文
概要 Modeling Intransitivity in Matchup and Comparison Data (WSDM 2016)(pdf) 二人のプレイヤーが戦い,勝敗が決まるゲームのモデリングにおいては通常,各プレイヤーの強さは一元的である.よって,推定されたモデルでは推移律が成立する(aがbより,bが…
Your Cart tells You: Inferring Demographic Attributes from Purchase Data(pdf) 概要 購買履歴からユーザの属性(年齢,性別,結婚状況,収入,学歴)を同時に推定する. つまり,複数の属性を同時に推定する multi-task multi-class prediction に取り組む…
The Web as a Jungle: Non-Linear Dynamical Systems for Co-evolving Online Activities (pdf)冬コミのモデルに使おうとして読んだ. 概要 Lotka-Volterra の捕食者 - 被食者のモデルを使う. タイムスタンプつきの各キーワードの検索数 (実験では Google T…
[1508.03965] Early Identification of Violent Criminal Gang Members アリゾナ州立大とシカゴ市警察との共著論文.逮捕データから共逮捕ネットワークを作り,ある人物が将来逮捕されるかどうかを予測する. 実データによる実験の結果,精度0.89,再現率0.7…
Life-stage Prediction for Product Recommendation in E-commerce 母親-赤ん坊(mum-baby)を対象に,赤ん坊の年齢(というより,胎児/新生児-六ヶ月/1歳/1-3歳/といったような状態)を推定してレコメンデーションの精度を上げる. 著者4人のうち3人がアリババ…
[1506.08839] Inferring Networks of Substitutable and Complementary Products http://www.slideshare.net/dato-inc/inferring-networks-of-substitute-and-complementary-products 著者に Pinterest の人が入ってる. 2つ商品の関係が経済学用語で言う代…
デジタルトランスフォーメーションを加速する最先端AI技術群「NEC the WISE」: 最先端AI技術群 ~NEC the WISE~ | NEC 2012年頃から話題になっている,NECが提唱する異種混合学習とは一体何なのか,ということが気になって簡単に調べた. 以下の記述は,自…
概要 系列性のある商品購買情報を入力に,次にユーザが何を買うのかを予測する. その際,流行りの representation learning というか,潜在表現を作って階層化する.問題設定はFactorizing Personalized Markov Chains for Next-Basket Recommendation (WWW…
Program | KDD 2015, 10-13 August 2015, Sydney いくつかは preprint もあるので読んでいる最中. (Paper ID: 8) Real Time Recommendations Forecast by Connoisseurs (Paper ID: 23) Flexible and Robust Multi-Network Clustering (Paper ID: 33) Divers…
[1409.2944] Collaborative Deep Learning for Recommender Systems 同タイトルの論文 ( TeX のフォーマットは NIPS で用いられているもの) が arXiv にアップロードされていたので読んだ. Collaborative Topic Regression (CTR) と Stacked Denoising Auto…
概要 Collaborative Location and Activity Recommendations With GPS History Data - Microsoft Research 位置情報にまつわる情報推薦の研究をサーベイする必要が生じており,真っ先に読むべき論文っぽかったので読む. 位置 (location) からそこでの行動 (…
You Are Where You Go: Inferring Demographic Attributes from Location Check-ins 概要 Weibo のチェックインデータと,POI に関する情報 (dianping のレビュー情報) から,ユーザの年齢,性別,学歴,性的嗜好,ステータス (未婚,既婚など),更には血液…
概要 [1305.4987] Robust Logistic Regression using Shift Parameters (Long Version) 一部のデータに対して誤ったラベルが付与されているような状況において頑健なロジスティック回帰を提案する. 著者は The Elements of Statistical Learning の著者 Jul…
Factorization Machines (pdf) Factorization Machines with libFM (TOIS, pdf)CriteoやAvazuの Click-through rate コンペでも良い成績を残している (GitHub - guestwalk/kaggle-2014-criteo, GitHub - guestwalk/kaggle-avazu) Field-aware Factorization …
[1403.6652] DeepWalk: Online Learning of Social Representations 実装もある. DeepWalk - Online Learning of Social Representations - Bryan Perozzi's old website 概要 グラフ構造のデータから latent representation を学習する.skip-gramなどでは…
MMRate 概要 既存の情報拡散モデルでは情報のトピックに関わらず同じような拡散をするという仮定が置かれている. しかし,あるトピックでは2ユーザ間で起こる伝搬が,別のトピックでは同ユーザ間では起こらないという現象は存在するだろう. トピックごとに…
http://labs.yahoo.com/publication/identifying-and-labeling-search-tasks-via-query-based-hawkes-processes/ 概要 タイムスタンプ付の検索クエリ集合から search task (同じ information need を満たすために入力されたクエリ集合) を特定する. その際…
概要 Modeling Human Location Data with Mixtures of Kernel Densities(pdf) 位置情報にもとづくデータから個人レベルの粒度にもとづく密度を推定する問題を解く. 混合モデルベースのカーネル密度推定(KDE)を応用して個人レベルの情報と全体の傾向を取り扱…
Product selection problem KDD2014も終わったので興味がある論文を少しずつ読んでいく. 概要 属性付の商品データ,自社製品,他社製品が市場に存在するとする.自社の新商品集合について,どれを出すのがもっともシェアを奪えるかを推定する. 手法 理解が…
The Dynamics of Repeat Consumption(pdf) 概要 同じ商品を繰り返し買う行動はいかにして起こるのか? の論文 結論としては「繰り返し買われるものは,最近買われた商品」の一言. データセット youtubeの再生履歴,google+のチェックイン履歴,Brightkiteの…
Traveling the Silk Road: A Measurement Analysis of a Large Anonymous Online Marketplace 概要 売上なんと1170億円。FBIがドラッグのアマゾン「Silk Road」閉鎖、運営者逮捕 | ギズモード・ジャパン 先日FBIの取り締まりによって閉鎖したオンラインマーケ…
Timespent Based Models for Predicting User Retention(pdf) 概要 StumbleUponというサービスにおいて,K回のセッションを行ったユーザがK+1回目のセッションを行うか(Retention)の予測を行う. 手法 コンテンツごとの閲覧時間が重要.その時に,コンテンツ…
Utilizing users' tipping points in E-commerce Recommender systems - IEEE Conference Publication 概要 ユーザには周りに流されれず自分自身の判断にしたがって購買するinnovatorと,市場が成熟したら購買するimitatorがいる. それをロジャースのイノベ…
Utilizing marginal net utility for recommendation in e-commerce(pdf) 概要 商品推薦に経済学でいうところの「限界効用逓減の法則」を持ち込む. 著者はJian Wang.最近この人の論文ばかり読んでいる. 限界効用逓減の法則 そもそも限界効用逓減の法則と…
Factorizing Personalized Markov Chains for Next-Basket Recommendation(pdf) 概要 「各ユーザが次に何を買うか」というタスクに対してマルコフ連鎖ベースの予測モデルを作る. ユーザごとの遷移確率を計算するにはスパースなので行列分解と組み合わせてそ…
Opportunity model for e-commerce recommendation 概要 正しい商品を正しいタイミングで推薦したい. ノートパソコンを買った人が替えのバッテリーを購入しやすいという傾向があったとしても,それはバッテリーが駄目になる頃(例えば二年後とか)だろう.そ…
KDD 2013 の論文を互いに持ち寄って読む会をやった.日付を工夫しなかったせいでhttp://www.marine-e.net/sp/marikore2013/に行けなかったのが非常に悲しい.会場は前回と同じくGunosyのオフィスを貸していただいた.参加してくださった方々,オフィスを貸し…
A Biterm Topic Model for Short Texts(WWW 2013) 概要 LDAやPLSIは文書中の単語が少ない時にうまくいかない.なぜならば文書ごとにトピックの分布があって,それによって単語が生成されるという仮定があるからだ. 提案する Biterm Topic Model(BTM) ではト…
http://sexi2013.org/ WSDM2013 | Business, Technology, and Marketing SEXI2013読み会 : ATND というわけで, WSDM2013 のワークショップである SEXI2013, X-rated つまりはエロコンテンツのワークショップの予稿集と WSDM2013 の論文を読む会をやってき…
Learning to Rank for Spatiotemporal Search(pdf) 概要 foursquareによる論文.ユーザのGPS情報とPOI(なんらかの場所情報)を紐付ける. 位置情報と地名を結びつけるのは4sqやらinstagramやらPathで行われているけど,実際は結構複雑. 位置情報が不正確 GPS…