[1508.03965] Early Identification of Violent Criminal Gang Members アリゾナ州立大とシカゴ市警察との共著論文.逮捕データから共逮捕ネットワークを作り,ある人物が将来逮捕されるかどうかを予測する. 実データによる実験の結果,精度0.89,再現率0.7…
C87(五度目のコミケ参加)における日本声優統計学会の振り返りをKPTでやる - 糞ネット弁慶 暑い中,コミックマーケット88「日本声優統計学会」にお越しくださった皆様,本当にありがとうございました. 新刊の声優統計第六号は無事完売しました.新刊を手にと…
Life-stage Prediction for Product Recommendation in E-commerce 母親-赤ん坊(mum-baby)を対象に,赤ん坊の年齢(というより,胎児/新生児-六ヶ月/1歳/1-3歳/といったような状態)を推定してレコメンデーションの精度を上げる. 著者4人のうち3人がアリババ…
[1506.08839] Inferring Networks of Substitutable and Complementary Products http://www.slideshare.net/dato-inc/inferring-networks-of-substitute-and-complementary-products 著者に Pinterest の人が入ってる. 2つ商品の関係が経済学用語で言う代…
日本声優統計学会としての六度目のコミケ参加です. 「声優統計第六号」内容 序文 : 人工声優は東京ドーム公演の夢を見るか?(@hitoshi_ni) イベント出演状況から予想するネクストブレイク声優 (@kkobayashi) 同一セリフからの声優と心情の同時推定問題 -- …
デジタルトランスフォーメーションを加速する最先端AI技術群「NEC the WISE」: 最先端AI技術群 ~NEC the WISE~ | NEC 2012年頃から話題になっている,NECが提唱する異種混合学習とは一体何なのか,ということが気になって簡単に調べた. 以下の記述は,自…
概要 系列性のある商品購買情報を入力に,次にユーザが何を買うのかを予測する. その際,流行りの representation learning というか,潜在表現を作って階層化する.問題設定はFactorizing Personalized Markov Chains for Next-Basket Recommendation (WWW…
夏のコミックマーケットに当選しました 二日目(8月15日,金曜日)東ト47bに「日本声優統計学会」で当選しました. 三度目の夏コミです.去年のように比較的涼しいことを祈りたい. 今年は例年と異なり,声優島は二日目に配置されているので注意が必要です.今…
Program | KDD 2015, 10-13 August 2015, Sydney いくつかは preprint もあるので読んでいる最中. (Paper ID: 8) Real Time Recommendations Forecast by Connoisseurs (Paper ID: 23) Flexible and Robust Multi-Network Clustering (Paper ID: 33) Divers…
[1409.2944] Collaborative Deep Learning for Recommender Systems 同タイトルの論文 ( TeX のフォーマットは NIPS で用いられているもの) が arXiv にアップロードされていたので読んだ. Collaborative Topic Regression (CTR) と Stacked Denoising Auto…
概要 Collaborative Location and Activity Recommendations With GPS History Data - Microsoft Research 位置情報にまつわる情報推薦の研究をサーベイする必要が生じており,真っ先に読むべき論文っぽかったので読む. 位置 (location) からそこでの行動 (…
WSDM2015読み会 - connpass Just in Time Recommendations: Modeling the Dynamics of Boredom in Activity Streams (WSDM 2015) お疲れ様でした. 概要 あるユーザとアイテムについて,次にそのユーザがアイテムを消費する時間 (gap) を予測する. ユーザの…
You Are Where You Go: Inferring Demographic Attributes from Location Check-ins 概要 Weibo のチェックインデータと,POI に関する情報 (dianping のレビュー情報) から,ユーザの年齢,性別,学歴,性的嗜好,ステータス (未婚,既婚など),更には血液…
概要 [1305.4987] Robust Logistic Regression using Shift Parameters (Long Version) 一部のデータに対して誤ったラベルが付与されているような状況において頑健なロジスティック回帰を提案する. 著者は The Elements of Statistical Learning の著者 Jul…
Factorization Machines (pdf) Factorization Machines with libFM (TOIS, pdf)CriteoやAvazuの Click-through rate コンペでも良い成績を残している (GitHub - guestwalk/kaggle-2014-criteo, GitHub - guestwalk/kaggle-avazu) Field-aware Factorization …
[1403.6652] DeepWalk: Online Learning of Social Representations 実装もある. DeepWalk - Online Learning of Social Representations - Bryan Perozzi's old website 概要 グラフ構造のデータから latent representation を学習する.skip-gramなどでは…
寒い中,コミックマーケットC87「日本声優統計学会」にお越しくださった皆様,本当にありがとうございました.持ち込んだ声優統計第五号,総集編である声優統計論文集第一号は無事完売しました. 新刊を手にとってくださった皆様,興味を持ってくださった皆…
日本声優統計学会としての五度目のコミケ参加です.部署異動,人間ドックなどのインシデントが発生したため,当初予定していたポスター発表は断念しました.来年夏をお待ちください. 「声優統計第五号」内容 田村ゆかりは永遠の 17 歳なのか? - CV から見た…
冬のコミックマーケットに当選しました 2014年の締めくくりに,一日目(12月28日,日曜日)東テ29aに「日本声優統計学会」で当選しました. 三度目の冬コミです.思えば遠くへ来てしまった. 今回はこれまでとは違ったことをやってみようということで, 新刊「…
MMRate 概要 既存の情報拡散モデルでは情報のトピックに関わらず同じような拡散をするという仮定が置かれている. しかし,あるトピックでは2ユーザ間で起こる伝搬が,別のトピックでは同ユーザ間では起こらないという現象は存在するだろう. トピックごとに…
http://labs.yahoo.com/publication/identifying-and-labeling-search-tasks-via-query-based-hawkes-processes/ 概要 タイムスタンプ付の検索クエリ集合から search task (同じ information need を満たすために入力されたクエリ集合) を特定する. その際…
概要 Modeling Human Location Data with Mixtures of Kernel Densities(pdf) 位置情報にもとづくデータから個人レベルの粒度にもとづく密度を推定する問題を解く. 混合モデルベースのカーネル密度推定(KDE)を応用して個人レベルの情報と全体の傾向を取り扱…
Product selection problem KDD2014も終わったので興味がある論文を少しずつ読んでいく. 概要 属性付の商品データ,自社製品,他社製品が市場に存在するとする.自社の新商品集合について,どれを出すのがもっともシェアを奪えるかを推定する. 手法 理解が…
日本声優統計学会としての四度目のコミケ参加です. 内容 序文: 声優と統計とシンギュラリティ --声優統計の目指す未来-- (@MagnesiumRibbon) 種田梨沙が出演すると百合アニメか?: Propensity score matching による検討 (@Med_KU and @biochem_fan) [WIP] …
夏のコミックマーケットに当選しました そろそろ飽きられている頃ですが,一日目(8月15日,金曜日)東チ21bに「日本声優統計学会」で当選しました. 新刊「声優統計第四号」と共に,既刊「声優統計第一号」,「声優統計第二号」,「声優統計第三号」も少量な…
The Dynamics of Repeat Consumption(pdf) 概要 同じ商品を繰り返し買う行動はいかにして起こるのか? の論文 結論としては「繰り返し買われるものは,最近買われた商品」の一言. データセット youtubeの再生履歴,google+のチェックイン履歴,Brightkiteの…
Traveling the Silk Road: A Measurement Analysis of a Large Anonymous Online Marketplace 概要 売上なんと1170億円。FBIがドラッグのアマゾン「Silk Road」閉鎖、運営者逮捕 | ギズモード・ジャパン 先日FBIの取り締まりによって閉鎖したオンラインマーケ…
Eventernote (イベンターノート) Eventernote イベンターノート オタク活動管理に便利なEventernoteをクロールしたくてクローラ書いた.ソースはgistにあげた. Eventernote自体は@MagnesiumRibbonが前回の冬コミで出した声優統計第三号にて分析対象にしてい…
Timespent Based Models for Predicting User Retention(pdf) 概要 StumbleUponというサービスにおいて,K回のセッションを行ったユーザがK+1回目のセッションを行うか(Retention)の予測を行う. 手法 コンテンツごとの閲覧時間が重要.その時に,コンテンツ…
Utilizing users' tipping points in E-commerce Recommender systems - IEEE Conference Publication 概要 ユーザには周りに流されれず自分自身の判断にしたがって購買するinnovatorと,市場が成熟したら購買するimitatorがいる. それをロジャースのイノベ…