糞糞糞ネット弁慶

読んだ論文についてメモを書きます.趣味の話は http://repose.hatenablog.com

Timespent Based Models for Predicting User Retention(WWW 2013) 読んだ

Timespent Based Models for Predicting User Retention(pdf)

概要

StumbleUponというサービスにおいて,K回のセッションを行ったユーザがK+1回目のセッションを行うか(Retention)の予測を行う.

手法

コンテンツごとの閲覧時間が重要.その時に,コンテンツごとに閲覧時間の閾値を考える必要がある(例えば写真だったら5秒見ただけでも十分内容を理解できるだろうけど,10分の映像を50秒しか見てなかったら理解したとは思えない).
そこから発展して,Retentionするユーザが好むようなURLの予測,誰にも閲覧されていない新規URLに対するその予測も行っている.

実験と手法と結果と新しいタスクが入り乱れる不思議な構成の論文だった.この論文そのものより Related Work で引用されている論文の方が面白そうな気がする.