糞糞糞ネット弁慶

読んだ論文についてメモを書きます.趣味の話は http://repose.hatenablog.com

Trajectory Recovery From Ash: User Privacy Is NOT Preserved in Aggregated Mobility Data (WWW 2017) 読んだ

[1702.06270] Trajectory Recovery From Ash: User Privacy Is NOT Preserved in Aggregated Mobility Data
ユーザのプライバシーなどに考慮し,「誰がいつどこにいたか」という生の位置情報ではなく,「どの領域にいつ何人いたか」という集計情報の公開,共有が行われることが増えてきた.例えば,ある基地局がカバーするエリア内に何人の携帯電話所有者がいるか,といったものである.
この論文では,そのような位置情報の集計データから個別のユーザの移動系列に比較的高い精度で分解が可能な,教師なしの手法を提案している.
タイトルがかっこいい.

手法

今, 人のユーザと 個の位置について,時刻 における各地点の総数 の情報が公開されているとする.
この といったように,各ユーザが時刻 にどこにいるか,という情報を集約したものであると考えることができる.
今,時刻 までの各ユーザ ごとの軌跡 (trajectory) が分解でき, で得られているとする.すると,時刻 の位置情報 を軌跡に紐付けるためには


を解けばいいことがわかる.は軌跡と位置情報を紐付ける行列であるため,あとはコスト行列 が適切に設定できれば を求めることができる.

コスト行列は次の 3 要素から構成される.

  • nighttime
    • 夜は同じ場所に留まりやすい,なので位置の距離をコストにすることで近い位置を紐付けやすくする
  • daytime
    • 昼間は移動するので軌跡の差分を移動速度とし,やはり距離をコストにする
  • accross days
    • 上記2つの要素で特定の日付における軌跡を紐付けることはできたが,1日目と2日目の軌跡をどう紐付けたらいいか
    • 「同じユーザは日をまたいでも似たような行動を取る」という知見にもとづき,情報利得をコストにすることで紐付けを行う

実験はスマートフォンの起動時に得られる位置データと,携帯電話会社が提供したユーザの位置情報の二つを用い,集約した後に復元可能かを検証している.精度は73-91%.

全体を通してシンプルかつ自然な話でとても良かった.