糞糞糞ネット弁慶

読んだ論文についてメモを書きます.趣味の話は http://repose.hatenablog.com

The long and the short of it: summarising event sequences with serial episodes(KDD 2012) 読んだ

The long and the short of it

概要

頻出パターンマイニング,理想的には少なく冗長でないパターンが得られて欲しいけど実際は冗長なのでつらい.なので,頻出パターンそのものではなく,得られる頻出パターンの集合に対してMDL(minimum description length)の考え方を使って元の系列を最も要約するような頻出パターン集合を考える.
transactionなデータではやられてるけどsequenceなデータではギャップを考えなきゃならんからchallengingだと主張している.