The long and the short of it: summarising event sequences with serial episodes(KDD 2012) 読んだ
概要
頻出パターンマイニング,理想的には少なく冗長でないパターンが得られて欲しいけど実際は冗長なのでつらい.なので,頻出パターンそのものではなく,得られる頻出パターンの集合に対してMDL(minimum description length)の考え方を使って元の系列を最も要約するような頻出パターン集合を考える.
transactionなデータではやられてるけどsequenceなデータではギャップを考えなきゃならんからchallengingだと主張している.