糞糞糞ネット弁慶

読んだ論文についてメモを書きます.趣味の話は http://repose.hatenablog.com

2012-01-01から1ヶ月間の記事一覧

Rのhashライブラリで予約語をkeyにする時一点だけ気をつける事

CRAN - Package hash LL脳なので連想配列が使いたくなってしまいhashを導入したら比較的捗った. しかし,keyが存在しない状態でもhas.keyを使うとTRUEが返ってくる.2時間ぐらいはまった. > library(hash) > h <- hash() > h <hash> containing 0 key-value pair</hash>…

Rのmvpartパッケージのrpartで得られる決定木について分岐毎のGini Indexの増減を取得したい

CRAN - Package mvpart タイトルそのまま.決定木の分岐でGini Indexが増減するのでそれを取得して足しあわせて1つの木における特徴量でどれが有効に働いているかを調べたい. help読んだらimproveっぽいけどスケールが大きすぎるし,indexの説明は書かれて…

NLP2012で気になる発表

言語処理学会第18回年次大会(NLP2012) 語彙・辞書(1) C1-4 放送ニュースの基本語彙の抽出 情報抽出 E4-4 オークション検索クリックスルーログからの属性値抽出 情報検索 E5-5 キーワード周辺語のリンク先内容を考慮したキーワード関連付け手法 テキスト・デ…

New Perspectives and Methods in Link Prediction(KDD 2010) 実装した

New perspectives and methods in link prediction 概要 入力としてグラフ,開始ノード,深さを入力として,からエッジが存在しそうなノード集合を返す. 使い道としては,following関係のグラフデータに使ってあるユーザに他のユーザをレコメンドするとか.…

Efficiently Matching Sets of Features with Random Histograms(MM 2008) 読んだ

Efficiently matching sets of features with random histograms 概要 id:tsubosakaさんから教わった.特徴ベクトルの集合(sets of features)間の類似度を計る. 手法 集合をヒストグラムで表現する.Fig.4が非常にわかりやすい. 具体的には 集合の要素をLS…

Auralist: Introducing Serendipity into Music Recommendation(WSDM 2012) 読んだ

Auralist: Introducing Serendipity into Music Recommendation(pdf) 概要 穴埋め問題の精度だけじゃなくて多様性,新規性(novelty),意外性(serendipity)を考慮した推薦を実現する. モデル LDAをベースにゴリゴリやる.なんでこんな大仰な名前がついてるの…