2012-01-01から1年間の記事一覧
タイトルが非常に気になっていた論文. Are Web Users Really Markovian?(pdf) PageRankなどで仮定される,ユーザが次に訪れるページは現在のページのみに依存するという1次のマルコフ連鎖をMarkovianとし,それが実際は成立しない事を示している. proofの…
Understanding and Combating Link Farming in the Twitter Social Network(pdf) 概要 TwitterにおけるSPAMや,特にfollow数を稼ぐタイプのspammer(WebページのSPAMにおいてはリンクファームと呼ばれていたもの)=大量フォローおじさん/リンクファーマーにつ…
WSDM2012勉強会 : ATND 思ったよりも人が来て驚愕した.お疲れ様でした. また,発表してくださった皆様,及びUstと会場確保をおこなってくださった皆様,ありがとうございました. 自分の読んだ論文はOvercoming Browser Cookie Churn with Clustering.短…
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.164.5964 まず先に転移学習のサーベイ - kamishima.net(pdf)で転移学習についての大体のイメージを掴んだ上で読んだ. 目的 転移学習でバギング.Abstに we propose a very simple approach to tra…
内輪の輪行でリンク予測の話をしたのでスライドをアップする. Link prediction View more presentations from ybenjo Supervised random walks: predicting and recommending links in social networks(WSDM 2011) ついでにSupervised random walks: predic…
人が集まらなかったらビッグデータだのソーシャルだの一般意思2.0と絡めながらいかにWSDMの論文が面白いかを書きまくったPR記事で人寄せしようかと思ったが無事読んでくれる方が集まったので開催します. 日時: 4月7日(土) 13:00 会場: 東京大学理学部3号館4…
というわけで毎年恒例二泊三日の開発合宿を@inut,@syou6162,@twittoru,@wakuteka,@yag_aysとやってきた. 開発合宿してきます - 糞ネット弁慶 現実逃避のために開発合宿してきた - 糞ネット弁慶 合宿そのもの 卓球して 酒飲んで 温泉に入って アノテーシ…
WSDM(Web Search and Data Mining) 2012のProceedingsも出たしそろそろ春なのでWSDM 2012をやりたい. Proceedings of the fifth ACM international conference on Web search and data mining http://chouseisan.com/schedule/List?h=ee56c3ba57676e187f58c…
Evolution of Node Behavior in Link Prediction(pdf) 内容 リンク予測に関して3つの実データで検証.問題設定が通常のlink predictionと異なっていて,networkがtime periodで変化する,例えば各stepごとにリンクが繋がったり切れたりしてる時にある時間tに…
Main technical tracks | www2012 Are Web users really Markovian? Branded with a Scarlet « C »: Cheaters in a Gaming Social Network 参考に同著者の別論文 [1112.4915] Cheaters in the Steam Community Gaming Social Network Build Your Own Music R…
CRAN - Package hash LL脳なので連想配列が使いたくなってしまいhashを導入したら比較的捗った. しかし,keyが存在しない状態でもhas.keyを使うとTRUEが返ってくる.2時間ぐらいはまった. > library(hash) > h <- hash() > h <hash> containing 0 key-value pair</hash>…
CRAN - Package mvpart タイトルそのまま.決定木の分岐でGini Indexが増減するのでそれを取得して足しあわせて1つの木における特徴量でどれが有効に働いているかを調べたい. help読んだらimproveっぽいけどスケールが大きすぎるし,indexの説明は書かれて…
言語処理学会第18回年次大会(NLP2012) 語彙・辞書(1) C1-4 放送ニュースの基本語彙の抽出 情報抽出 E4-4 オークション検索クリックスルーログからの属性値抽出 情報検索 E5-5 キーワード周辺語のリンク先内容を考慮したキーワード関連付け手法 テキスト・デ…
New perspectives and methods in link prediction 概要 入力としてグラフ,開始ノード,深さを入力として,からエッジが存在しそうなノード集合を返す. 使い道としては,following関係のグラフデータに使ってあるユーザに他のユーザをレコメンドするとか.…
Efficiently matching sets of features with random histograms 概要 id:tsubosakaさんから教わった.特徴ベクトルの集合(sets of features)間の類似度を計る. 手法 集合をヒストグラムで表現する.Fig.4が非常にわかりやすい. 具体的には 集合の要素をLS…
Auralist: Introducing Serendipity into Music Recommendation(pdf) 概要 穴埋め問題の精度だけじゃなくて多様性,新規性(novelty),意外性(serendipity)を考慮した推薦を実現する. モデル LDAをベースにゴリゴリやる.なんでこんな大仰な名前がついてるの…