メモ
個人用メモ. 2011年6月1日から3日にかけて盛岡で行われる2011年度人工知能学会全国大会(第25回) JSAI2011のプログラムが発表されていたので気になるものをメモしておく. 参考:2011年度人工知能学会大会プログラム - コーパスいぢり 〜langstatの研究日…
HTML要素に着目した違法・有害サイト検出手法の提案と評価(pdf) 背景色などの外形的特徴から有害サイトを高速検出、KDDI研究所が技術開発 -INTERNET Watch Watch HTMLタグ内の記述に着目し、ウェブサイトの背景色が例えばピンクであることや、画像リンクが多…
The YouTube video recommendation system 概要 youtubeにおける動画推薦の話. アルゴリズムを一言で表現すると,協調フィルタリングではなく,動画をノード,類似度をエッジに持つ重み付き無向有向グラフにおける幅優先探索みたいな感じ. 関連論文 読んで…
[0907.1815] Frustratingly Easy Domain Adaptation 目的 簡単にDomain Adaptationをやる. 問題設定 ラベルつきデータが大量にあるsourceとラベルつきデータがあんまりないtarget,2つのドメインを考えて上手いこと学習したい. 方法 からを予測したい.こ…
Learning to estimate query difficulty: including applications to missing content detection and distributed information retrieval SIGIR 2005のbest paper. 目的 ある検索システムに対して投げられた検索クエリがどれほど難しいのかを測りたい. め…
本当はリンク予測の話として書きたかったが,優勝チームの手法及びそれに対する反応が面白かったのでメモ. 三行まとめ リンク予測のコンペティションが行われた 優勝チームは(データの出処となっていた)Flickrをクロールし,匿名化(anonymize)されていたテ…
Sources of evidence for vertical selection SIGIR2009のbest paper. この論文は何をしているのか vertical selectionと言うと全くピンと来ない.上手いこと示す言葉を知らないので具体例を挙げる.例えばgoogleで「桜高軽音部」と検索すると3件目に「桜高…
3/7から開催される言語処理学会第17回年次大会(NLP2011)で面白そうな発表をメモしておく.豊橋には行けないので後で確認するためのメモ. 自分の興味は知識抽出,特許,検索であるようだ.
Deep learning 2009年半ばぐらいからdeliciousのエントリーにDeep Learningの名前を良く見るので気になっていた. http://www.quora.com/Why-does-deep-learning-require-the-construction-of-generative-data-models Deep Learning via Hessian-free Optimi…
The Learning Behind Gmail Priority Inbox(pdf) GmailにおけるPriority Inbox(日本語だと優先トレイ)に関する論文(というよりもメモ書き)。 簡単なまとめ モデルはpassive-aggressive(PA-2) 分類というよりスコアとその閾値で判別 Feature Featureの量…
Connecting the dots between news articles KDD2010のBest Research Paper: innovative contribution。タイトルはきっとjobsのスピーチが元ネタ。 概要 ニュースを2つ(s、t)与えるとその2つのニュースの間にあり、かつ、論理的に一貫したニュース記事群"cha…