糞糞糞ネット弁慶

読んだ論文についてメモを書きます.趣味の話は http://repose.hatenablog.com

論文

Transfer Learning for Behavioral Targeting(WWW 2010) 読んだ

背景 行動ターゲティング広告では似た嗜好をユーザをセグメンテーションし,セグメントごとに適した広告を提示したい. じゃあどんなデータからやるのか,ってなると普通に考えてユーザiが広告jをクリックした回数を要素に持つ行列かユーザiがクエリjを入力…

WSDM 2012(Web Search and Data Mining)で気になる論文まとめ

かのid:y_yanbe氏もこう言っている. ちょっと前ならHypertextかWWWかCIKMあたりで発表されてたであろう研究のうち、それなりの割合がWSDMに行ってそう。バックにGYM(Google, Yahoo!, Microsoft)がついてるようなもんだからそりゃ強いよなあ2011-11-13 17:41…

少しでも研究に興味がある人,面白いテーマを探している人は「研究に必要なたったN個の事」とかいう記事を読まずに今すぐに"How to do good research, get it published in SIGKDD and get it cited!"を読むべき

言いたいことはタイトル. そもそもSIGKDDとはSpecial Interest Group on Knowledge Discovery and Data Miningというデータマイニングや知識獲得のトップカンファレンス.WWWについで読んでて興味が合う論文が多い. How to do good research, get it publi…

A study on the impact of product images on user clicks for online shopping(WWW 2011) 読んだ

A study on the impact of product images on user clicks for online shopping 概要 またもeBay.product search(商品検索)において商品画像そのものから特徴量を抽出しfeatureに追加する. 問題設定 現状のsearchにおけるfeatureでは画像情報は使われてい…

はじめてサーベイした

というわけでやってみた.Microsoft Academic Searchは本当に素晴らしい.あとは検索語句がタイトルだけなのかabstなのかも絞り込めると嬉しい.web系のカンファレンス過去5年分遡った. WWW Sreenivas Gollapudi, Consideration set generation in commerce…

Find it if you can: a game for modeling different types of web search success using interaction data(SIGIR 2011) 軽く読んだ

Find it if you can: a game for modeling different types of web search success using interaction data SIGIR2011 Best paper 内容 検索が成功するとはどういう事か,どんな感じで皆検索してるのかを分析. 実験方法 実験方法はAmazon Mechanical Turkを…

Structured annotations of web queries(SIGMOD 2010) 読んだ

Structured annotations of web queries まとめ 検索クエリを構造化して扱うための手法を提示. なんでそう扱いたいか 前の論文とも関連する,というかそちらの問題意識に近いけれど,商品検索のクエリは構造化されている. 通常の情報検索の文脈で"50 inch …

Optimizing query rewrites for keyword-based advertising(EC 08) 読んだがほとんど理解できなかった

Optimizing query rewrites for keyword-based advertising 目的 広告をクリックするたびにインセンティブが入るモデル(pay-per-click)を考える. クエリ(query)→クエリの書き換え(Rewrite)→広告(ad)からなる3層のグラフを考えて,収益を最大化するようなク…

Shopping for products you don't know you need(WSDM 11) 読んだ

Shopping for products you don't know you need 概要 検索エンジンの検索ログからユーザの商業的な興味を推測する. この際必要となるのが,全てのクエリが相互に関連しているQuery community.これはクエリをノードとしたグラフにおけるクリークとして表現…

Search shortcuts using click-through data(WSCD 09) 読んだ

Search shortcuts using click-through data 目的 Query suggestionはこれまで散々紹介しているので割愛.この論文では「似ているクエリ」を推薦するのではなく,ユーザの需要を満たしたクエリ(Successful)を推薦する. 類似度尺度 ユーザの一連のクエリ入力…

ICML2011読み会参加してきた & Preserving Personalized Pagerank in Subgraphs(ICML 2011)読んだ

というわけでid:nokuno氏主催のICML2011読み会に参加した. 読んだ論文はこれ(pdf). Preserving Personalized Pagerank in Subgraphs(ICML 2011) View more presentations from ybenjo 元グラフの構造を持ったまま部分グラフを作るという話.

Multi-factor clustering for a marketplace search interface(WWW 2007) と Mining tag clouds and emoticons behind community feedback(WWW 2008) も読んだ

Multi-factor clustering for a marketplace search interface Mining tag clouds and emoticons behind community feedback ポスター原稿.eBay Research Labs.正直よく判らなかった. Multi-factor clustering for a marketplace search interface(WWW 20…

Keyword Extraction for Contextual Advertisement(WWW 2008) 読んだ

Keyword extraction for contextual advertisement ポスター原稿.eBay Research Labs. 概要 あるWebページのジャンルを推定し,それに見合った広告を提示したい. コンテンツマッチな広告のためにキーワード抽出と,(タイトルには入ってないが)ページの…

Rare item detection in e-commerce site(WWW 2009) 読んだ

Rare item detection in e-commerce site ポスター原稿.eBay Research Labs. 概要 出品されたアイテムがレアものかどうか判定する. 方法 アルゴリズムは二段階. まずレアでありそうなアイテムをフィルタリング フィルタリングに使う特徴は次の4つ. List…

Rated aspect summarization of short comments(WWW 2009) 読んだ

Rated aspect summarization of short comments 概要 またもeBay Research Labs. 商品及びそのrate(評価値),コメントからAspect(側面)別にコメントを要約してrateまで出す.具体的に言うとこんな感じ. 記法 まず,ある商品についたコメントをとし,をコメ…

Action prediction and identification from mining temporal user behaviors(WSDM 2011) 読むのを諦めた

Action prediction and identification from mining temporal user behaviors 概要 時系列っぽいようなユーザの行動データから,ユーザがあるアクションを起こすかどうかを判定する. だいたいやってる事は掴めたが,俺の英語力が低すぎるせいで理解できない…

Substitutes or complements: another step forward in recommendations(EC 2009) 読んだ

Substitutes or complements: another step forward in recommendations 概要 これもeBay Research Labs.しかもシャンハイにもあるらしい.1stはインターンで来ていた学生. あとACM conference on Electronic commerceというものがあるのもはじめて知った…

Inferring Semantic Query Relations from Collective User Behavior(CIKM 2008) 読んだ

Inferring semantic query relations from collective user behavior 概要 またもやeBay Research Labs. クエリにおけるSemanticな関係性を分析する. 3種の類似度指標を考え,それぞれをグラフで表現する.その後,それらを線形結合し,クエリqに対して関…

A User-Tunable Approach to Marketplace Search(WWW 2011) 読んだメモ

A user-tunable approach to marketplace search 概要 前回に引き続きeBay Research Labs. マーケットの検索結果提示について,複数の属性でソートできるような方法を提案. 手法 以下の式に従って,次の値が最大になるようにアイテムをgreedyに追加する.…

Predicting the Conversion Probability for Items on C2C Ecommerce Sites(CIKM 2009) 読んだ

Predicting the conversion probability for items on C2C ecommerce sites 概要 著者はeBay research Lab.そもそもeBayにラボがあるのを最近知った.しかしここは公式ページにpublicationsがまとまっていないので非常に探しにくい. 売れる商品/売れない商…

Classification in Graphs using Discriminative Random Walks 読んだ & Rubyで実装した

http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.139.6489 id:smlyさんに教わった論文. 概要 グラフにおけるクラス判別に関する半教師あり学習をランダムウォークの変形であるD-walksで解く. notation 入力:なるグラフ.はノード集合であり,エ…

Fast query execution for retrieval models based on path constrained random walks(KDD 2010) 読んだ

Fast query execution for retrieval models based on path-constrained random walks 概要 普通のグラフベースのランダムウォークでは,ランダムウォーカーが異なる経路(path)の重要性を理解していない単純なモデルである. よって,ノードにタイプ,エッジ…

TrustWalker: a random walk model for combining trust-based and item-based recommendation(KDD 2009) 読んだ

TrustWalker: a random walk model for combining trust-based and item-based recommendation タイトルに釣られて読んだ.内容がシンプルなだけでなく,いちいち添字を略す理由だのが書いてあり,非常に読みやすかった. 概要 協調フィルタリングでのコール…

Improving Recommendation for Long-tail Queries via Templates(WWW 2011)

Improving recommendation for long-tail queries via templates 概要 グラフベースのクエリ推薦において,クエリごとにクエリ-ページの遷移を考えるのではなく,クエリ-テンプレート,テンプレート-テンプレートでの遷移を考える. これにより,従来のクエ…

HTML要素に着目した違法・有害サイト検出手法の提案と評価 読んだメモ

HTML要素に着目した違法・有害サイト検出手法の提案と評価(pdf) 背景色などの外形的特徴から有害サイトを高速検出、KDDI研究所が技術開発 -INTERNET Watch Watch HTMLタグ内の記述に着目し、ウェブサイトの背景色が例えばピンクであることや、画像リンクが多…

The YouTube video recommendation system (Recsys 2010) 読んだメモ

The YouTube video recommendation system 概要 youtubeにおける動画推薦の話. アルゴリズムを一言で表現すると,協調フィルタリングではなく,動画をノード,類似度をエッジに持つ重み付き無向有向グラフにおける幅優先探索みたいな感じ. 関連論文 読んで…

Frustratingly Easy Domain Adaptation読んだメモ

[0907.1815] Frustratingly Easy Domain Adaptation 目的 簡単にDomain Adaptationをやる. 問題設定 ラベルつきデータが大量にあるsourceとラベルつきデータがあんまりないtarget,2つのドメインを考えて上手いこと学習したい. 方法 からを予測したい.こ…

Learning to Estimate Query Difficulty (SIGIR 2005) 読んだメモ

Learning to estimate query difficulty: including applications to missing content detection and distributed information retrieval SIGIR 2005のbest paper. 目的 ある検索システムに対して投げられた検索クエリがどれほど難しいのかを測りたい. め…

Sources of evidence for vertical selection (SIGIR 2009)読んだメモ

Sources of evidence for vertical selection SIGIR2009のbest paper. この論文は何をしているのか vertical selectionと言うと全くピンと来ない.上手いこと示す言葉を知らないので具体例を挙げる.例えばgoogleで「桜高軽音部」と検索すると3件目に「桜高…

deep learningわからん & An Analysis of Single-Layer Networks in Unsupervised Feature Learning (NIPS2010)読んだメモ

Deep learning 2009年半ばぐらいからdeliciousのエントリーにDeep Learningの名前を良く見るので気になっていた. http://www.quora.com/Why-does-deep-learning-require-the-construction-of-generative-data-models Deep Learning via Hessian-free Optimi…