論文
背景 行動ターゲティング広告では似た嗜好をユーザをセグメンテーションし,セグメントごとに適した広告を提示したい. じゃあどんなデータからやるのか,ってなると普通に考えてユーザiが広告jをクリックした回数を要素に持つ行列かユーザiがクエリjを入力…
かのid:y_yanbe氏もこう言っている. ちょっと前ならHypertextかWWWかCIKMあたりで発表されてたであろう研究のうち、それなりの割合がWSDMに行ってそう。バックにGYM(Google, Yahoo!, Microsoft)がついてるようなもんだからそりゃ強いよなあ2011-11-13 17:41…
言いたいことはタイトル. そもそもSIGKDDとはSpecial Interest Group on Knowledge Discovery and Data Miningというデータマイニングや知識獲得のトップカンファレンス.WWWについで読んでて興味が合う論文が多い. How to do good research, get it publi…
A study on the impact of product images on user clicks for online shopping 概要 またもeBay.product search(商品検索)において商品画像そのものから特徴量を抽出しfeatureに追加する. 問題設定 現状のsearchにおけるfeatureでは画像情報は使われてい…
というわけでやってみた.Microsoft Academic Searchは本当に素晴らしい.あとは検索語句がタイトルだけなのかabstなのかも絞り込めると嬉しい.web系のカンファレンス過去5年分遡った. WWW Sreenivas Gollapudi, Consideration set generation in commerce…
Find it if you can: a game for modeling different types of web search success using interaction data SIGIR2011 Best paper 内容 検索が成功するとはどういう事か,どんな感じで皆検索してるのかを分析. 実験方法 実験方法はAmazon Mechanical Turkを…
Structured annotations of web queries まとめ 検索クエリを構造化して扱うための手法を提示. なんでそう扱いたいか 前の論文とも関連する,というかそちらの問題意識に近いけれど,商品検索のクエリは構造化されている. 通常の情報検索の文脈で"50 inch …
Optimizing query rewrites for keyword-based advertising 目的 広告をクリックするたびにインセンティブが入るモデル(pay-per-click)を考える. クエリ(query)→クエリの書き換え(Rewrite)→広告(ad)からなる3層のグラフを考えて,収益を最大化するようなク…
Shopping for products you don't know you need 概要 検索エンジンの検索ログからユーザの商業的な興味を推測する. この際必要となるのが,全てのクエリが相互に関連しているQuery community.これはクエリをノードとしたグラフにおけるクリークとして表現…
Search shortcuts using click-through data 目的 Query suggestionはこれまで散々紹介しているので割愛.この論文では「似ているクエリ」を推薦するのではなく,ユーザの需要を満たしたクエリ(Successful)を推薦する. 類似度尺度 ユーザの一連のクエリ入力…
というわけでid:nokuno氏主催のICML2011読み会に参加した. 読んだ論文はこれ(pdf). Preserving Personalized Pagerank in Subgraphs(ICML 2011) View more presentations from ybenjo 元グラフの構造を持ったまま部分グラフを作るという話.
Multi-factor clustering for a marketplace search interface Mining tag clouds and emoticons behind community feedback ポスター原稿.eBay Research Labs.正直よく判らなかった. Multi-factor clustering for a marketplace search interface(WWW 20…
Keyword extraction for contextual advertisement ポスター原稿.eBay Research Labs. 概要 あるWebページのジャンルを推定し,それに見合った広告を提示したい. コンテンツマッチな広告のためにキーワード抽出と,(タイトルには入ってないが)ページの…
Rare item detection in e-commerce site ポスター原稿.eBay Research Labs. 概要 出品されたアイテムがレアものかどうか判定する. 方法 アルゴリズムは二段階. まずレアでありそうなアイテムをフィルタリング フィルタリングに使う特徴は次の4つ. List…
Rated aspect summarization of short comments 概要 またもeBay Research Labs. 商品及びそのrate(評価値),コメントからAspect(側面)別にコメントを要約してrateまで出す.具体的に言うとこんな感じ. 記法 まず,ある商品についたコメントをとし,をコメ…
Action prediction and identification from mining temporal user behaviors 概要 時系列っぽいようなユーザの行動データから,ユーザがあるアクションを起こすかどうかを判定する. だいたいやってる事は掴めたが,俺の英語力が低すぎるせいで理解できない…
Substitutes or complements: another step forward in recommendations 概要 これもeBay Research Labs.しかもシャンハイにもあるらしい.1stはインターンで来ていた学生. あとACM conference on Electronic commerceというものがあるのもはじめて知った…
Inferring semantic query relations from collective user behavior 概要 またもやeBay Research Labs. クエリにおけるSemanticな関係性を分析する. 3種の類似度指標を考え,それぞれをグラフで表現する.その後,それらを線形結合し,クエリqに対して関…
A user-tunable approach to marketplace search 概要 前回に引き続きeBay Research Labs. マーケットの検索結果提示について,複数の属性でソートできるような方法を提案. 手法 以下の式に従って,次の値が最大になるようにアイテムをgreedyに追加する.…
Predicting the conversion probability for items on C2C ecommerce sites 概要 著者はeBay research Lab.そもそもeBayにラボがあるのを最近知った.しかしここは公式ページにpublicationsがまとまっていないので非常に探しにくい. 売れる商品/売れない商…
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.139.6489 id:smlyさんに教わった論文. 概要 グラフにおけるクラス判別に関する半教師あり学習をランダムウォークの変形であるD-walksで解く. notation 入力:なるグラフ.はノード集合であり,エ…
Fast query execution for retrieval models based on path-constrained random walks 概要 普通のグラフベースのランダムウォークでは,ランダムウォーカーが異なる経路(path)の重要性を理解していない単純なモデルである. よって,ノードにタイプ,エッジ…
TrustWalker: a random walk model for combining trust-based and item-based recommendation タイトルに釣られて読んだ.内容がシンプルなだけでなく,いちいち添字を略す理由だのが書いてあり,非常に読みやすかった. 概要 協調フィルタリングでのコール…
Improving recommendation for long-tail queries via templates 概要 グラフベースのクエリ推薦において,クエリごとにクエリ-ページの遷移を考えるのではなく,クエリ-テンプレート,テンプレート-テンプレートでの遷移を考える. これにより,従来のクエ…
HTML要素に着目した違法・有害サイト検出手法の提案と評価(pdf) 背景色などの外形的特徴から有害サイトを高速検出、KDDI研究所が技術開発 -INTERNET Watch Watch HTMLタグ内の記述に着目し、ウェブサイトの背景色が例えばピンクであることや、画像リンクが多…
The YouTube video recommendation system 概要 youtubeにおける動画推薦の話. アルゴリズムを一言で表現すると,協調フィルタリングではなく,動画をノード,類似度をエッジに持つ重み付き無向有向グラフにおける幅優先探索みたいな感じ. 関連論文 読んで…
[0907.1815] Frustratingly Easy Domain Adaptation 目的 簡単にDomain Adaptationをやる. 問題設定 ラベルつきデータが大量にあるsourceとラベルつきデータがあんまりないtarget,2つのドメインを考えて上手いこと学習したい. 方法 からを予測したい.こ…
Learning to estimate query difficulty: including applications to missing content detection and distributed information retrieval SIGIR 2005のbest paper. 目的 ある検索システムに対して投げられた検索クエリがどれほど難しいのかを測りたい. め…
Sources of evidence for vertical selection SIGIR2009のbest paper. この論文は何をしているのか vertical selectionと言うと全くピンと来ない.上手いこと示す言葉を知らないので具体例を挙げる.例えばgoogleで「桜高軽音部」と検索すると3件目に「桜高…
Deep learning 2009年半ばぐらいからdeliciousのエントリーにDeep Learningの名前を良く見るので気になっていた. http://www.quora.com/Why-does-deep-learning-require-the-construction-of-generative-data-models Deep Learning via Hessian-free Optimi…