2011-01-01から1年間の記事一覧
2011年最後に読んだ論文. Understanding Click Noise: A Noise-aware Click Model for Web Search(WSDM2012) 概要 クリックスルーログは万能じゃないし実際ノイジーというかクエリと関係ないドキュメントをクリックする行動とかまじでありまくりなのでそれ…
論文読むだけ読んで生産性ゼロだったし勉強会にもほぼ行かなかった.来年もこのペースで何もせずに暮らしたい.
クレジットカード現金化詐欺【業界人が教える口コミ情報】 【ユーザ】「ライフサイエンス分野の大規模データ・現場での課題とこれから」 (ライフサイエンス統合データベースセンター/DBCLS @iNut) スライド(pdf) SQL, NoSQL, アルゴリズムの話無し DBCLSの説…
背景 行動ターゲティング広告では似た嗜好をユーザをセグメンテーションし,セグメントごとに適した広告を提示したい. じゃあどんなデータからやるのか,ってなると普通に考えてユーザiが広告jをクリックした回数を要素に持つ行列かユーザiがクエリjを入力…
かのid:y_yanbe氏もこう言っている. ちょっと前ならHypertextかWWWかCIKMあたりで発表されてたであろう研究のうち、それなりの割合がWSDMに行ってそう。バックにGYM(Google, Yahoo!, Microsoft)がついてるようなもんだからそりゃ強いよなあ2011-11-13 17:41…
Tsukuba.R#9 - Tsukuba.R - Seesaa Wiki(ウィキ) 前回企画から8ヶ月,前回実施から14ヶ月ぶりの実施となったTsukuba.Rをやってきた. One more time in Tsukuba.R (@wakuteka) Rをいきなり使う事になったユーザに対する手引きとして書籍,ウェブサイトの紹…
言いたいことはタイトル. そもそもSIGKDDとはSpecial Interest Group on Knowledge Discovery and Data Miningというデータマイニングや知識獲得のトップカンファレンス.WWWについで読んでて興味が合う論文が多い. How to do good research, get it publi…
A study on the impact of product images on user clicks for online shopping 概要 またもeBay.product search(商品検索)において商品画像そのものから特徴量を抽出しfeatureに追加する. 問題設定 現状のsearchにおけるfeatureでは画像情報は使われてい…
Rubyで機械学習する必要が生じてai4rの導入を検討した. http://ai4r.rubyforge.org/ だいたいこんな感じで書ける.データはUCI Machine Learning Repository: Wine Data Set. # -*- coding: utf-8 -*- require "ai4r" # 学習 train_data = Ai4r::Data::Dat…
Tsukuba.R#9 - Tsukuba.R - livedoor Wiki(ウィキ) というわけで3月に開けなかった分を11月にやります.約1年振り9度目. とりあえずネタとしては面白パッケージ紹介みたいなのを考えてますが,タイトルに"bigdata"とか入れときゃ人気出るんだろうなという…
というわけでやってみた.Microsoft Academic Searchは本当に素晴らしい.あとは検索語句がタイトルだけなのかabstなのかも絞り込めると嬉しい.web系のカンファレンス過去5年分遡った. WWW Sreenivas Gollapudi, Consideration set generation in commerce…
Find it if you can: a game for modeling different types of web search success using interaction data SIGIR2011 Best paper 内容 検索が成功するとはどういう事か,どんな感じで皆検索してるのかを分析. 実験方法 実験方法はAmazon Mechanical Turkを…
Structured annotations of web queries まとめ 検索クエリを構造化して扱うための手法を提示. なんでそう扱いたいか 前の論文とも関連する,というかそちらの問題意識に近いけれど,商品検索のクエリは構造化されている. 通常の情報検索の文脈で"50 inch …
Consideration set generation in commerce search 概要 ECサイトの検索結果(consideration set)を改善する. 問題意識 ECサイトの検索エンジン及び検索結果は通常の文書検索におけるそれとは次の点で異なる. ECサイトではユーザは検索結果を上位下位構わず…
Optimizing query rewrites for keyword-based advertising 目的 広告をクリックするたびにインセンティブが入るモデル(pay-per-click)を考える. クエリ(query)→クエリの書き換え(Rewrite)→広告(ad)からなる3層のグラフを考えて,収益を最大化するようなク…
ビューティフルデータ (THEORY/IN/PRACTICE)作者: Toby Segaran,Jeff Hammerbacher,堀内孝彦,真鍋加奈子,苅谷潤,小俣仁美,篠崎誠出版社/メーカー: オライリージャパン発売日: 2011/02/28メディア: 大型本購入: 24人 クリック: 493回この商品を含むブログ (15…
グラフィックスのためのRプログラミング―ggplot2入門作者: H.ウィッカム,石田基広,石田和枝出版社/メーカー: シュプリンガー・ジャパン株式会社発売日: 2011/07/18メディア: 単行本購入: 7人 クリック: 265回この商品を含むブログ (7件) を見る俺のようにggp…
Shopping for products you don't know you need 概要 検索エンジンの検索ログからユーザの商業的な興味を推測する. この際必要となるのが,全てのクエリが相互に関連しているQuery community.これはクエリをノードとしたグラフにおけるクリークとして表現…
Search shortcuts using click-through data 目的 Query suggestionはこれまで散々紹介しているので割愛.この論文では「似ているクエリ」を推薦するのではなく,ユーザの需要を満たしたクエリ(Successful)を推薦する. 類似度尺度 ユーザの一連のクエリ入力…
というわけでid:nokuno氏主催のICML2011読み会に参加した. 読んだ論文はこれ(pdf). Preserving Personalized Pagerank in Subgraphs(ICML 2011) View more presentations from ybenjo 元グラフの構造を持ったまま部分グラフを作るという話.
Multi-factor clustering for a marketplace search interface Mining tag clouds and emoticons behind community feedback ポスター原稿.eBay Research Labs.正直よく判らなかった. Multi-factor clustering for a marketplace search interface(WWW 20…
Keyword extraction for contextual advertisement ポスター原稿.eBay Research Labs. 概要 あるWebページのジャンルを推定し,それに見合った広告を提示したい. コンテンツマッチな広告のためにキーワード抽出と,(タイトルには入ってないが)ページの…
Rare item detection in e-commerce site ポスター原稿.eBay Research Labs. 概要 出品されたアイテムがレアものかどうか判定する. 方法 アルゴリズムは二段階. まずレアでありそうなアイテムをフィルタリング フィルタリングに使う特徴は次の4つ. List…
Ruby + TMailでGmailのSMTPサーバを使ってメールを送信したいがCcがうまく処理されない→解決した - 糞ネット弁慶 前回はTMail+ruby1.8.9で送っていたが1.9環境でメールを送る必要性が生じた. しかしruby1.9においては"tmailscanner.so: undefined symbol: r…
Rated aspect summarization of short comments 概要 またもeBay Research Labs. 商品及びそのrate(評価値),コメントからAspect(側面)別にコメントを要約してrateまで出す.具体的に言うとこんな感じ. 記法 まず,ある商品についたコメントをとし,をコメ…
ある必要性からRubyでgmailのsmtpサーバからメールを送るこんなスクリプトを書いた. 参考にしたのはこちら→GMailのSMTPサーバーを使ってメールを送信するサンプル - うなの日記 # -*- coding: utf-8 -*- require "rubygems" require "tmail" require "tlsma…
Action prediction and identification from mining temporal user behaviors 概要 時系列っぽいようなユーザの行動データから,ユーザがあるアクションを起こすかどうかを判定する. だいたいやってる事は掴めたが,俺の英語力が低すぎるせいで理解できない…
サピア・ウォーフ仮説が気になっていたが,どれから読んでいいかわからないのでとりあえずサピアを読んでる.言語―ことばの研究序説 (岩波文庫)作者: エドワードサピア,Edward Sapir,安藤貞雄出版社/メーカー: 岩波書店発売日: 1998/11/18メディア: 文庫購入…
Substitutes or complements: another step forward in recommendations 概要 これもeBay Research Labs.しかもシャンハイにもあるらしい.1stはインターンで来ていた学生. あとACM conference on Electronic commerceというものがあるのもはじめて知った…
Inferring semantic query relations from collective user behavior 概要 またもやeBay Research Labs. クエリにおけるSemanticな関係性を分析する. 3種の類似度指標を考え,それぞれをグラフで表現する.その後,それらを線形結合し,クエリqに対して関…