糞糞糞ネット弁慶

読んだ論文についてメモを書きます.趣味の話は http://repose.hatenablog.com

2011-01-01から1年間の記事一覧

Understanding Click Noise: A Noise-aware Click Model for Web Search(WSDM2012) 読んだ

2011年最後に読んだ論文. Understanding Click Noise: A Noise-aware Click Model for Web Search(WSDM2012) 概要 クリックスルーログは万能じゃないし実際ノイジーというかクエリと関係ないドキュメントをクリックする行動とかまじでありまくりなのでそれ…

2011年を振り返る

論文読むだけ読んで生産性ゼロだったし勉強会にもほぼ行かなかった.来年もこのペースで何もせずに暮らしたい.

大規模データ処理勉強会 〜「大きな」データと対峙する(仮称)〜に参加してきた

クレジットカード現金化詐欺【業界人が教える口コミ情報】 【ユーザ】「ライフサイエンス分野の大規模データ・現場での課題とこれから」 (ライフサイエンス統合データベースセンター/DBCLS @iNut) スライド(pdf) SQL, NoSQL, アルゴリズムの話無し DBCLSの説…

Transfer Learning for Behavioral Targeting(WWW 2010) 読んだ

背景 行動ターゲティング広告では似た嗜好をユーザをセグメンテーションし,セグメントごとに適した広告を提示したい. じゃあどんなデータからやるのか,ってなると普通に考えてユーザiが広告jをクリックした回数を要素に持つ行列かユーザiがクエリjを入力…

WSDM 2012(Web Search and Data Mining)で気になる論文まとめ

かのid:y_yanbe氏もこう言っている. ちょっと前ならHypertextかWWWかCIKMあたりで発表されてたであろう研究のうち、それなりの割合がWSDMに行ってそう。バックにGYM(Google, Yahoo!, Microsoft)がついてるようなもんだからそりゃ強いよなあ2011-11-13 17:41…

というわけでTsukuba.R#9@東京大学に参加してきた & 発表してきた

Tsukuba.R#9 - Tsukuba.R - Seesaa Wiki(ウィキ) 前回企画から8ヶ月,前回実施から14ヶ月ぶりの実施となったTsukuba.Rをやってきた. One more time in Tsukuba.R (@wakuteka) Rをいきなり使う事になったユーザに対する手引きとして書籍,ウェブサイトの紹…

少しでも研究に興味がある人,面白いテーマを探している人は「研究に必要なたったN個の事」とかいう記事を読まずに今すぐに"How to do good research, get it published in SIGKDD and get it cited!"を読むべき

言いたいことはタイトル. そもそもSIGKDDとはSpecial Interest Group on Knowledge Discovery and Data Miningというデータマイニングや知識獲得のトップカンファレンス.WWWについで読んでて興味が合う論文が多い. How to do good research, get it publi…

A study on the impact of product images on user clicks for online shopping(WWW 2011) 読んだ

A study on the impact of product images on user clicks for online shopping 概要 またもeBay.product search(商品検索)において商品画像そのものから特徴量を抽出しfeatureに追加する. 問題設定 現状のsearchにおけるfeatureでは画像情報は使われてい…

Rubyで決定木とか使うならai4rがいいらしいけど苦しんだので別の方法を考える

Rubyで機械学習する必要が生じてai4rの導入を検討した. http://ai4r.rubyforge.org/ だいたいこんな感じで書ける.データはUCI Machine Learning Repository: Wine Data Set. # -*- coding: utf-8 -*- require "ai4r" # 学習 train_data = Ai4r::Data::Dat…

Tsukuba.R#9を11/12(土)に都内でやります

Tsukuba.R#9 - Tsukuba.R - livedoor Wiki(ウィキ) というわけで3月に開けなかった分を11月にやります.約1年振り9度目. とりあえずネタとしては面白パッケージ紹介みたいなのを考えてますが,タイトルに"bigdata"とか入れときゃ人気出るんだろうなという…

はじめてサーベイした

というわけでやってみた.Microsoft Academic Searchは本当に素晴らしい.あとは検索語句がタイトルだけなのかabstなのかも絞り込めると嬉しい.web系のカンファレンス過去5年分遡った. WWW Sreenivas Gollapudi, Consideration set generation in commerce…

Find it if you can: a game for modeling different types of web search success using interaction data(SIGIR 2011) 軽く読んだ

Find it if you can: a game for modeling different types of web search success using interaction data SIGIR2011 Best paper 内容 検索が成功するとはどういう事か,どんな感じで皆検索してるのかを分析. 実験方法 実験方法はAmazon Mechanical Turkを…

Structured annotations of web queries(SIGMOD 2010) 読んだ

Structured annotations of web queries まとめ 検索クエリを構造化して扱うための手法を提示. なんでそう扱いたいか 前の論文とも関連する,というかそちらの問題意識に近いけれど,商品検索のクエリは構造化されている. 通常の情報検索の文脈で"50 inch …

[論文] Consideration set generation in commerce search(WWW 2011) 読んだ

Consideration set generation in commerce search 概要 ECサイトの検索結果(consideration set)を改善する. 問題意識 ECサイトの検索エンジン及び検索結果は通常の文書検索におけるそれとは次の点で異なる. ECサイトではユーザは検索結果を上位下位構わず…

Optimizing query rewrites for keyword-based advertising(EC 08) 読んだがほとんど理解できなかった

Optimizing query rewrites for keyword-based advertising 目的 広告をクリックするたびにインセンティブが入るモデル(pay-per-click)を考える. クエリ(query)→クエリの書き換え(Rewrite)→広告(ad)からなる3層のグラフを考えて,収益を最大化するようなク…

データいじるのが好きだったりデータサイエンティストになりたかったりする人は「ビューティフルデータ」を今すぐ注文しましょう

ビューティフルデータ (THEORY/IN/PRACTICE)作者: Toby Segaran,Jeff Hammerbacher,堀内孝彦,真鍋加奈子,苅谷潤,小俣仁美,篠崎誠出版社/メーカー: オライリージャパン発売日: 2011/02/28メディア: 大型本購入: 24人 クリック: 493回この商品を含むブログ (15…

Rユーザは「グラフィックスのためのRプログラミング―ggplot2入門」を今すぐ注文しましょう

グラフィックスのためのRプログラミング―ggplot2入門作者: H.ウィッカム,石田基広,石田和枝出版社/メーカー: シュプリンガー・ジャパン株式会社発売日: 2011/07/18メディア: 単行本購入: 7人 クリック: 265回この商品を含むブログ (7件) を見る俺のようにggp…

Shopping for products you don't know you need(WSDM 11) 読んだ

Shopping for products you don't know you need 概要 検索エンジンの検索ログからユーザの商業的な興味を推測する. この際必要となるのが,全てのクエリが相互に関連しているQuery community.これはクエリをノードとしたグラフにおけるクリークとして表現…

Search shortcuts using click-through data(WSCD 09) 読んだ

Search shortcuts using click-through data 目的 Query suggestionはこれまで散々紹介しているので割愛.この論文では「似ているクエリ」を推薦するのではなく,ユーザの需要を満たしたクエリ(Successful)を推薦する. 類似度尺度 ユーザの一連のクエリ入力…

ICML2011読み会参加してきた & Preserving Personalized Pagerank in Subgraphs(ICML 2011)読んだ

というわけでid:nokuno氏主催のICML2011読み会に参加した. 読んだ論文はこれ(pdf). Preserving Personalized Pagerank in Subgraphs(ICML 2011) View more presentations from ybenjo 元グラフの構造を持ったまま部分グラフを作るという話.

Multi-factor clustering for a marketplace search interface(WWW 2007) と Mining tag clouds and emoticons behind community feedback(WWW 2008) も読んだ

Multi-factor clustering for a marketplace search interface Mining tag clouds and emoticons behind community feedback ポスター原稿.eBay Research Labs.正直よく判らなかった. Multi-factor clustering for a marketplace search interface(WWW 20…

Keyword Extraction for Contextual Advertisement(WWW 2008) 読んだ

Keyword extraction for contextual advertisement ポスター原稿.eBay Research Labs. 概要 あるWebページのジャンルを推定し,それに見合った広告を提示したい. コンテンツマッチな広告のためにキーワード抽出と,(タイトルには入ってないが)ページの…

Rare item detection in e-commerce site(WWW 2009) 読んだ

Rare item detection in e-commerce site ポスター原稿.eBay Research Labs. 概要 出品されたアイテムがレアものかどうか判定する. 方法 アルゴリズムは二段階. まずレアでありそうなアイテムをフィルタリング フィルタリングに使う特徴は次の4つ. List…

RubyからGmailのSMTPサーバ使ってメール送るならpony使うほうが楽だった

Ruby + TMailでGmailのSMTPサーバを使ってメールを送信したいがCcがうまく処理されない→解決した - 糞ネット弁慶 前回はTMail+ruby1.8.9で送っていたが1.9環境でメールを送る必要性が生じた. しかしruby1.9においては"tmailscanner.so: undefined symbol: r…

Rated aspect summarization of short comments(WWW 2009) 読んだ

Rated aspect summarization of short comments 概要 またもeBay Research Labs. 商品及びそのrate(評価値),コメントからAspect(側面)別にコメントを要約してrateまで出す.具体的に言うとこんな感じ. 記法 まず,ある商品についたコメントをとし,をコメ…

Ruby + TMailでGmailのSMTPサーバを使ってメールを送信したいがCcがうまく処理されない→解決した

ある必要性からRubyでgmailのsmtpサーバからメールを送るこんなスクリプトを書いた. 参考にしたのはこちら→GMailのSMTPサーバーを使ってメールを送信するサンプル - うなの日記 # -*- coding: utf-8 -*- require "rubygems" require "tmail" require "tlsma…

Action prediction and identification from mining temporal user behaviors(WSDM 2011) 読むのを諦めた

Action prediction and identification from mining temporal user behaviors 概要 時系列っぽいようなユーザの行動データから,ユーザがあるアクションを起こすかどうかを判定する. だいたいやってる事は掴めたが,俺の英語力が低すぎるせいで理解できない…

最近読んでる本

サピア・ウォーフ仮説が気になっていたが,どれから読んでいいかわからないのでとりあえずサピアを読んでる.言語―ことばの研究序説 (岩波文庫)作者: エドワードサピア,Edward Sapir,安藤貞雄出版社/メーカー: 岩波書店発売日: 1998/11/18メディア: 文庫購入…

Substitutes or complements: another step forward in recommendations(EC 2009) 読んだ

Substitutes or complements: another step forward in recommendations 概要 これもeBay Research Labs.しかもシャンハイにもあるらしい.1stはインターンで来ていた学生. あとACM conference on Electronic commerceというものがあるのもはじめて知った…

Inferring Semantic Query Relations from Collective User Behavior(CIKM 2008) 読んだ

Inferring semantic query relations from collective user behavior 概要 またもやeBay Research Labs. クエリにおけるSemanticな関係性を分析する. 3種の類似度指標を考え,それぞれをグラフで表現する.その後,それらを線形結合し,クエリqに対して関…