糞糞糞ネット弁慶

読んだ論文についてメモを書きます.趣味の話は http://repose.hatenablog.com

論文

A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys 2020) 読んだ

論文 Gunosy と理研AIPの論文. 企業が持つ implicit feedback のデータを公開するためには アクティブユーザ数や収益や平均クリック数といった business metric を隠したい 公平性を担保したい Population Bias を減らしたい という三つの気持ちがある. 今…

Data Synthesis based on Generative Adversarial Networks (VLDB 2018) 読んだ

[1806.03384] Data Synthesis based on Generative Adversarial Networks 匿名化については micro aggregation (各行を集約することで架空の行を生成すること) や post-randomization (ノイズを載せる) などがあるわけですが, GAN でデータを生成すれば完全…

Comprehensive Audience Expansion based on End-to-End Neural Prediction (SIGIR eCOM 2019) 読んだ

Comprehensive Audience Expansion based on End-to-End Neural Prediction (pdf) もうひとつオーディエンス拡張の論文.特にモデルが目新しいわけでもなく,実験もよくわからない (Table 3 は何を行っているのか意味不明) だけど気になったところを書く. …

Finding Users Who Act Alike: Transfer Learning for Expanding Advertiser Audiences (KDD 2019) 読んだ

Finding Users Who Act Alike: Transfer Learning for Expanding Advertiser Audiences Pinterest におけるオーディエンス拡張を説明した論文.オーディエンス拡張の論文はあまり見かけないので良かった. オーディエンス拡張 (あるいは look-alike) は広告…

Personalized Purchase Prediction of Market Baskets with Wasserstein-Based Sequence Matching (KDD 2019) 読んだ

Personalized Purchase Prediction of Market Baskets with Wasserstein-Based Sequence Matching KDD 2019 の Accepted papers が出たのでひとまずタイトル一覧に目を通し, arXiv などに既にあるものから読んでいこうと思います.しかしあまりにも Graph C…

Personalized Top-N Sequential Recommendation via Convolutional Sequence Embedding (WSDM 2018) 読んだ

Personalized Top-N Sequential Recommendation via Convolutional Sequence Embedding (pdf) A Simple Convolutional Generative Network for Next Item Recommendation (WSDM 2019) を読もうとしたところ引用されていたのでまずはこちらから読む.WSDM 201…

300 万ノード 1 億エッジからなる日本語版 Wikipedia のリンク構造から学習した見出し語の node2vec (分散表現) を公開しました

タイトルの通りです.Wikipedia 本文を用いた埋め込みは 東北大乾研による日本語 Wikipedia エンティティベクトル BIZREACH によるHR領域向け単語ベクトル|株式会社ビズリーチ 朝日新聞による朝日新聞単語ベクトル BERT with SentencePiece を日本語 Wikipe…

Predicting Audio Advertisement Quality (WSDM 2018) 読んだ

[1802.03319] Predicting Audio Advertisement QualitySpotify や Pandora などの音楽配信サービスにおいて挿入される音声のみの広告の品質を機械学習で推定する. 方針としては,音声から handcrafted な特徴量を抽出し,代理タスクを解く. 論文の著者は P…

Applying Deep Learning To Airbnb Search (preprint) 読んだ

[1810.09591] Applying Deep Learning To Airbnb SearchAirbnb における Search に Deep Learning を導入した話.「機械学習のシステムが既にあってそこにニューラルネットワークを導入したい人」に向けて書かれている. 論文調ではないのでまとめも箇条書き…

IRGAN (SIGIR 2017)→GraphGAN (AAAI 2018)→CFGAN (CIKM 2018) を読んで GAN による購買予測/協調フィルタリングを学ぶ

CFGAN (CIKM 2018) を読もうと思ったら「そもそも発想としては IRGAN (SIGIR 2017) と GraphGAN (AAAI 2018) が先にあって……」と触れられていたので順に読むことにする. そもそもタイムラインで「CFGAN がはじめて商品推薦に GAN を使っていてすごい」とい…

Graph Convolutional Neural Networks for Web-Scale Recommender Systems (KDD 2018) 読んだ

KDD 2018 | Graph Convolutional Neural Networks for Web-Scale Recommender Systems 著者に Jure Keskovec がいる. Pinterest における推薦にて node の embedding を graph convolution で学習する推薦手法 PinSage を提案している.タイトルだけ読むと…

Sequences of Sets (KDD 2018) 読んだ

KDD 2018 | Sequences of Sets 好きな研究者が何人かいて,タイトルで気になった論文の著者がその人だとちょっとうれしくなる.Cornell University の Jon M. Kleinberg や Google の Ravi Kumar , Stanford の Jure Leskovec は気になって定期的に著者のペ…

Learning and Transferring IDs Representation in E-commerce (KDD 2018) 読んだ

KDD 2018 | Learning and Transferring IDs Representation in E-commerce EC サイトにおける商品 (item) の埋め込み (embedding) を学習する.その際,商品につけられたメタデータをまとめて学習する. 基本方針 ユーザの商品閲覧行動にもとづいて skip-gra…

Trajectory-driven Influential Billboard Placement (KDD 2018) 読んだ

KDD 2018 | Trajectory-driven Influential Billboard Placement街頭広告をどのように選ぶかに取り組む。 問題設定としては 緯度経度で構成される軌跡 (trajectory) の集合 緯度軽度とコストで構成される街頭広告 (billboard) の集合 総予算 が与えられ、 軌…

Customized Regression Model for Airbnb Dynamic Pricing (KDD 2018) 読んだ

KDD 2018 | Customized Regression Model for Airbnb Dynamic Pricing民泊サービス Airbnb において, host (部屋を提供する人,ホスト) に対して「この値段で部屋を貸すと良い」と価格を提案する機能を実装するための技術. 予約 (booking) が入るかどうか…

Pixie: A System for Recommending 3+ Billion Items to 200+ Million Users in Real-Time (WebConf 2018) 読んだ

[1711.07601] Pixie: A System for Recommending 3+ Billion Items to 200+ Million Users in Real-Time Pinterest における推薦の論文.Jure Leskovec が last author に入っているのでとりあえず読む. WWW が WebConf に名前が変わったのが悲しい. 概要 …

Dynamic Word Embeddings for Evolving Semantic Discovery (WSDM 2018) 読んだ

概要 [1703.00607] Dynamic Word Embeddings for Evolving Semantic Discovery word embedding の時系列変化が見たい(これどこかの論文でも見た気がする). 例えば, apple という単語は昔は果物が連想されるだけだったが,今ではテクノロジー企業も連想され…

Neural Factorization Machines for Sparse Predictive Analytics (SIGIR 2017) 読んだ & Chainer で実装した

[1708.05027] Neural Factorization Machines for Sparse Predictive Analyticsみんなが好きな Factorization Machines (FM) とニューラルネットワークを組み合わせて Neural Factorization Machines (NFM) を提案する. FM とその派生手法がいくら変数間の…

NIMA: Neural Image Assessment (Arxiv) または『Googleが作った画像評価モデル』の元論文を読んだ

[1709.05424] NIMA: Neural Image AssessmentGoogle、任意の画像が技術的に審美的に美しいかを評価し1-10(10が最高得点)で採点するCNNベースの画像評価モデル「NIMA」を提案した論文を発表 | Seamless Google AI Blog: Introducing NIMA: Neural Image Ass…

Deep Text Classification Can be Fooled (Preprint) 読んだ

Deep Text Classification Can be Fooled 入力を少し変化させるだけで機械学習によるモデルの推定結果を変えてしまう技術は Adversarial example と呼ばれている. よく見るのは画像を用いた例だけど,それが文書分類でもできないかと思い探したところ,まず…

Neural Collaborative Filtering (WWW 2017) 読んだ & Chainer で実装した

Neural Collaborative Filtering (pdf) 概要 タスクは user と item について評価しているか (1) していないか (0) の情報 (implicit feedback) から未知の user と item の評価を予測する,商品推薦において非常に古典的なもの. 一般的には協調フィルタリ…

Face-to-BMI: Using Computer Vision to Infer Body Mass Index on Social Media (ICWSM 2017) 読んだ

Face-to-BMI 顔写真から BMI (Body Mass Index) を推定する.データセットは progresspics - Show us your body transformations をクロールし,皆さんがアップロードしている before / after の写真 4206 枚を集めた. reddit にこんなデータがあるとは思わ…

Field-aware Factorization Machines in a Real-world Online Advertising System (WWW 2017) 読んだ

[1701.04099] Field-aware Factorization Machines in a Real-world Online Advertising System Criteo で Field-aware Factorization Machines を活用している,という話.気になった点をメモしておく. 複数マシンでの推定 Iterative Parameter Mixing を…

Trajectory Recovery From Ash: User Privacy Is NOT Preserved in Aggregated Mobility Data (WWW 2017) 読んだ

[1702.06270] Trajectory Recovery From Ash: User Privacy Is NOT Preserved in Aggregated Mobility Data ユーザのプライバシーなどに考慮し,「誰がいつどこにいたか」という生の位置情報ではなく,「どの領域にいつ何人いたか」という集計情報の公開,共…

Modeling Consumer Preferences and Price Sensitivities from Large-Scale Grocery Shopping Transaction Logs (WWW 2017) 読んだ

Modeling Consumer Preferences and Price Sensitivities from Large-Scale Grocery Shopping Transaction Logs (WWW 2017) 概要 ある商品の購入数を予測する上で階層構造を導入する.更に値段も重要だからモデルに組み込む. 具体的には が に を 個購入す…

Portrait of an Online Shopper: Understanding and Predicting Consumer Behavior (WSDM 2016) 読んだ

[1512.04912] Portrait of an Online Shopper: Understanding and Predicting Consumer Behavior オンラインでの購買行動に関する様々な分析. 年齢,性別の購買傾向,購買した商品の違い,購買間隔,購買金額の分析,および購買金額,購買間隔の予測. デー…

From Online Behaviors to Offline Retailing (KDD 2016) 読んだ

From Online Behaviors to Offline Retailing オンラインの行動とオフラインの購買を同時に分析する.すなわち,「オフラインの行動とオンラインの行動にはどういう関係があるか」がわかる. また,実験では「直近での検索行動を用いることによりその後の購…

DeepIntent: Learning Attentions for Online Advertising with Recurrent Neural Networks (KDD 2016) 読んだ

DeepIntent: Learning Attentions for Online Advertising with Recurrent Neural Networks入力された検索クエリに対して最も適切な文言の広告を出すタスク. 検索クエリおよび広告を単語の系列データとして, RNN などにもとづく neural network に通して適…

Just One More: Modeling Binge Watching Behavior (KDD2016) 読んだ

Just One More: Modeling Binge Watching Behavior このタイトルを見るまで "binge-watching" という単語を知らなかった.ある番組などにハマってまとめて見てしまうことらしい. 論文では VOD (Video On Demand) サービス (特にこのサイトは定額見放題では…

Collaborative Denoising Auto-Encoders for Top-N Recommender Systems (WSDM 2016) 読んだ

(pdf) 手法 ユーザの評価したアイテム集合にノイズを載せ,それを復元する AutoEncoder (AE) を学習する. その際,入力層にユーザ固有のノードを1つ追加し,その上で全隠れ層に対してユーザノードから(ユーザ固有の)重みを持った枝を張る. これがただのAE…