糞糞糞ネット弁慶

読んだ論文についてメモを書きます.趣味の話は http://repose.hatenablog.com

論文

300 万ノード 1 億エッジからなる日本語版 Wikipedia のリンク構造から学習した見出し語の node2vec (分散表現) を公開しました

タイトルの通りです.Wikipedia 本文を用いた埋め込みは 東北大乾研による日本語 Wikipedia エンティティベクトル BIZREACH によるHR領域向け単語ベクトル|株式会社ビズリーチ 朝日新聞による朝日新聞単語ベクトル BERT with SentencePiece を日本語 Wikipe…

Predicting Audio Advertisement Quality (WSDM 2018) 読んだ

[1802.03319] Predicting Audio Advertisement QualitySpotify や Pandora などの音楽配信サービスにおいて挿入される音声のみの広告の品質を機械学習で推定する. 方針としては,音声から handcrafted な特徴量を抽出し,代理タスクを解く. 論文の著者は P…

Applying Deep Learning To Airbnb Search (preprint) 読んだ

[1810.09591] Applying Deep Learning To Airbnb SearchAirbnb における Search に Deep Learning を導入した話.「機械学習のシステムが既にあってそこにニューラルネットワークを導入したい人」に向けて書かれている. 論文調ではないのでまとめも箇条書き…

IRGAN (SIGIR 2017)→GraphGAN (AAAI 2018)→CFGAN (CIKM 2018) を読んで GAN による購買予測/協調フィルタリングを学ぶ

CFGAN (CIKM 2018) を読もうと思ったら「そもそも発想としては IRGAN (SIGIR 2017) と GraphGAN (AAAI 2018) が先にあって……」と触れられていたので順に読むことにする. そもそもタイムラインで「CFGAN がはじめて商品推薦に GAN を使っていてすごい」とい…

Graph Convolutional Neural Networks for Web-Scale Recommender Systems (KDD 2018) 読んだ

KDD 2018 | Graph Convolutional Neural Networks for Web-Scale Recommender Systems 著者に Jure Keskovec がいる. Pinterest における推薦にて node の embedding を graph convolution で学習する推薦手法 PinSage を提案している.タイトルだけ読むと…

Sequences of Sets (KDD 2018) 読んだ

KDD 2018 | Sequences of Sets 好きな研究者が何人かいて,タイトルで気になった論文の著者がその人だとちょっとうれしくなる.Cornell University の Jon M. Kleinberg や Google の Ravi Kumar , Stanford の Jure Leskovec は気になって定期的に著者のペ…

Learning and Transferring IDs Representation in E-commerce (KDD 2018) 読んだ

KDD 2018 | Learning and Transferring IDs Representation in E-commerce EC サイトにおける商品 (item) の埋め込み (embedding) を学習する.その際,商品につけられたメタデータをまとめて学習する. 基本方針 ユーザの商品閲覧行動にもとづいて skip-gra…

Trajectory-driven Influential Billboard Placement (KDD 2018) 読んだ

KDD 2018 | Trajectory-driven Influential Billboard Placement街頭広告をどのように選ぶかに取り組む。 問題設定としては 緯度経度で構成される軌跡 (trajectory) の集合 緯度軽度とコストで構成される街頭広告 (billboard) の集合 総予算 が与えられ、 軌…

Customized Regression Model for Airbnb Dynamic Pricing (KDD 2018) 読んだ

KDD 2018 | Customized Regression Model for Airbnb Dynamic Pricing民泊サービス Airbnb において, host (部屋を提供する人,ホスト) に対して「この値段で部屋を貸すと良い」と価格を提案する機能を実装するための技術. 予約 (booking) が入るかどうか…

Pixie: A System for Recommending 3+ Billion Items to 200+ Million Users in Real-Time (WebConf 2018) 読んだ

[1711.07601] Pixie: A System for Recommending 3+ Billion Items to 200+ Million Users in Real-Time Pinterest における推薦の論文.Jure Leskovec が last author に入っているのでとりあえず読む. WWW が WebConf に名前が変わったのが悲しい. 概要 …

Dynamic Word Embeddings for Evolving Semantic Discovery (WSDM 2018) 読んだ

概要 [1703.00607] Dynamic Word Embeddings for Evolving Semantic Discovery word embedding の時系列変化が見たい(これどこかの論文でも見た気がする). 例えば, apple という単語は昔は果物が連想されるだけだったが,今ではテクノロジー企業も連想され…

Neural Factorization Machines for Sparse Predictive Analytics (SIGIR 2017) 読んだ & Chainer で実装した

[1708.05027] Neural Factorization Machines for Sparse Predictive Analyticsみんなが好きな Factorization Machines (FM) とニューラルネットワークを組み合わせて Neural Factorization Machines (NFM) を提案する. FM とその派生手法がいくら変数間の…

NIMA: Neural Image Assessment (Arxiv) または『Googleが作った画像評価モデル』の元論文を読んだ

[1709.05424] NIMA: Neural Image AssessmentGoogle、任意の画像が技術的に審美的に美しいかを評価し1-10(10が最高得点)で採点するCNNベースの画像評価モデル「NIMA」を提案した論文を発表 | Seamless Google AI Blog: Introducing NIMA: Neural Image Ass…

Deep Text Classification Can be Fooled (Preprint) 読んだ

Deep Text Classification Can be Fooled 入力を少し変化させるだけで機械学習によるモデルの推定結果を変えてしまう技術は Adversarial example と呼ばれている. よく見るのは画像を用いた例だけど,それが文書分類でもできないかと思い探したところ,まず…

Neural Collaborative Filtering (WWW 2017) 読んだ & Chainer で実装した

Neural Collaborative Filtering (pdf) 概要 タスクは user と item について評価しているか (1) していないか (0) の情報 (implicit feedback) から未知の user と item の評価を予測する,商品推薦において非常に古典的なもの. 一般的には協調フィルタリ…

Face-to-BMI: Using Computer Vision to Infer Body Mass Index on Social Media (ICWSM 2017) 読んだ

Face-to-BMI 顔写真から BMI (Body Mass Index) を推定する.データセットは progresspics - Show us your body transformations をクロールし,皆さんがアップロードしている before / after の写真 4206 枚を集めた. reddit にこんなデータがあるとは思わ…

Field-aware Factorization Machines in a Real-world Online Advertising System (WWW 2017) 読んだ

[1701.04099] Field-aware Factorization Machines in a Real-world Online Advertising System Criteo で Field-aware Factorization Machines を活用している,という話.気になった点をメモしておく. 複数マシンでの推定 Iterative Parameter Mixing を…

Trajectory Recovery From Ash: User Privacy Is NOT Preserved in Aggregated Mobility Data (WWW 2017) 読んだ

[1702.06270] Trajectory Recovery From Ash: User Privacy Is NOT Preserved in Aggregated Mobility Data ユーザのプライバシーなどに考慮し,「誰がいつどこにいたか」という生の位置情報ではなく,「どの領域にいつ何人いたか」という集計情報の公開,共…

Modeling Consumer Preferences and Price Sensitivities from Large-Scale Grocery Shopping Transaction Logs (WWW 2017) 読んだ

Modeling Consumer Preferences and Price Sensitivities from Large-Scale Grocery Shopping Transaction Logs (WWW 2017) 概要 ある商品の購入数を予測する上で階層構造を導入する.更に値段も重要だからモデルに組み込む. 具体的には が に を 個購入す…

Portrait of an Online Shopper: Understanding and Predicting Consumer Behavior (WSDM 2016) 読んだ

[1512.04912] Portrait of an Online Shopper: Understanding and Predicting Consumer Behavior オンラインでの購買行動に関する様々な分析. 年齢,性別の購買傾向,購買した商品の違い,購買間隔,購買金額の分析,および購買金額,購買間隔の予測. デー…

From Online Behaviors to Offline Retailing (KDD 2016) 読んだ

From Online Behaviors to Offline Retailing オンラインの行動とオフラインの購買を同時に分析する.すなわち,「オフラインの行動とオンラインの行動にはどういう関係があるか」がわかる. また,実験では「直近での検索行動を用いることによりその後の購…

DeepIntent: Learning Attentions for Online Advertising with Recurrent Neural Networks (KDD 2016) 読んだ

DeepIntent: Learning Attentions for Online Advertising with Recurrent Neural Networks入力された検索クエリに対して最も適切な文言の広告を出すタスク. 検索クエリおよび広告を単語の系列データとして, RNN などにもとづく neural network に通して適…

Just One More: Modeling Binge Watching Behavior (KDD2016) 読んだ

Just One More: Modeling Binge Watching Behavior このタイトルを見るまで "binge-watching" という単語を知らなかった.ある番組などにハマってまとめて見てしまうことらしい. 論文では VOD (Video On Demand) サービス (特にこのサイトは定額見放題では…

Collaborative Denoising Auto-Encoders for Top-N Recommender Systems (WSDM 2016) 読んだ

(pdf) 手法 ユーザの評価したアイテム集合にノイズを載せ,それを復元する AutoEncoder (AE) を学習する. その際,入力層にユーザ固有のノードを1つ追加し,その上で全隠れ層に対してユーザノードから(ユーザ固有の)重みを持った枝を張る. これがただのAE…

Modeling Intransitivity in Matchup and Comparison Data (WSDM 2016) 読んだ

概要 Modeling Intransitivity in Matchup and Comparison Data (WSDM 2016)(pdf) 二人のプレイヤーが戦い,勝敗が決まるゲームのモデリングにおいては通常,各プレイヤーの強さは一元的である.よって,推定されたモデルでは推移律が成立する(aがbより,bが…

Your Cart tells You: Inferring Demographic Attributes from Purchase Data (WSDM 2016) 読んだ

Your Cart tells You: Inferring Demographic Attributes from Purchase Data(pdf) 概要 購買履歴からユーザの属性(年齢,性別,結婚状況,収入,学歴)を同時に推定する. つまり,複数の属性を同時に推定する multi-task multi-class prediction に取り組む…

The Web as a Jungle: Non-Linear Dynamical Systems for Co-evolving Online Activities (WWW 2015) 読んだ

The Web as a Jungle: Non-Linear Dynamical Systems for Co-evolving Online Activities (pdf)冬コミのモデルに使おうとして読んだ. 概要 Lotka-Volterra の捕食者 - 被食者のモデルを使う. タイムスタンプつきの各キーワードの検索数 (実験では Google T…

Early Identification of Violent Criminal Gang Members (KDD 2015) 読んだ

[1508.03965] Early Identification of Violent Criminal Gang Members アリゾナ州立大とシカゴ市警察との共著論文.逮捕データから共逮捕ネットワークを作り,ある人物が将来逮捕されるかどうかを予測する. 実データによる実験の結果,精度0.89,再現率0.7…

Life-stage Prediction for Product Recommendation in E-commerce (KDD 2015) 読んだ

Life-stage Prediction for Product Recommendation in E-commerce 母親-赤ん坊(mum-baby)を対象に,赤ん坊の年齢(というより,胎児/新生児-六ヶ月/1歳/1-3歳/といったような状態)を推定してレコメンデーションの精度を上げる. 著者4人のうち3人がアリババ…

Inferring networks of substitute and complementary products (KDD 2015) 読んだ

[1506.08839] Inferring Networks of Substitutable and Complementary Products http://www.slideshare.net/dato-inc/inferring-networks-of-substitute-and-complementary-products 著者に Pinterest の人が入ってる. 2つ商品の関係が経済学用語で言う代…