AI generates covertly racist decisions about people based on their dialect (Nature, 2024) 読んだ

論文

AI generates covertly racist decisions about people based on their dialect | Nature まとめ AI (論文タイトルの AI は LLM を指すが以降 LLM と書く) は方言話者を差別する．実験1 : LLM が方言話者をどう思っているかこの論文では African American …

2024-09-21

CXSimulator: A User Behavior Simulation using LLM Embeddings for Web-Marketing Campaign Assessment (CIKM 2024) 読んだ

論文

[2407.21553] CXSimulator: A User Behavior Simulation using LLM Embeddings for Web-Marketing Campaign Assessment 「ユーザの行動ログから何らかのモデルを構築し，ユーザの行動をシミュレートしたい」という気持ちはよくあることでしょう．たとえば，E…

2020-11-23

A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys 2020) 読んだ

論文

論文 Gunosy と理研AIPの論文．企業が持つ implicit feedback のデータを公開するためにはアクティブユーザ数や収益や平均クリック数といった business metric を隠したい公平性を担保したい Population Bias を減らしたいという三つの気持ちがある．今…

2019-08-25

Data Synthesis based on Generative Adversarial Networks (VLDB 2018) 読んだ

論文

[1806.03384] Data Synthesis based on Generative Adversarial Networks 匿名化については micro aggregation (各行を集約することで架空の行を生成すること) や post-randomization (ノイズを載せる) などがあるわけですが， GAN でデータを生成すれば完全…

2019-08-08

Comprehensive Audience Expansion based on End-to-End Neural Prediction (SIGIR eCOM 2019) 読んだ

論文

Comprehensive Audience Expansion based on End-to-End Neural Prediction (pdf) もうひとつオーディエンス拡張の論文．特にモデルが目新しいわけでもなく，実験もよくわからない (Table 3 は何を行っているのか意味不明) だけど気になったところを書く． …

2019-08-05

Finding Users Who Act Alike: Transfer Learning for Expanding Advertiser Audiences (KDD 2019) 読んだ

論文

Finding Users Who Act Alike: Transfer Learning for Expanding Advertiser Audiences Pinterest におけるオーディエンス拡張を説明した論文．オーディエンス拡張の論文はあまり見かけないので良かった．オーディエンス拡張 (あるいは look-alike) は広告…

2019-07-12

Personalized Purchase Prediction of Market Baskets with Wasserstein-Based Sequence Matching (KDD 2019) 読んだ

論文

Personalized Purchase Prediction of Market Baskets with Wasserstein-Based Sequence Matching KDD 2019 の Accepted papers が出たのでひとまずタイトル一覧に目を通し， arXiv などに既にあるものから読んでいこうと思います．しかしあまりにも Graph C…

2019-05-08

Personalized Top-N Sequential Recommendation via Convolutional Sequence Embedding (WSDM 2018) 読んだ

論文

Personalized Top-N Sequential Recommendation via Convolutional Sequence Embedding (pdf) A Simple Convolutional Generative Network for Next Item Recommendation (WSDM 2019) を読もうとしたところ引用されていたのでまずはこちらから読む．WSDM 201…

2019-01-25

300 万ノード 1 億エッジからなる日本語版 Wikipedia のリンク構造から学習した見出し語の node2vec (分散表現) を公開しました

論文メモ

タイトルの通りです．Wikipedia 本文を用いた埋め込みは東北大乾研による日本語 Wikipedia エンティティベクトル BIZREACH によるHR領域向け単語ベクトル｜株式会社ビズリーチ朝日新聞による朝日新聞単語ベクトル BERT with SentencePiece を日本語 Wikipe…

2019-01-17

Predicting Audio Advertisement Quality (WSDM 2018) 読んだ

論文

[1802.03319] Predicting Audio Advertisement QualitySpotify や Pandora などの音楽配信サービスにおいて挿入される音声のみの広告の品質を機械学習で推定する．方針としては，音声から handcrafted な特徴量を抽出し，代理タスクを解く．論文の著者は P…

2018-11-13

Applying Deep Learning To Airbnb Search (preprint) 読んだ

論文

[1810.09591] Applying Deep Learning To Airbnb SearchAirbnb における Search に Deep Learning を導入した話．「機械学習のシステムが既にあってそこにニューラルネットワークを導入したい人」に向けて書かれている．論文調ではないのでまとめも箇条書き…

2018-11-09

IRGAN (SIGIR 2017)→GraphGAN (AAAI 2018)→CFGAN (CIKM 2018) を読んで GAN による購買予測/協調フィルタリングを学ぶ

論文

CFGAN (CIKM 2018) を読もうと思ったら「そもそも発想としては IRGAN (SIGIR 2017) と GraphGAN (AAAI 2018) が先にあって……」と触れられていたので順に読むことにする．そもそもタイムラインで「CFGAN がはじめて商品推薦に GAN を使っていてすごい」とい…

2018-09-20

Graph Convolutional Neural Networks for Web-Scale Recommender Systems (KDD 2018) 読んだ

論文

KDD 2018 | Graph Convolutional Neural Networks for Web-Scale Recommender Systems 著者に Jure Keskovec がいる． Pinterest における推薦にて node の embedding を graph convolution で学習する推薦手法 PinSage を提案している．タイトルだけ読むと…

2018-09-01

Sequences of Sets (KDD 2018) 読んだ

論文

KDD 2018 | Sequences of Sets 好きな研究者が何人かいて，タイトルで気になった論文の著者がその人だとちょっとうれしくなる．Cornell University の Jon M. Kleinberg や Google の Ravi Kumar ， Stanford の Jure Leskovec は気になって定期的に著者のペ…

2018-08-28

Learning and Transferring IDs Representation in E-commerce (KDD 2018) 読んだ

論文

KDD 2018 | Learning and Transferring IDs Representation in E-commerce EC サイトにおける商品 (item) の埋め込み (embedding) を学習する．その際，商品につけられたメタデータをまとめて学習する．基本方針ユーザの商品閲覧行動にもとづいて skip-gra…

2018-08-26

Trajectory-driven Influential Billboard Placement (KDD 2018) 読んだ

論文

KDD 2018 | Trajectory-driven Influential Billboard Placement街頭広告をどのように選ぶかに取り組む。問題設定としては緯度経度で構成される軌跡 (trajectory) の集合緯度軽度とコストで構成される街頭広告 (billboard) の集合総予算が与えられ、軌…

2018-08-25

Customized Regression Model for Airbnb Dynamic Pricing (KDD 2018) 読んだ

論文

KDD 2018 | Customized Regression Model for Airbnb Dynamic Pricing民泊サービス Airbnb において， host (部屋を提供する人，ホスト) に対して「この値段で部屋を貸すと良い」と価格を提案する機能を実装するための技術．予約 (booking) が入るかどうか…

2018-06-24

Pixie: A System for Recommending 3+ Billion Items to 200+ Million Users in Real-Time (WebConf 2018) 読んだ

論文

[1711.07601] Pixie: A System for Recommending 3+ Billion Items to 200+ Million Users in Real-Time Pinterest における推薦の論文．Jure Leskovec が last author に入っているのでとりあえず読む． WWW が WebConf に名前が変わったのが悲しい．概要 …

2018-04-05

Dynamic Word Embeddings for Evolving Semantic Discovery (WSDM 2018) 読んだ

論文

概要 [1703.00607] Dynamic Word Embeddings for Evolving Semantic Discovery word embedding の時系列変化が見たい(これどこかの論文でも見た気がする)．例えば， apple という単語は昔は果物が連想されるだけだったが，今ではテクノロジー企業も連想され…

2018-03-18

Neural Factorization Machines for Sparse Predictive Analytics (SIGIR 2017) 読んだ & Chainer で実装した

論文

[1708.05027] Neural Factorization Machines for Sparse Predictive Analyticsみんなが好きな Factorization Machines (FM) とニューラルネットワークを組み合わせて Neural Factorization Machines (NFM) を提案する． FM とその派生手法がいくら変数間の…

2017-12-22

NIMA: Neural Image Assessment (Arxiv) または『Googleが作った画像評価モデル』の元論文を読んだ

論文

[1709.05424] NIMA: Neural Image AssessmentGoogle、任意の画像が技術的に審美的に美しいかを評価し1-10（10が最高得点）で採点するCNNベースの画像評価モデル「NIMA」を提案した論文を発表 | Seamless Google AI Blog: Introducing NIMA: Neural Image Ass…

2017-12-03

Deep Text Classification Can be Fooled (Preprint) 読んだ

論文

Deep Text Classification Can be Fooled 入力を少し変化させるだけで機械学習によるモデルの推定結果を変えてしまう技術は Adversarial example と呼ばれている．よく見るのは画像を用いた例だけど，それが文書分類でもできないかと思い探したところ，まず…

2017-08-19

Neural Collaborative Filtering (WWW 2017) 読んだ & Chainer で実装した

論文

Neural Collaborative Filtering (pdf) 概要タスクは user と item について評価しているか (1) していないか (0) の情報 (implicit feedback) から未知の user と item の評価を予測する，商品推薦において非常に古典的なもの．一般的には協調フィルタリ…

2017-08-01

Face-to-BMI: Using Computer Vision to Infer Body Mass Index on Social Media (ICWSM 2017) 読んだ

論文

Face-to-BMI 顔写真から BMI (Body Mass Index) を推定する．データセットは progresspics - Show us your body transformations をクロールし，皆さんがアップロードしている before / after の写真 4206 枚を集めた． reddit にこんなデータがあるとは思わ…

2017-07-06

Field-aware Factorization Machines in a Real-world Online Advertising System (WWW 2017) 読んだ

論文

[1701.04099] Field-aware Factorization Machines in a Real-world Online Advertising System Criteo で Field-aware Factorization Machines を活用している，という話．気になった点をメモしておく．複数マシンでの推定 Iterative Parameter Mixing を…

2017-07-06

Trajectory Recovery From Ash: User Privacy Is NOT Preserved in Aggregated Mobility Data (WWW 2017) 読んだ

論文

[1702.06270] Trajectory Recovery From Ash: User Privacy Is NOT Preserved in Aggregated Mobility Data ユーザのプライバシーなどに考慮し，「誰がいつどこにいたか」という生の位置情報ではなく，「どの領域にいつ何人いたか」という集計情報の公開，共…

2017-05-08

Modeling Consumer Preferences and Price Sensitivities from Large-Scale Grocery Shopping Transaction Logs (WWW 2017) 読んだ

論文

Modeling Consumer Preferences and Price Sensitivities from Large-Scale Grocery Shopping Transaction Logs (WWW 2017) 概要ある商品の購入数を予測する上で階層構造を導入する．更に値段も重要だからモデルに組み込む．具体的にはがにを個購入す…