日本声優統計学会 にて声優統計コーパスを公開してほぼ一年.個人団体を問わず問い合わせのメールを頂いている.しかしよく考えたら Google Analytics の設定をまともに書いていなかったせいでどれぐらいダウンロードされたのか全く計測できていない.せめて…
概要 [1703.00607] Dynamic Word Embeddings for Evolving Semantic Discovery word embedding の時系列変化が見たい(これどこかの論文でも見た気がする). 例えば, apple という単語は昔は果物が連想されるだけだったが,今ではテクノロジー企業も連想され…
[1708.05027] Neural Factorization Machines for Sparse Predictive Analyticsみんなが好きな Factorization Machines (FM) とニューラルネットワークを組み合わせて Neural Factorization Machines (NFM) を提案する. FM とその派生手法がいくら変数間の…
終わったはずの声優統計.しかし5号から8号までの前回の冬コミ在庫が若干部屋に残っていました.正直保存状態は悪いです. @MagnesiumRibbonが30日東 F-55b Rei'n forcement にて松嵜麗さんの本を出す予定(松嵜麗さんのファンブックを出したいです - Rei'n f…
[1709.05424] NIMA: Neural Image AssessmentGoogle、任意の画像が技術的に審美的に美しいかを評価し1-10(10が最高得点)で採点するCNNベースの画像評価モデル「NIMA」を提案した論文を発表 | Seamless Google AI Blog: Introducing NIMA: Neural Image Ass…
Deep Text Classification Can be Fooled 入力を少し変化させるだけで機械学習によるモデルの推定結果を変えてしまう技術は Adversarial example と呼ばれている. よく見るのは画像を用いた例だけど,それが文書分類でもできないかと思い探したところ,まず…
Neural Collaborative Filtering (pdf) 概要 タスクは user と item について評価しているか (1) していないか (0) の情報 (implicit feedback) から未知の user と item の評価を予測する,商品推薦において非常に古典的なもの. 一般的には協調フィルタリ…
Face-to-BMI 顔写真から BMI (Body Mass Index) を推定する.データセットは progresspics - Show us your body transformations をクロールし,皆さんがアップロードしている before / after の写真 4206 枚を集めた. reddit にこんなデータがあるとは思わ…
python で実装はしていたけれどもう少し速度が欲しかった. C++で書こうと思っていたけれど,周りから golang を薦められたので従った. 高速化のためにパラメータ更新は[1106.5730] HOGWILD!: A Lock-Free Approach to Parallelizing Stochastic Gradient D…
声優統計コーパス : 二次配布可能な音素バランス文とその読み上げ音声の構築 (pdf, GitHub) というわけで プロの女性声優 3 名が 3 パターンの感情表現で読み上げた音声 2 時間分 を「声優統計コーパス」として無料公開します - 糞ネット弁慶 で公開した声優…
[1701.04099] Field-aware Factorization Machines in a Real-world Online Advertising System Criteo で Field-aware Factorization Machines を活用している,という話.気になった点をメモしておく. 複数マシンでの推定 Iterative Parameter Mixing を…
[1702.06270] Trajectory Recovery From Ash: User Privacy Is NOT Preserved in Aggregated Mobility Data ユーザのプライバシーなどに考慮し,「誰がいつどこにいたか」という生の位置情報ではなく,「どの領域にいつ何人いたか」という集計情報の公開,共…
日本声優統計学会 サークル「日本声優統計学会」の最後の活動として,読んでくださった方々への恩返しの意味を込め, id:repose と id:MagnesiumRibbon で声優統計コーパスを上記ページにて公開しました. 概要 声優統計コーパスは diphone の出現頻度を考慮…
Factorization Machines で Bayesian Personalized Ranking を用いた implicit feedback の推定を行いたかったけどうまくいかなかった - 糞ネット弁慶 Matrix Factorization で Bayesian Personalized Ranking を用いた implicit feedback の推定はうまくい…
Factorization Machines で Bayesian Personalized Ranking を用いた implicit feedback の推定を行いたかったけどうまくいかなかった - 糞ネット弁慶の続き. 要約 Bayesian Personalized Ranking が諦められない pairwise な loss を考慮した Matrix Facto…
何故上手くいかなかったのか,あとから再現できるよう忘れないために書く. 要約 回帰や分類ではなく, Bayesian Personalized Ranking にもとづく Factorization Machines を試したい 実装はibayer/fastFM を使い,データに MovieLens 100K を選び実験する…
Modeling Consumer Preferences and Price Sensitivities from Large-Scale Grocery Shopping Transaction Logs (WWW 2017) 概要 ある商品の購入数を予測する上で階層構造を導入する.更に値段も重要だからモデルに組み込む. 具体的には が に を 個購入す…
[1512.04912] Portrait of an Online Shopper: Understanding and Predicting Consumer Behavior オンラインでの購買行動に関する様々な分析. 年齢,性別の購買傾向,購買した商品の違い,購買間隔,購買金額の分析,および購買金額,購買間隔の予測. デー…
日本声優統計学会としての九度目,そして最後となるコミケ参加です. 最後と特に明記した記憶は無いのに恐らくお誕生日席です. 「声優統計第九号」内容 前書き (@R_Linux) 声優力:第二の種田梨沙を探せ (@Med_KU) きららフェスタ2016:観客動員数No.1 は誰…
日本声優統計学会としての八度目のコミケ参加です.今年は暑い. 今年は声優島そのものが西ホールに配置されているので注意が必要です. 「声優統計第八号」内容 なれる!声優〜Deep Learning を利用した声質変換〜 (@asteerism) 声優しりとり (@Med_KU) 複…
From Online Behaviors to Offline Retailing オンラインの行動とオフラインの購買を同時に分析する.すなわち,「オフラインの行動とオンラインの行動にはどういう関係があるか」がわかる. また,実験では「直近での検索行動を用いることによりその後の購…
DeepIntent: Learning Attentions for Online Advertising with Recurrent Neural Networks (KDD 2016) 読んだ
DeepIntent: Learning Attentions for Online Advertising with Recurrent Neural Networks入力された検索クエリに対して最も適切な文言の広告を出すタスク. 検索クエリおよび広告を単語の系列データとして, RNN などにもとづく neural network に通して適…
Just One More: Modeling Binge Watching Behavior このタイトルを見るまで "binge-watching" という単語を知らなかった.ある番組などにハマってまとめて見てしまうことらしい. 論文では VOD (Video On Demand) サービス (特にこのサイトは定額見放題では…
http://recruit.ai/event/datascience_update0210.html David M. Blei に Owen Zhang の話が聞けるということで行ってきた. 朝起きた瞬間から嫌な予感はしていたけれど、会場に着いたあたりで頭痛吐き気悪寒脂汗が止まらなくなってしまったため、午前中だけ…
(pdf) 手法 ユーザの評価したアイテム集合にノイズを載せ,それを復元する AutoEncoder (AE) を学習する. その際,入力層にユーザ固有のノードを1つ追加し,その上で全隠れ層に対してユーザノードから(ユーザ固有の)重みを持った枝を張る. これがただのAE…
概要 Modeling Intransitivity in Matchup and Comparison Data (WSDM 2016)(pdf) 二人のプレイヤーが戦い,勝敗が決まるゲームのモデリングにおいては通常,各プレイヤーの強さは一元的である.よって,推定されたモデルでは推移律が成立する(aがbより,bが…
Your Cart tells You: Inferring Demographic Attributes from Purchase Data(pdf) 概要 購買履歴からユーザの属性(年齢,性別,結婚状況,収入,学歴)を同時に推定する. つまり,複数の属性を同時に推定する multi-task multi-class prediction に取り組む…
The Web as a Jungle: Non-Linear Dynamical Systems for Co-evolving Online Activities (pdf)冬コミのモデルに使おうとして読んだ. 概要 Lotka-Volterra の捕食者 - 被食者のモデルを使う. タイムスタンプつきの各キーワードの検索数 (実験では Google T…
日本声優統計学会としての七度目のコミケ参加です.お誕生日席. 「声優統計第七号」内容 結婚したら声優は仕事が減るのか? 〜種田梨沙が結婚したら僕はもう…〜 (@Med_KU) 日本声優統計学会 投稿&査読ガイド 〜声優統計の読み方・書き方〜 (仮題) (@Magnesiu…
先日の大久保瑠美さんのラジオで読まれたメールでも書いたように,9月末で今の職場を退職します. そんなことよりも今は,2015年9月30日で終了する大久保瑠美さんの動画付ラジオ番組「A&G NEXT GENERATION Lady Go!!」の最終回の事を考えたい.