糞糞糞ネット弁慶

読んだ論文についてメモを書きます.趣味の話は http://repose.hatenablog.com

2012-01-01から1年間の記事一覧

「声優統計 第一号」完売しました

増やしましたが12時には完売しました.お誕生日席だったのが幸いしたと思います. 買って下さった皆様ありがとうございました.在庫が尽きてしまい申し訳ありませんでした.pdf公開やダウンロード販売は考えていないので,夏コミ通ったら追加で刷る. 「これ…

2012年振り返った

関連: 2011年を振り返る - 糞ネット弁慶 東日本大震災ビッグデータワークショップ Project 311に「野良分析チーム」として参加した - 糞ネット弁慶 冬のコミックマーケット(C83)一日目で「声優統計 第一号」を出します - 糞ネット弁慶 去年と同様に,色々や…

冬のコミックマーケット(C83)一日目で「声優統計 第一号」を出します

29日土曜日,東テ15-b,声優島の真っ只中にてサークル「日本声優統計学会」名義で「声優統計 第一号」を出します.DTPができる人間がいないのでコピー本です. 内容は次のようなものです. 声優統計入門 (@R_Linux) 声優統計とはそもそも何なのか,何が目的…

サークル「日本声優統計学会」で冬コミ当選しました

29日,東テ15-bにて,「声優統計 第一号」を出す予定です.

節操の無いクソイナゴ野郎なのでdeep learningで使われるautoencoder実装した

身内でdeep learningの勉強会をやったらできそうだったので実装した. 読んだのは大体ここらへん. NEURAL NETS FOR VISION(CVPR2012 tutorial) CS294A Lecture notes Sparse autoencoder ImageNet Classification with Deep Convolutional Neural Networks …

Ameblo/Livedoor/excite/yaplog のブログクローラ書いた

ブログ記事を収集する必要が生じてクローラ書いた. 最初は wget -a ./wget.log -w 30 -r -np -m -k -erobots=off -np blog_url とかやってたけど月別一覧やカテゴリ一覧,モバイル版URLを開こうとしてかなり重複してしまい一向に終わらないので,主要なブロ…

東日本大震災ビッグデータワークショップ Project 311に「野良分析チーム」として参加した

概要 当時をデータで振り返った時に、本当に必要なサービスは何だったのか、次の災害に備えるために、今我々はどんな準備をすればよいのでしょうか? 「東日本大震災ビッグデータワークショップ - Project 311 -」 では震災発生から1週間の間に実際に発生し…

Geographical Topic Discovery and Comparison(WWW 2011) 読んだ

Geographical Topic Discovery and Comparison(pdf) 概要 入力がみたいな感じで文書と位置情報の対の集合の時に空間的なトピックを抽出する.もっと言うと単語分布及び場所におけるトピックの分布が欲しい. 東日本大震災ビッグデータワークショップで位置情…

アニソンの歌詞から作詞家を推定する問題としてのベンチマークをやってみる

目的 とりあえずどれぐらいでできるものかベンチマークとしてやってみる. 既存 ナイーブベイズ分類器の実装とか 〜畑さん/こだまさん問題〜 - naoya_t@hatenablog ナイーブベイズ分類器の実装とか(その2)〜新アルバムの楽曲で畑さん/こだまさん分類器を…

"Hi, Magic Closet, Tell Me What to Wear!"(ACM MM 2012) 読んだ

Hi, Magic Closet, Tell Me What to Wear!(ACM MM 2012)(pdf) 概要 ウェディングやショッピング,デートなどといったシチュエーション(以下だるいのでoccasionをシチュエーションと訳す)を指定すると最も適した服のコーディネートを,服の写真アルバムやオン…

KDD2012軽くメモ

A Probabilistic Model for Multimodal Hash Function Learning A probabilistic model for multimodal hash function learning 目的 近傍探索を行う際に用いられる Hashing について,Hash Function Learning について複数ジャンルのデータを扱えるようにす…

バラバシの「バースト!」に出てくるeメール/手紙の優先順位モデルを試す

バースト! 人間行動を支配するパターン作者: アルバート=ラズロ・バラバシ,青木薫,青木薫(監訳),塩原通緒出版社/メーカー: NHK出版発売日: 2012/07/25メディア: 単行本購入: 7人 クリック: 253回この商品を含むブログ (18件) を見る奇数章だけ読み始めた.そ…

Tracking Dynamics of Topic Trends Using a Finite Mixture Model(KDD 2004) 読んだ

Tracking dynamics of topic trends using a finite mixture model 概要 タイムスタンプ付きの文書がジャンジャン来る時に文書集合のトレンドを把握する. 課題 リアルタイムなデータに対してトレンドなどを把握したい.その際,次の三つを1つのフレームワー…

過学習の恐怖,またはいかにして私は1分間でランキングを50位も落としたか(要約)

データマイニングのコンペティンションサイトKaggle: Your Home for Data Scienceに投稿された記事であるThe Dangers of Overfitting or How to Drop 50 spots in 1 minute | No Free Hunchの自分用まとめ. 要約 あるコンペにて「勝った!!!!!!!!!…

Mining Contrastive Opinions on Political Texts using Cross-Perspective Topic Model(WSDM 2012) 読んだ & 実装して試した

Mining contrastive opinions on political texts using cross-perspective topic model 概要 複数の立場(perspective)から書かれた文章があった時,論点(topic)ごとに立場の主張をまとめ,それらの主張の違いを定量的に出力する. 例えば,自民党と民主党の…

WSDM2012のトピックモデルっぽい論文サーベイ

Topic Model Survey (wsdm2012) View more presentations from ybenjo Auralist ETF Mining contrastive opinions on political texts using cross-perspective topic model Pairwise cross-domain factor model for heterogeneous transfer ranking Scalabl…

アニメ監督|アニメ制作会社/アニメ作品/出演声優のデータにAuthor-Topic Modelを適用して何らかの関係があるか確かめる

概要 アニメ監督またはアニメ制作会社とアニメ作品,出演声優には何らかのトピック(作品ジャンル)の関係が存在するという仮定に基づきAuthor-Topic Modelを適用する. アルゴリズム Probabilistic Author-Topic Models for Information Discovery(KDD 2004)(…

SIGIR 2012の気になる論文

Papers | SIGIR Portland Oregon 2012 Modeling and Measuring the Impact of Short and Long-Term Behavior on Search Personalization Improving Searcher Models Using Mouse Cursor Activity Personalization of Search Results Using Interaction Behav…

KDD2012で気になる論文

Knowledge Discovery and Data mining 2012のaccepted papers一覧から抜粋. Accepted Papers | KDD 2012 social network絡みの論文が想像以上に多い.2011の時はこんなにソーシャルソーシャルしていなかった気がする.タイトルに異常にデカイ単位が入ってる…

Machine Learning that Matters(ICML 2012) 読んだ

機械学習やってる人は皆読むべきだと思う. Machine Learning that Matters (pdf) 概要 機械学習のトップカンファレンスICMLに数式/アルゴリズム/定理を1つも書かずに通った論文. 機械学習は何のために重要なのか,現実世界との繋がりを失っていないか,あ…

6月2日(土)にWWW2012勉強会は中止になりました

WWW2012勉強会は無期限延期になりました : ATND 直前で申し訳ありませんが都合により中止となりました.

Ready to buy or just browsing?: detecting web searcher goals from interaction data(SIGIR 2010) 読んだ

Ready to buy or just browsing? サーバーサイドでは取れないマウスの動きなどを特徴量にして予測する.タイトルにready to buyとか入ってるけど予測している問題は広告のクリック予測っぽい感じでちょっと辛い感じがあった.

A long-time limit for world subway networks 読んだ

Evolution of subway networks | Journal of The Royal Society Interface wiredの記事を読んで違和感があったので読んだ. 世界の地下鉄網は「同じ形」:ネットワーク分析で判明|WIRED.jp 概要 地下鉄のネットワークを地理条件や歴史条件に依存しない,あ…

Branded with a Scarlet “C”: Cheaters in a Gaming Social Network(WWW 2012) 読んだ

Branded with a scarlet "C" 概要 Steamにおけるチーター(Cheater)についての分析.70万のチーターのうち1万アカウントを調査.主な発見は ソーシャルネットワーク上において,チーターは普通のプレイヤー(fair player)とかなり区別がつきにくい チート行為…

アニメにおける共演関係を用いた声優のブレイク推定

概要 声優の共演関係から声優がいつブレイクしたかを年月の単位で推定した. 結果はここに. データ しょぼいカレンダーをクロールし, アニメタイトル 放映開始年月 出演声優一覧 を取得した. https://github.com/ybenjo/crawl_syobocal/blob/master/src/c…

声優がいつブレイクしたかを特定しようとしている

折角のゴールデンウィークなので,また,堀江由衣のライブに行って感動してしまったので声優統計に取り組んでいる. 参考 2010年 ブレイクした女性声優さん@はてな - エネルギー吸収と発散 声優統計hackathon!!! - 声優統計 かなり適当に計算したのでアル…

コピペ面白post転載ユーザを特定した

折角のゴールデンウィークなので,twitterで他の人の発言をそのままコピペしているユーザを少しずつ特定し始めている.

Predicting Searcher Frustration(SIGIR 2010) 読んだ

Predicting searcher frustration 概要 ユーザは探している情報が見つかれば満足するかもしれないが,しかし,検索過程において苛々するという事は起こりうる事である.よって,検索の過程におけるユーザの苛立ちを予測したい.例えば,苛立ちを予測して検索…

6月2日土曜日にWWW2012勉強会をやる.

場所全く決まってないので定員抑えめ. WWW2012勉強会は無期限延期になりました : ATND

World Wide Web(WWW) 2012勉強会をやりたいので募集する

WWW2012のProceedingsも出たしそろそろ春なのでやりたい. http://www2012.wwwconference.org/proceedings/forms/proceedings.htm 5月半ばを目処に発表者募集.いなかったらクローズドにやる. http://chouseisan.com/schedule/List?h=42c538ae1b966b0447bdd…