糞糞糞ネット弁慶

読んだ論文についてメモを書きます.趣味の話は http://repose.hatenablog.com

Traveling the Silk Road: A Measurement Analysis of a Large Anonymous Online Marketplace (WWW 2013) 読んだ

Traveling the Silk Road: A Measurement Analysis of a Large Anonymous Online Marketplace

概要

売上なんと1170億円。FBIがドラッグのアマゾン「Silk Road」閉鎖、運営者逮捕 | ギズモード・ジャパン
先日FBIの取り締まりによって閉鎖したオンラインマーケットプレイスである silk road の調査論文.タイトルがかっこいい.
WWWはこのような,面白データの分析論文が定期的に出てくる.
クロールしたデータセットも公開されている (Traveling the Silk Road: Datasets).

silk roadの概要

Torでしか接続できないonionドメインを持ち,支払いはbitcoinで行われる完全匿名サイト.

データ収集

クロールしている事が気付かれないように(これはBANされるのを避けるためだけでなく,観測されることによって対象が振る舞いを変える事を防ぐため)クロール開始時刻をランダムにしたりと苦労した.
連番で振られていたユーザや商品のidがMD5ハッシュになったりと,途中でサイト構造が変わったりもしたがどうにか2011年末から2012年までクロールした.

商品に関する話

どんな商品が売れているか

商品カテゴリ別に見ると上位からWeed(大麻),Drugs(薬物全般),Prescription(処方箋,処方薬),Benzosといった感じで基本的に薬物だらけ.基本的にOpiates(阿片)といった強い薬物より,Weedやcannabisといった弱い薬物が好まれている.

商品の寿命

商品がサイトに現れてから消えるまでの時間(生存時間)をKaplan-Meierで推定.半数の商品が3週間で,25%の商品が3日でサイトから消えることが分かる.

どんな人が売っているか?

売り手の数

月50人ペースでどんどん増えてる.でもこれはユニークidが増えているだけ.売り手が取引をしなくなるまでの時間をKaplan-Meierで推定すると半数の売り手は100日ぐらいで取引しなくなる.112人のヘビーユーザは観測期間中ずっと取引していた.

地理的特徴

商品の発送元が多い順に見るとアメリカ,イギリス,オランダ,カナダ.
発送先で可能な地域の上位は世界中どこでも,アメリカ,EU,カナダ,イギリス.「世界中どこでも」というのは少し意外.というのも,売り手は薬物をどこにでも送ろうとは思わないのではないだろうか?これにはいくつかの理由(量が少ないから送ってもばれない,それっぽい包装で送るからばれないなど)がある.

評価とか

5段階評価で5が多いけどそもそもこの指標があまり参考にならない.

Silk roadの市場構造

インフレについて

silk roadで用いられている通貨はbitcoin.1BTCあたりの主要通貨とのレートを見ると,どんどんインフレしていることがわかる.
そのグラフを人気商品との価格比で見てみると,bitcoinレベルでは変動が激しい.ドル換算では,4月20日マリファナデーや,大口バイヤーの夜逃げなどによる小規模な変動はあるものの,安定している事がわかる.

取引量

擬似的にfeedback(出品者に対する購買者のレビュー)の数で推定.

運営者の懐に入る手数料

推定によると,月92000ドルぐらいは手数料として受け取ってるっぽい.

bitcoin全体におけるsilk roadが占める割合

全bitcoinにおける4.5-9%が silk road で利用されている.

その他

研究に対する倫理的な側面
  • クロール・発表することの是非
    • サイト自体はpublicなものだし,不正アクセスしたわけでもない.クロールのためCookieは使いまわしたけどそれだって運営がCookieのexpireを短くすれば対処できる話.
  • 再現性
  • クロールするときにTorに負荷をかけたんじゃないのか
    • 一日800MBぐらいのデータを流しただけだし問題無いのでは
どうsilk road に介入すべきか

ネットワーク(Tor)への攻撃,金融インフラ(Bitcoin)への攻撃,配送システムへの攻撃,laissez-faire(放任),という4つの選択肢がある.