各言語版における登録ユーザとIPユーザの割合

ウィキペディア 多言語統計で記事の多い上位10言語のウィキペディアで、登録ユーザ、IPユーザそれぞれによる編集回数の比率を調べてみました。

元データ

利用したデータはWikimedia Downloadsで12月3日現在取得可能な中で最新のものを使用しました。具体的には、enとdeに関しては10月時点のダンプ、その他の言語は11月時点のダンプを用いました。

計測方法

各言語版の??wiki-**-stub-meta-history.xml.gz内の"contributor"要素内に含まれる"id"要素および"ip"要素を数え、"id"要素の個数を登録ユーザ、"ip"要素の数をIPユーザとしました。"ip"要素に数えられたものの中には、そのIPアドレスが"Template namespace initialisation script"と書かれた特殊なもの*1が若干(<0.1%)含まれるため、IPユーザは実際より若干多くカウントされた可能性があります。

結果

この画像にはGNU Free Documentation Licenseを適用します。

この結果、jaにおけるIPユーザの割合は約43%で、他言語版の12%(nl)〜27%(es)に比べると頭一つ多いですね。

元の数値も下に示します。

言語 IPユーザの編集回数 登録ユーザの編集回数
de 8244621 26010135
en 38371444 114584478
es 3195287 8803408
fr 3253713 17917998
it 1561106 9575587
ja 6652768 8962193
nl 1093685 8325522
pl 1646183 7864717
pt 1565668 6145081
sv 901692 4288209

enの編集回数が桁外れに多いですね。他の言語版の記事数に対する比率を大きく越えてるのはなぜ?

*1:MediaWiki側の都合かな?