Wikipedia‐ノート:全言語版の統計/2008年-2009年

最新のコメント:15 年前 | トピック:質問 | 投稿者:凹凸

内容について 編集

この統計ページは、各種統計ページの基礎となるもので、全言語版の統計 - 記事数の推移日本語版の統計は、このページのデータを流用しています。また、それほど多くはありませんが {{ウィキペディア各言語版}} や {{ウィキメディアプロジェクト}} もこの統計データに連動して更新を行います。--氷鷺 2008年8月15日 (金) 15:17 (UTC)返信

項目名 内容について 記述例
順位 純記事数での順位です。同位の場合は同じ数字を振っていますが、並べる順番は「純記事数→総項目数→編集数」としています。なお、metaのページでは No. としており、記事数が同じでも異なる「番号」が振られています。 | 1
言語 日本語表記の言語名です。英語版ウィキペディアのように、その言語のウィキペディアについての記事がある場合は 解説 としてリンクを張っています。 | style="text-align:left;" lang="ja" | [[英語]] - [[英語版ウィキペディア|解説]]
原語表記 / 英語記事 原語表記ですが、リンク先は英語版の(言語の)記事です。これはあまり好ましくないように思いますが、
  • MediaWikiでは原語表記が一般的。
  • 自身の言語の記事が未執筆の言語版が少なくない。また、日本語話者(≒日本人)にとって英語以外の言語はあまり有用ではない。
  • 表の横幅の問題(特に、環境によってはビシュヌプリヤ・マニプリ語の言語表記にかなりの幅を使ってしまうので)

以上の理由により、現在のような仕様になっています。なお、原語表記については {{#language:}} を使用しています。

| style="text-align:left;" | [[:en:English language|{{lang|en|{{#language:en}}}}]]
WP MediaWikiで採用されている言語コードで、リンク先は各言語のウィキペディア(メインページ)です。 | style="text-align:left;" | [[:en:|en]]
純記事数 純記事数です。リンク先は、各言語版の統計ページのソース(HTMLのソースとも、Wiki記法のソースとも異なります)です。 | class="plainlinks" | [{{fullurl:en:Special:Statistics|action=raw}} '''2,485,147''']
総項目数 全名前空間を合わせたページ数です。 | 14,059,583
編集数 全名前空間を合わせた編集回数です。リンク先は、各言語版の統計ページです。 | [[:en:Special:Statistics|241,067,933]]
管理者数 管理者数です。リンク先は、各言語版の管理者リストです。リダイレクトになっているので、修正しようと思っていたのですが、そのままになっています。 | [[:en:Special:Listadmins|1,578]]
登録者数 登録利用者数です。リンク先は、各言語版の登録利用者リストです。 | [[:en:Special:Listusers|7,572,287]]
画像数 画像名前空間にあるファイル数です。リンク先は、各言語版の画像リストです。以前(2007年)は一部の言語版において、この数値がマイナスになっていましたが、現在では直っているようです。 | [[:en:Special:Imagelist|801,003]]
質というよりは「活発さ」の指標と考えた方が良いでしょう。英語では "Depth" といいます。以前は
質 =(編集数÷純記事数)×(記事以外のページ数÷純記事数)
という計算式で定義されていたのですが、metaでは2007年10月下旬頃から、日本語版では(気づくのが)遅れて2008年1月から
質 =(編集数÷総項目数)×(記事以外のページ数÷純記事数)2
という式で算出するようになりました。metaのページ冒頭では "stub ratio"(スタブ率)などという語が用いられていますが、いわゆるスタブとは何ら関係ありません。(実際に計算すれば、あるいはmetaのノートを読めば分かるかと思います)
| 372

--氷鷺 2008年8月15日 (金) 15:17 (UTC)返信

簡単な更新方法 編集

以下は、表計算ソフトとテキストエディタさえあれば出来る、簡単な方法です(私が使用している方法とは異なります)。ただし、言語版の数に増減があった直後(2日から2週間程度)は、s23.orgのスクリプトが新規開設の言語版に対応していないため、使えません。また、それぞれの言語版の間で(データ取得時の)時間差が少し大きくなります(2分程度)。--氷鷺 2008年8月15日 (金) 15:17 (UTC)返信

0. 準備
  1. Microsoft Excelなどの表計算ソフトをお持ちでなければ、OpenOffice.orgをインストールしてください。表計算機能 "Calc" だけで結構です。レジストリに書き込むのが嫌な方はOpenOffice.org Portableを使用すると良いでしょう。
  2. Unicodeや正規表現を扱えるエディタをお持ちでなければ、インストールしてください。個人的には、EmEditor無料版をおすすめします。
1. 更新の前に
  1. Wikimediaウィキの一覧に表示されているウィキペディアの言語数と、m:Wikimedia Newsで告知されている新規開設された言語版(閉鎖の場合は載らないようです)を確認します。更新の直前ではなく、日頃からチェックしておいた方が良いでしょう。
  2. 言語版の増減にs23.orgがまだ対応していない場合は、今回の更新は諦めるか、更新方法B(説明は未執筆です)を使用してください。
  3. 閉鎖された言語版がある場合は、interlangのある記事を確認して、多いようであればBot作業依頼に出してください。
参考までに、2007年1月から2008年8月までの新規開設・閉鎖を挙げておきます。
言語
2007年 3月 ベラルーシ語(タラシケヴィツァ)版(be-x-old)開設
5月 客家語版(hak)開設、 カビル語版(kab)開設
11月 ビコール語版(bcl)開設、 シベリア語版(ru-sib)閉鎖
2008年 1月 クリミア・タタール語版(crh)開設、 ザーターフリジア語版(stq)開設、 下ソルブ語版(dsb)開設
3月 クリンゴン語版(tlh)閉鎖
5月 エストレマドゥーラ語版(ext)開設、 贛語版(gan)開設、 フィジー・ヒンディー語版(hif)開設、 カラカルパク語版(kaa)開設、 モクシャ語版(mdf)開設、 エルジャ語版(myv)開設、 サハ語版(sah)開設、 スラナン語版(srn)開設、 シレジア語版(szl)開設
2. エディタでの整形(1)
  1. s23.orgの統計表(MediaWikiのソース形式)をテキストエディタにコピーします。
  2. 表の間の区切り部分は除去して、全体で一つの表のようにします。
  3. 以下の置換を行います。正規表現を有効にしておいてください。
    1. 空行を除去。「\n\n」→「\n」
    2. 数値中の区切り(半角スペース)をコンマに置換。「([0-9]) ([0-9])」→「\1,\2」
    3. 必須ではないですが、無駄ですし邪魔なので、「plainlinksneverexpand」→「plainlinks」
    4. タブ区切りの表形式に変換。最初に「\n\|-\n\| 」→「\n」 次に「\n\| 」→「\t」
3. 表計算で整形
  1. 表計算ソフトを開き、(2)をコピー&ペースト。また、Wikipedia:全言語版の統計の表部分も同様にタブ区切りに変換してコピーします。
  2. 過去の版のテキスト部分と、最新の統計データをマージします。言語コードでソートして、念のためそれらが一致していることを確認し、再び順位ごとに並び替えれば良いでしょう。
4. エディタでの整形(2)
  1. エディタにコピーして、MediaWikiのソース形式に変換します。まず「\n」→「\n\|-\n\| 」と置換し、次に「\t」→「\n\| 」と置換します。
  2. 言語版の規模ごとに分割、見出しと表の見出しを追加、表の前後の部分を付け加えて更新日時を書き換え、投稿します。要約欄にはs23.orgのデータ取得時刻を明記してください。例:「データ取得時刻 2008年8月15日12:00-12:01(UTC)」

--氷鷺 2008年8月15日 (金) 15:17 (UTC)返信

質問 編集

編集数というのは、削除されたページに対する編集も含むのですか?--凹凸 2009年2月24日 (火) 12:56 (UTC)返信

削除された編集も含まれます。ページを削除する際に編集数が減ることはありませんし、表の一番下、トキポナ版ウィキペディアの統計をご覧になれば、それは分かるかと思います。ただ、(過去に存在した全ての)版の数と編集数が一致しない理由は、よく分かりません。PhaseIII(現在使用されているMediaWiki)に移行する以前の、現在では記録に残っていない初期の編集回数が継承しているのかも知れませんし、あるいは削除や復帰の際になんらかのカウントのずれが起きるのかも知れません。--氷鷺 2009年2月25日 (水) 08:29 (UTC)返信
言われてみればそうですね。有難うございます。ところでどうやって統計をとっているんですか?--凹凸 2009年2月26日 (木) 09:21 (UTC)返信
しつこくすみません。編集数には削除、移動などは記録に入ってませんよね。--凹凸 2009年2月27日 (金) 05:26 (UTC)返信
プロジェクトページ「全言語版の統計/2008年-2009年」に戻る。