Wikipedia:井戸端/subj/スカラーペディアにリンクを貼る bot は作成可能?

スカラーペディアにリンクを貼る bot は作成可能? 編集

bot の作成依頼に出す前にここで質問させて下さい。

非常に信頼性の高い情報源であるスカラーペディアに、自動でリンクを貼るような bot は (技術的に、方針的に) 作成可能でしょうか?

具体的には以下のような動作をする bot になると思います。

  • 言語間リンクをつかって項目の英語訳を取得。
  • スカラーペディアに記事があれば、外部リンクにTemplate:Spediaの貼り付け。

このようなbotは作成可能なのか、教えて頂ければ幸いです--Choms 2009年7月29日 (水) 09:59 (UTC)[返信]

単にリンクを貼るだけであれば BOT でも可能ですが、正確性を確保するのであれば処理の流れとして次の様なステップになるでしょう。
  1. (処理対象ページの一覧があればそれを元に、無ければ全のページを対象に) BOT で、スカラーペディアへのページと思われるリンクの一覧を生成する。
  2. スカラーペディアへのリンクが正しいか検証する。
    例えば、サザエさんに言語間リンク en:Sazae-san が有りますが、スカラーペディアにSazae-san は有りませんので対象外にする必要があります。
  3. 検証結果を元に BOT で各ページにテンプレートを追加する。
このうち、2 は BOT では出来ませんので、Chomsさんか又は他の方にやって頂くことになります。--Lemonsquash 2009年7月30日 (木) 03:02 (UTC)[返信]
早速のご回答ありがとうございます。
>このうち、2 は BOT では出来ませんので、Chomsさんか又は他の方にやって頂くことになります。
(例えば、Sazae-sanの容量がほげほげバイト以下か否かや、"There is currently no text in this page"という文字列があるか否かなどによって) スカラーペディアの記事が存在するか否かを判定するように bot を作成することは不可能なのでしょうか? 私にはプログラミングの知識があまりないため、申し訳ありませんがご教授いただければ幸いです。
また私としては、言語間リンクを貼る bot などのように、wikipedia 内の全ての記事を対象にリンクを貼る bot をイメージしています。そのため、貼り付け対象の記事にスカラーペディアへのリンクが既に貼られていないかを判定することも必要であると考えます。このような作業が bot に可能かどうか。また、このような作業を行って良いのかどうかをお教え頂けますと幸いです。--Choms 2009年7月30日 (木) 04:00 (UTC)[返信]
外部サイトとの連携は、やってやれないことは無いですが、基本的に「やってはいけない」ことになっています (→ m:Bot policy/ja#許されない使い方)。 個人的な本音を言えば、面倒なのでやりたくないです。
どのページにどのリンクを追加するのかの一覧を提出して頂ければ、すぐにでも BOT で処理できます。
また、幾つかのページを確認してみましたが、ページ名が異なるページが散見されます。
  1. 日本語版 Wikipedia:Standard ML
  2. 日本語版 Wikipedia: 心筋
これらの関連付けは BOT では不可能ですので、リストアップはマニュアルでやられた方がよいと思います。まあ、リストアップの作業段階で直接編集すれば、BOT を使用するまでも無いかもしれませんが。 --Lemonsquash 2009年7月31日 (金) 02:10 (UTC)[返信]
m:Bot policy/ja#許されない使い方を読ませて頂きました。スカラーペディアから情報を取得しての作業というのは難しいようですね。ただ私としましては、リンクの貼り付け作業よりもリストアップの作業こそ、もっとも自動化したい所であったりします。親切に答えて下さる方にしつこく質問して大変申し訳ないのですが、以下のような方式であればいかがでしょうか?
  1. スカラーペディアへのリンクがない日本語版の記事を選び、言語間リンクを辿る
  2. 諸外国語版の wikipedia をチェックしてそこにスカラーペディアへのリンクがあれば情報を取得
  3. リンクを生成して日本語版の記事に貼り付け
こちらの方式であれば、bot の作業は wikipedia 内で閉じていますし、上の例のStandard MLにもリンクを貼ることが可能です。心筋にリンクを貼ることはできませんが、(ConsciousnessModels of consciousnessのように) スカラーペディアでは実物に関する記事とモデルに関する記事が独立していることもあるようなので、実物に関する記事が出来るまではリンクを貼らない仕様の方がむしろ良いのかもしれません。もしよろしければご意見をお聞かせ下さい。--Choms 2009年7月31日 (金) 07:27 (UTC)[返信]
面白いアイデアですね。それが出来ればとても早いものとなると思います。ただ僕はスカラーぺディアへのリンクは、手作業の方がいいんじゃないかな、と思ってます。というのは上で話されてるように、内容の確認がある程度必要なことと、あとそれほど記事数が多くないことです。とりあえず数字で見ますと、現在、スカラーぺディアでは記事が約600本あり[1]、そして、ウィキペディア日本語版の、約150ほどの記事から、すでにスカラーぺディアへのリンクが貼られています[2](英語版は約240記事になります[3])。日本語版でリンクされてない残りの450記事のほとんどは、おそらくウィキペディアに対応記事がないものです(私がザッと見てきた範囲で)。僕自身は時々 Recent changes なんかを見て気づいたら時々追加してますが、それで何とかついていけるんではないかな、と考えてます。
付記:これはスカラーぺディアの話ではないですが、リンクとbotについては、上でChomsさんが言われてるような方法でないと、うまくいかない分野、つまり人力では絶対に対応が不可能だと思われる分野もあります。たとえば自治体の統計情報のアップデート、また化学・生物学関係のデータ類の付加、などはそうした例ではないかと思います。自治体は(記事になってるものだけでも)数万以上あるでしょうし、化学物質に関してはCASナンバーを振られている物質で4000万だか5000万だかあるようで、その中でもたとえば人のたんぱく質だけでも1万とか2万になります。生物の種は100万以上とか言われてます。こうしたものは、作業のどこかの部分をある程度自動化していかないと難しい所があると思います。以前にこの井戸端にポストされた情報として、フィンランドでのプロジェクトで自治体の人口データなどをbotで更新していこう、というものがありました(Wikipedia:井戸端/subj/フィンランド自治体の自動更新テンプレート)。そういう可能性、というのはまだ色々あるのかな、と思います。--was a bee 2009年8月7日 (金) 18:55 (UTC)[返信]