プロジェクト‐ノート:Bot/データベースダンプ

データベースダンプ 編集

ここには、データベースダンプを活用するための資源や情報を書き連ねていきます。見つけたら片っ端から追加していって、まとまったら技術文書にしちゃいましょう。

import xmlreader

for entry in xmlreader.XmlDump("jawiki-latest-stub-articles.xml").parse():
    print entry.title

標準名前空間すべてを対象に文字列置換を実施 編集

pywikipediaのreplace.pyの「-xml」オプションでXMLダンプデータファイルを指定することで、標準名前空間すべてを対象に文字列置換を実施することもできる。

python replace.py -xml:jawiki-20100317-pages-articles.xml -namespace:0 "[[ドラえもんの道具 (" "[[ドラえもんのひみつ道具 ("

データベースダンプ活用例 編集

ページ「Bot/データベースダンプ」に戻る。