Wikipedia‐ノート:短いページ/SQL

最新のコメント:16 年前 | トピック:ORDER BY | 投稿者:Tatsujin28

重箱の隅。Where節が<と>になっているので閾値に乗っているValueが出てこないと思われます。それとも別の意図があるのかな?--こいつぅ 2006年5月15日 (月) 18:15 (UTC)返信

すいません、実働してるスクリプトは>=(だったかな?)になおしていました。どっちの=だったかはHDDクラッシュしてしまったのでわかりません(泣)。たぶん、以上&未満にしていたと思います。--Suisui 2006年5月16日 (火) 02:56 (UTC)返信
了解です。以後、以上&未満で統一することにしましょう。--こいつぅ 2006年5月17日 (水) 12:43 (UTC)返信

loop 編集

こんな感じでループさせています。--こいつぅ 2006年7月24日 (月) 17:42 (UTC)返信

shortpages
-----
#!/usr/bin/env perl
my @size = qw(384 512 640 704 768 832 896 960 1024 1056
	      1088 1120 1152 1184 1216 1248);
my $start = $ARGV[0] || 0;
foreach ($start .. $#size - 1) {
    print qq|SELECT CONCAT('* ',page_title,'')
 FROM page,revision,text WHERE page.page_namespace=0
 AND page.page_is_redirect=0 AND page.page_len >= $size[$_]
 AND page.page_len < $size[$_ + 1]
 AND page.page_latest = revision.rev_id
 AND page.page_title NOT LIKE \"%/履歴\"
 AND revision.rev_id = text.old_id
 AND text.old_text NOT LIKE '%imai%'
 AND text.old_text NOT LIKE '%isambig%'
 AND text.old_text NOT LIKE '%dab%'
 AND text.old_text NOT LIKE '%Dab%'
 ORDER BY page.page_len INTO OUTFILE 'under$size[$_ + 1]bytes.txt';
|;
}
$ ./shortpages | mysql -u root -p  wikidb

ORDER BY 編集

同じような記事名を持つ記事を把握し易くするため、SQLの ORDER BY を変更して記事名の順にしました。--Tatsujin28 2008年4月5日 (土) 12:45 (UTC)返信

プロジェクトページ「短いページ/SQL」に戻る。