「ノート:UTF-8」の版間の差分

削除された内容 追加された内容
47行目:
: ''「BOMがないとUTF-8と判別できないプログラムが多いかどうか」'' について。
:* 「多い」という表現を「過半数である」という意味で使うのは明確に誤りです。そもそも集計対象とする母集団がどのくらい大きいのか分からないのですから。
:* 一方で、テキストファイルの読み書きでは、BOMをつけると誤動作するアプリ、逆にBOMがない場合にはShift_JIS として解釈しようとするアプリのどちらもあります。これは既に記事中に記載されていますね。
:* 一方で、「少なからず存在する」という主張は真です。WindowsなどではShift_JISとUTF-8のテキストファイルが混在する作業環境が当たり前のように存在して、その両者の自動判別をしたいという場面が当然のように存在します。MacOSでもまだまだあるでしょうね。そういう環境では「先頭にBOMがついていればUTF-8とみなし、ついていなければShift_JIS(あるいは他国ではISO-8859等)とみなす」という逃げの実装をしているアプリもよくあります。私がすぐ思いつく限りでは
: ↑最初の文面から少々差し替えました。
:** Windows付属のNotepad、Microsoft Officeなどでテキストデータを読み書きする場合
:** AutoHotkeyのスクリプト
:** 秀丸エディタのマクロ
::がそういう実装になっています。AutoHotkeyと秀丸は公式ヘルプを出典として提示できますし、NotepadやOfficeについては出典なしで事実だけを記載しても検証可能性の問題は生じないと思います。
:* 一方で、BOMをつけてしまうと困るケースも多数あります。私の知っている限りでは <code>#!</code> でインタプリタを指定するタイプのスクリプトが典型例ですし(これはUNIX系環境のみならず、Windows+Apache+Perlなども当てはまります)、C言語などのソースコードでもコンパイラにBOMの除去処理が組み込まれていなければ同様の結果になるでしょう。
: なので、少なくともこの2パターンについてはきちんと例示コミで盛り込む必要があると思います。
 
: ''「通常のUTF-8の方が信頼性が高く推奨されるべきです。」''
: これを主張するためには「信頼性が高い」という単語自体の定義から始めて、次に、その定義による「信頼度」の定量的測定手順を設定しないといけませんよ。そして、BOMあり・なしのどちらを選べば信頼度100%が達成できるかというと、答えは「どちらでも永久に不可能」という答えにならざるを得ませんです。従って、この主張は本文に入れるべきではないと考えます。
: --[[利用者:Delmonta iijima|Delmonta_Iijima]]([[利用者‐会話:Delmonta iijima|会話]]) 2019年1月17日 (木) 06:0614 (UTC)
 
== 2010年6月5日 (土) 14:30 (UTC) の編集について ==
ページ「UTF-8」に戻る。