削除された内容 追加された内容
174.255.0.238 (会話) による ID:74419210 の版を取り消し
タグ: 取り消し モバイル編集 モバイルウェブ編集 改良版モバイル編集
編集の要約なし
8行目:
{{lang|en|ASCII}}は[[国際標準化機構|ISO]]標準7[[ビット]]文字コード[[ISO/IEC 646]]の元となり、後に8ビット文字コードである[[ISO/IEC 8859]]が主流となって以降、世界中で使用されている様々な文字の[[符号化方式]]の多くは、{{lang|en|ASCII}}で使用されていない128番以降の部分に、その他の文字を割り当てたものである。
 
他の文字コードと同じく、{{lang|en|ASCII}}は[[整数]]で表されるデジタルデータと[[文字集合]]とが対応づけられた[[符号|コード]]である。このコードに従い、文字等を整数に変換することで、通信、文字情報の処理や保存を行うのが容易になる。{{lang|en|ASCII}}や{{lang|en|ASCII}}互換コードは、ほとんど全ての[[コンピュータ]](特に[[パーソナルコンピュータ]]や[[ワークステーション]])で扱うこと出来できる。{{lang|en|[[Multipurpose Internet Mail Extensions|MIME]]}}では、「<code>US-ASCII</code>」とするのが望ましい。
 
{{lang|en|ASCII}}は7ビットコードである。つまり、情報を表すのに7桁の2進数(10進数では0〜127)を用いる。{{lang|en|ASCII}}が規格化された頃ですら、ほとんどのコンピュータの扱う最少単位の[[バイト (情報)|バイト]]は8ビットである[[8ビット|オクテット]]であった。そのため8ビット目は通信におけるエラーチェック用の[[パリティ]]ビットとして用いられていた。21世紀初頭においても、互換性を維持する目的で、7ビットコードが正式で、8ビット目は使用できない規格がいくつか存在する。
 
{{lang|en|ASCII}}は[[テキスト]]の文書構造や見た目に関する情報を(基本的に文字コードとしては)持たない(垂直タブや改頁はそういったものの一種と考えられなくもないが、「制御コード」となっている)。そのような情報は[[マークアップ言語]]などを使用することで補うことが出来できる。
 
<!-- 日本で使われている同じ[[ISO/IEC 646]]ファミリーの[[JIS X 0201]]は、92番の文字に「[[バックスラッシュ]]」('{{lang|en|\backslash}}')の替わりに「円記号」('¥')が、126番に「チルダ」('~')の替わりに「オーバーライン」('‾')が割り当てられている。 -->
ASCIIの構成は次のようになっている。
{|class=wikitable
33行目:
{{lang|en|ASCII}} 127(全てのビットがオン、つまり、2進数で1111111)は、{{lang|en|delete}}([[削除文字]]) として知られる制御文字である。この記号が現れた場合、その部分のデータが消去されていることを示す。この制御文字だけ先頭部分になく最後にある理由は、[[紙テープ|パンチテープ]]への記録は上書きが出来ないため、削除する際には全てに穴を空けることで対応できるというところからきている(1111111は全てに穴の開いた状態を示す)。また、{{lang|en|ASCII}} 0(全てのビットがオフ、つまり2進数で0000000)は {{lang|en|Null}} あるいは[[ヌル文字]]と呼ばれ、{{lang|en|delete}} と同様に多くのコンピュータシステムでは無視される。これは、仮にパンチテープと反対に1を0に変えることでデータを記録し、かつ上書きが不可能な媒体が存在する場合でも対応できるようにしているのである。
 
コードの多くは、データ転送プロトコルで用いられる。(例:ヘッディング開始、テキスト開始、テキスト終了など
 
セパレータは[[磁気テープ]]への保存のために設計された。
 
{{lang|en|XON}} や {{lang|en|XOFF}} は、プリンタのような処理の遅いデバイスにおいて、データを失うことがないように情報の流れを制御するために用いることがある。
 
{|class=wikitable style=text-align:center
147行目:
== ASCII印字可能文字 ==
ASCII 32は、空白文字である。キーボードのスペースキーから入力でき、語と語の間に空白を表示する。
ASCII 33{{~}}126は印刷可能な文字(printable characters)(printable characters) であり、半角英数の数字、句読点や記号を表す。若い順から[[エクスクラメーションマーク]]、[[ダブルクオーテーション]]・・・、…と続き、ラテン文字大文字の前に数字と大半の半角[[約物]]、大文字と小文字の間、ラテン文字小文字の後にも数種類の半角約物が割り当てられている。
 
下の図では、16進数・10進数・8進数の順でASCIIコードの値を示す。
265行目:
|}
 
大文字のASCII値に32を加えると小文字に変換することが出来できる。この変換は、2進法では、6ビット目に1をセットするだけでよい。また、数字から48を減じれば、対応する値が得られる。この変換は、5ビット目及び6ビット目に0をセットするか、あるいは単純に上位4ビットを無視するだけでもよい。なお、印字可能文字のうち「@」から始まる32文字については、ASCII値を64減じて対応する制御文字を求め、この制御文字を「コントロール+」({{lang-en-short|control+}})という前置表現を付けた印字可能文字で表記する慣習がある。
 
{{Indent|例:BELコード(07) →「コントロール+G」(受信した側の機器で注意喚起音が鳴る)}}
271行目:
この制御文字の表記方法は、キーボード上の印字可能文字キーを制御文字の送出に用いていた機器の名残りであると考えられる(7ビット目を0にセットする専用キー([[Ctrlキー]])を、印字可能文字キーと同時に押して制御文字を送出)。
 
{{要出典範囲|date=2020-01|また,Unix、Unix 端末では <tt/code>{{keypress|Ctrl+|数字</tt>}} によって、人間工学的に押下しづらい制御文字を送出できる。[[キャレット記法]]を用いると、具体的には以下であることが多い。}}
* {{keypress|Ctrl|2}} が <code>^@</code>
<blockquote>
* {{keypress|Ctrl|3}} が <code>^[</code>
^2 が ^@,^3 が ^[,^4 が ^\,^5 が ^],^6 が ^^,^7 が ^_,^8 が ^?
* {{keypress|Ctrl|4}} が <code>^\</code>
</blockquote>
* {{keypress|Ctrl|5}} が <code>^]</code>
であることが多い。
* {{keypress|Ctrl|6}} が <code>^^</code>
* {{keypress|Ctrl|7}} が <code>^_</code>
* {{keypress|Ctrl|8}} が <code>^?</code>
 
==参考文献==