ファイルフォーマット

コンピューターなどで利用するファイルの保存形式
ファイル形式から転送)

ファイルフォーマット: file formatファイル形式)は情報をファイルへ収納する形式である[1]

概要 編集

コンピュータにおいてメディア文書音声画像動画)やプログラムファイルとして保存される。統一された順序・構造でこれらの情報がファイルとして保存されていれば、OSアプリケーションは一貫した方法でファイルにアクセスし情報を利用できる。これを可能にする、ファイルへの情報格納規格がファイルフォーマット(ファイル形式)である。

通常「ファイルフォーマット」と呼ばれるが、MS-DOSMicrosoft WindowsUNIXUnix系などのオペレーティングシステムにおけるファイルはストリーミングデータ(データストリーム)形式であり、正確には「各ファイルに格納されたデータのフォーマット」の事である。

通常ファイルに格納されたデータは、テキストまたはバイナリファイルなので、ファイルの内容だけからはそのファイルフォーマットを知ることが困難な場合がある。このため、ファイル名に拡張子をつけて識別したり、ネットワークでの転送時にはMIMEヘッダ(メディアタイプ)等をあわせて送ったり、といった方法が採られる。このようなメタデータを付与する方法はファイルの内容自体に影響を与えず、またファイルを開くことなく種別を判定できる、という利点がある。しかし、拡張子は簡単に、しかも自由に編集できるため、信頼性は極めて低い。またMIMEタイプはIANAによって正式に登録・標準化されていない独自の文字列をアプリケーションやシステムが勝手に付与することもありうる。そのため、多くのファイルフォーマットは、ファイルの先頭にマジックナンバーと呼ばれる、より確実にファイル形式を識別するための情報を付加する。

さまざまなアプリケーションで扱える標準的なフォーマットもあるが、オペレーティングシステムやアプリケーションによりそのデータ形式は様々である。特定のアプリケーションで扱えるデータ形式に変換するためのファイルコンバータを利用できることがある。

データの区切りの単位に注目した分類 編集

  • bit(ビット)をデータの区切りの単位とするデータ。例:圧縮されたデータ
  • byte(バイト、1byte = 8bit)を単位とするデータ。例:各種アプリケーションのデータファイル
  • 文字を単位とするデータ。例:テキストファイル

テキストもバイナリの一種であるが、実際のビット列はエンコーディング時に採用する文字セットに左右される。テキストのデータストリームをデコードする際のヒントとして、ファイル先頭付近にバイト順マークや文字セット名を記載するフォーマットもある。

各種プログラミング言語ソースファイルも、構造化されたプレーンテキストファイルの一種である。

汎用性に注目した分類 編集

標準化されたフォーマット
国際的な機関で制定されたフォーマット。ファイルフォーマットの例としては、JPEG、MPEGなどがある。標準化機関の例としては、国際標準化機構 (ISO)、日本産業規格 (JIS)、World Wide Web Consortium (W3C) などがある。
事実上、業界標準となっているフォーマット
後述する「特定のオペレーティングシステム (OS) やアプリケーションに依存するフォーマット」に含まれるが、広く使用され事実上標準(デファクトスタンダード)となっているもの。例としては、GIFFBXPDF(米Adobe社、後にISO標準化)などがある。
特定のオペレーティングシステム (OS) やアプリケーションに依存するフォーマット
各種OSやアプリケーションのデータファイル。例としては、BMP、RTF(Microsoft Windows)など多数ある。

よく知られたファイルフォーマット一覧 編集

テキスト、ハイパーテキスト、ドキュメント 編集

オフィススイート 用のフォーマット 編集

主なオフィススイート用のフォーマットには以下がある。

データ記述フォーマット 編集

画像・図形 編集

3D 編集

ラスターイメージ 編集

ベクターイメージ 編集

音声 編集

楽曲 編集

動画 編集

時間軸を持つもの 編集

  • アニメーションGIF
  • MNG (Multiple-image Network Graphics)
  • SWF (Macromedia Shockwave Flash)
  • SMIL (Synchronized Multimedia Integration Language)

ファイルアーカイブ(圧縮など) 編集

オブジェクトファイル 編集

通信関連 編集

その他 編集

  • EDIF (Electronic Design Interchange Format) - 電子設計データ

ファイルフォーマットと関連づけ 編集

特定のファイルフォーマットと、それを開くアプリケーションソフトウェアを登録しておき、操作を行いたいファイルを選択した際にアプリケーションソフトウェアを選ぶ手間を省くための動作を関連づけ (association) という。関連づける手法はオペレーティングシステムなどの環境により異なる。例えばWindowsOS/2では拡張子によって対応するアプリケーションを選択する(Windowsではレジストリに登録する。OS/2ではWPSの.INIファイルに情報が格納される)。

Mac OSでは、ファイルのメタデータとしてクリエータとタイプというデータがある。ファイルシステムのHFSHFS+、ファイル転送プロトコルのAFPではこれらは保持されるが、FTPHTTP、電子メール等を介してファイルをやりとりする場合は、クリエータとタイプを保持するフォーマット(MacバイナリAppleSingleAppleDoubleBinHex等)に変換するか、Mac OS用のアーカイブフォーマット(StuffItMacLHA等)を用いる必要がある。 macOSではクリエータとタイプがあればそれを優先するが、なければ拡張子による対応づけが利用される。

脚注 編集

  1. ^ "ファイルは、その中身が意味する内容や目的によって、情報の記録の仕方が変わります。これを「ファイルフォーマット」(file format) と言います。" ファイルとディレクトリの概念. 京都産業大学 - コンピュータ・リテラシ. 2022-12-27閲覧.

関連項目 編集

外部リンク 編集