ファイルフォーマット

ファイルフォーマットコンピュータなどの情報機器で利用するファイルの保存形式である。コンピュータで扱う文書音声画像動画などのさまざまなメディアのファイルを特定の利用方法やアプリケーションソフトウェアで共通に扱うための形式や規格のこと。

概要編集

通常「ファイルフォーマット」と呼ばれるが、MS-DOSMicrosoft WindowsUNIXUnix系などのオペレーティングシステムにおけるファイルはストリーミングデータ(データストリーム)形式であり、正確には「各ファイルに格納されたデータのフォーマット」の事である。

通常ファイルに格納されたデータは、テキストまたはバイナリファイルなので、ファイルの内容だけからはそのファイルフォーマットを知ることが困難な場合がある。このため、ファイル名に拡張子をつけて識別したり、ネットワークでの転送時にはMIMEヘッダ(メディアタイプ)等をあわせて送ったり、といった方法が採られる。このようなメタデータを付与する方法はファイルの内容自体に影響を与えず、またファイルを開くことなく種別を判定できる、という利点がある。しかし、拡張子は簡単に、しかも自由に編集できるため、信頼性は極めて低い。またMIMEタイプはIANAによって正式に登録・標準化されていない独自の文字列をアプリケーションやシステムが勝手に付与することもありうる。そのため、多くのファイルフォーマットは、ファイルの先頭にマジックナンバーと呼ばれる、より確実にファイル形式を識別するための情報を付加する。

さまざまなアプリケーションで扱える標準的なフォーマットもあるが、オペレーティングシステムやアプリケーションによりそのデータ形式は様々である。

データの区切りの単位に注目した分類編集

  • bit(ビット)をデータの区切りの単位とするデータ。例:圧縮されたデータ
  • byte(バイト、1byte = 8bit)を単位とするデータ。例:各種アプリケーションのデータファイル
  • 文字を単位とするデータ。例:テキストファイル

テキストもバイナリの一種であるが、実際のビット列はエンコーディング時に採用する文字セットに左右される。テキストのデータストリームをデコードする際のヒントとして、ファイル先頭付近にバイトオーダーマークや文字セット名を記載するフォーマットもある。

各種プログラミング言語ソースファイルも、構造化されたプレーンテキストファイルの一種である。

汎用性に注目した分類編集

標準化されたフォーマット
国際的な機関で制定されたフォーマット。ファイルフォーマットの例としては、JPEG、MPEGなどがある。標準化機関の例としては、国際標準化機構 (ISO)、日本産業規格 (JIS)、World Wide Web Consortium (W3C) などがある。
事実上、業界標準となっているフォーマット
後述する「特定のオペレーティングシステム (OS) やアプリケーションに依存するフォーマット」に含まれるが、広く使用され事実上標準(デファクトスタンダード)となっているもの。例としては、GIFFBXPDF(米Adobe社、後にISO標準化)などがある。
特定のオペレーティングシステム (OS) やアプリケーションに依存するフォーマット
各種OSやアプリケーションのデータファイル。例としては、BMP、RTF(Microsoft Windows)など多数ある。

よく知られたファイルフォーマット一覧編集

テキスト、ハイパーテキスト、ドキュメント編集

オフィススイート 用のフォーマット編集

主なオフィススイート用のフォーマットには以下がある。

データ記述フォーマット編集

画像・図形編集

ラスターイメージ編集

ベクターイメージ編集

音声編集

楽曲編集

動画編集

時間軸を持つもの編集

  • アニメーションGIF
  • MNG (Multiple-image Network Graphics)
  • SWF (Macromedia Shockwave Flash)
  • SMIL (Synchronized Multimedia Integration Language)

ファイルアーカイブ(圧縮など)編集

オブジェクトファイル編集

通信関連編集

その他編集

  • EDIF (Electronic Design Interchange Format) - 電子設計データ

ファイルフォーマットと関連づけ編集

特定のファイルフォーマットと、それを開くアプリケーションソフトウェアを登録しておき、操作を行いたいファイルを選択した際にアプリケーションソフトウェアを選ぶ手間を省くための動作を関連づけ (association) という。関連づける手法はオペレーティングシステムなどの環境により異なる。例えばWindowsOS/2では拡張子によって対応するアプリケーションを選択する(Windowsではレジストリに登録する。OS/2ではWPSの.INIファイルに情報が格納される)。

Mac OSでは、ファイルのメタデータとしてクリエータとタイプというデータがある。ファイルシステムのHFSHFS+、ファイル転送プロトコルのAFPではこれらは保持されるが、FTPHTTP、電子メール等を介してファイルをやりとりする場合は、クリエータとタイプを保持するフォーマット(MacバイナリAppleSingleAppleDoubleBinHex等)に変換するか、Mac OS用のアーカイブフォーマット(StuffItMacLHA等)を用いる必要がある。 macOSではクリエータとタイプがあればそれを優先するが、なければ拡張子による対応づけが利用される。

関連項目編集

外部リンク編集