パルス符号変調

リニアPCMから転送)

パルス符号変調(パルスふごうへんちょう、PCM英語: pulse code modulation)とは音声などのアナログ信号を、アナログ-デジタル変換回路により、デジタル信号に変換(デジタイズ)する変調方式の一つである。

4ビットPCMにおける信号の標本化と量子化(赤)

概要編集

アナログ信号に対して標本化および量子化を行い、数列として出力する[1]サンプリング周波数が高く量子化ビット数が多いほど高音質(変換前に近い)となる。

種類編集

量子化の方式の違いにより、様々な種類のPCMが存在する。ほとんどの場合、現代に用いられているPCMはサンプリング周波数が一定である。PCMには非圧縮のものと圧縮されたものが存在するが、圧縮されたPCMは音質の劣化を抑えつつデータ量を削減している[注 1]

リニアPCM(線形PCM)
線形量子化を用いたもの。CD-DADVD-Audio、一部のDVD-VideoBD-VideoPlayStation 3用ゲームソフトなどで用いられている。
ADPCM(適応差分PCM)
差分符号化と量子化幅の適応的制御により、品質をあまり落とさずにデータ量を圧縮するPCM。
DPCM(差分PCM)
差分符号化のみを用いて、データ量を圧縮するPCM。
折線量子化を用いたPCM
NTで利用されている。
対数量子化を用いたPCM
DATのLPモードなどで利用されている。
浮動小数を使用して量子化されたPCM
浮動小数点数を用いたPCM。可聴領域を-1.0~1.0と定めているが、その外部領域(-∞~-1.0、1.0~∞)の波形も潰さずに保持することが可能となっている。その為、適切な場所で使用することで、音割れを防ぐことが出来る場合がある

ノイズと歪み編集

変調時、以下のノイズおよび歪みが発生する。

サンプリングノイズ編集

標本化雑音。周波数スペクトルで見るとサンプリング周波数の半分(ナイキスト周波数という)の周波数を折り目にして折り返したように現れることから折り返し雑音ともいう。

標本化定理により、最低でも音声に含まれる最も高い周波数成分の2倍以上のサンプリング周波数を持たない限り、高音の信号が折り返され、偽信号として現れる。このため、サンプリング周波数はより高いほどより高音を再現できる。

また、再生時には同様にして原信号を折り返したような偽信号が発生し、ノイズとなる。オーバーサンプリング方式では、最初に元信号をデジタルフィルタで数倍のサンプリング周波数に変換することで折り返し雑音を高周波数帯域に移動させ、その後にアナログ変換ローパスフィルタ回路による折り返し雑音の除去を行っている。

量子化歪み編集

 
上のグラフは元の信号(青)とそれを量子化した信号(赤)を示している。下のグラフは量子化誤差(2つの信号の差分)を示している。

原理上、量子化によってアナログ量からデジタル値にする際の端数処理による誤差量子化誤差という)のため、歪み(量子化歪み)が発生する。また、これによる雑音を量子化雑音という。これを抑えるためには、量子化ビット数を増やす必要がある。

音割れ編集

録音時など、音量が量子化幅を超えてしまった場合に発生するノイズ。これを防ぐには、音声記録時に音量を下げる必要がある。ただし、量子化幅に対して音量が極端に小さい場合は量子化歪みで波形が潰れてしまうため、適切な音量で記録を行うことが大切である。

音割れを修復する作業をデクリッピングなどと呼ぶ場合があるが、この作業で得られる波形は飽くまで予測によるものであり、本来のものと大きくずれている可能性がある。

用途編集

CD-DA(音楽CD)
コンパクトディスクで採用された。サンプリング周波数44.1kHz、量子化ビット数16bit、2chステレオ。
DVD-Video
非必須。量子化ビット数16/20/24bit、サンプリング周波数は48/96kHzまで対応している。転送レートは最大1.5Mbps、チャンネル数は2chステレオが上限である。そのため、DVDビデオでは多くのソフトが、ドルビーデジタルを用いて5.1chサラウンドに対応している。
DVD-Audio
DVD-Audioは、次世代CD規格の1つ。サンプリング周波数は最大192kHz、量子化24bit。チャンネル数は2chステレオのものが一般的である。
BD-Video (BDMV)
サンプリング周波数は48/96/192kHz、量子化ビット数24bit、チャンネル数は7.1chサラウンド[注 2]が上限だが、2008年現在ではほとんどのソフトウェアが5.1chサラウンドである。最高転送レートは27.4Mbpsで固定式(比較対象としてHD DVDでは5.1chサラウンド、13.5Mbpsが上限)。圧縮を行わない分、可逆圧縮音声であるドルビーTrueHDDTS-HDマスターオーディオと比べて計算(エンコードデコード)は簡単になるが、使用帯域は増えることになる[2][3]。再生には、リニアPCMでのサラウンド出力に対応したBDプレーヤーと再生に対応したAVアンプHDMI端子ケーブルでの接続が必須となる。そのため、DVDプレーヤーで一般的であった光デジタル音声端子ケーブルでのリニアPCM音声出力は、2chステレオまでとなる。なお、PlayStation 3ではシステムソフトウェアバージョン3.30以降に搭載された音声出力設定のビットストリーム(ミックス)機能を使うことにより、リニアPCMで収録されたサラウンド音声をDTS、またはドルビーデジタルのサラウンド音声にダウンコンバートし、これら2規格のうちいずれかが再生可能な機器であれば、光デジタル音声端子ケーブルで接続した機器でもサラウンドを再生させることが可能になっている(一度はDTSないしドルビーデジタルに変換しているため、音質は劣化する)。

ゲームソフト編集

PlayStation 3用ゲームソフト
最高で7.1ch (48kHz/16bit) にまで対応している。最近のPS3用ソフトはリニアPCM5.1chとドルビーデジタル5.1chのサウンドを収録したものが多く、規格上マルチチャンネルサラウンドにおいてはドルビーデジタル5.1chにしか対応していないXbox 360用ソフトに対するアドバンテージとなっている。7.1ch収録のものは特にサウンド面にこだわったソフトの場合が多く、その多くはSCE製品であることが多い。
Xbox 360用ゲームソフト
最高で2chステレオにまで対応している。ドルビーデジタル5.1chでゲームサウンドを収録していないXbox 360用ソフトは、全てリニアPCM2chでのサウンド収録であると推察される。ドルビーデジタル2chである可能性は低い。

IP電話編集

1チャネル当たりの基本速度が64kbpsの場合、24チャネルで1.544Mbpsになる。

PCMプロセッサー編集

アナログビデオテープレコーダーと組み合わせ、音声をデジタル信号で記録する装置。アナログ-デジタル変換回路デジタル-アナログ変換回路を備える。業務用と家庭用の製品が発売され、従来のテープレコーダーを上回る高音質の記録が可能な機器として利用された。

PCM音源編集

PCMデータをDA変換装置によって変換することで音を再生する装置をPCM音源という。サンプラーサンプリング音源と呼ばれることもある。

ソフトウェア技術編集

ソフトウェアミキサー編集

アプリケーションソフト側から見ると、任意の個数・性能の仮想PCM音源を鳴らす形となっていて、それらをPCM再生ハードウェアに向けてミキシングして送り出す機能を持つソフトウエアがあり、ソフトウェアミキサーという。近年CPUの大幅な処理速度向上により、よりリッチな表現が可能になった[注 3]DirectXで音声データに音階を付与する機能、ソフトウェアMIDI音源などはいずれもこの技術によって成り立っている。家庭用ゲーム機でこれを利用しているものの代表として、ゲームボーイアドバンスが挙げられる。一方、これをほとんど利用しないゲーム機にはPlayStation 2などがある。これはPSやPS2において、ハードウェアPCMまたはストリーミング再生というスタイルがほぼ確立しているためである。

非PCM音源によるPCMデータの再生編集

PCM音源を持たないゲーム機では、CPUでサンプリングデータを順次DACに送信してPCMを再生したものがある。ネオジオポケット光速船などが単独でDACを搭載していたほか、メガドライブPCエンジンは音源の一部をDACとして使うことができ、それを使ってPCMを再生していた。

ハードウェア制御を細かに行うことにより、発声が可能なハードウェアをDACに見立て、音声を再生する手法も存在している。ビープ音用のハードウェアでパルス幅変調を行ったり、矩形波の出力をDACに見立てPSGによるPCM再生を行う試み[4][5]や、同様にX68000ではOPMに音色として矩形波を定義し、8チャンネルの出力ポートを利用することで、最大でモノラルでは50kHz前後、ステレオで25kHz前後のサンプリング周波数の再生を可能にしたソフトウェア[6]も存在する。DACとしては非線形指数的の特徴を持つなど、元々想定していないハードウェアであるため、再生の音質は想定した設計のものと比較し、低くなりがちである。

また、波形メモリ音源では、制御する側で1周期ごとに波形を更新してPCMを再生したソフトウェアも存在する。

インターネット編集

マイクロフォンからの入力をDACによりデジタイズしてCPUレジスターやメモリーへ書き込み、時限的なソフトウェア割込などで、ネットワークに流す手法が一般化している。プログラミング言語で比較的容易にコーディングが行え、ビデオ会議アプリケーションやサイマル・ラジオ、サイマル・テレビなどの完成されたアプリケーションを利用することで遅延はあるものの技術的な内容を意識することがなく使われている。

脚注編集

[脚注の使い方]

注釈編集

  1. ^ マスキング効果ともヴェーバー‐フェヒナーの法則とも解釈できる。
  2. ^ 192kHz時のみ5.1chサラウンド。
  3. ^ 2008年現在、環境にもよるがCPU占有率1%未満。

出典編集

  1. ^ 沖村 & 高橋 1991, p. 110.
  2. ^ HDサラウンドサウンド向けのロスレスオーディオ、ドルビーTrueHD”. ドルビーラボラトリーズ. 2013年5月1日時点のオリジナルよりアーカイブ。2021年6月20日閲覧。
  3. ^ “次世代サラウンド規格に完全対応。オンキョーのAVセンターTX-SA805に注目!”. Stereo Sound ONLINE (ステレオサウンド). (2007年5月25日). http://www.stereosound.co.jp/news/article/2007/05/25/1340.html 2021年6月20日閲覧。 
  4. ^ Oh!FM 1990年4月号「しゃべるんどすえ」[要ページ番号]
  5. ^ Oh!X 1995年12月号 BREEZE[要ページ番号]
  6. ^ Oh!X 1999年夏号「内蔵音源を駆使した高品位ステレオ PCM 再生」[要ページ番号]

参考文献編集

  • 沖村, 浩史、高橋, 清『エレクトロニクス概論』裳華房〈機械工学選書〉、1991年。ISBN 4785365072NCID BN07023779

関連項目編集