パルス符号変調

LPCMから転送)

パルス符号変調(パルスふごうへんちょう、PCM英語: pulse code modulation)とは音声などのアナログ信号を、アナログ-デジタル変換回路により、デジタル信号に変換(デジタイズ)する変調方式の一つである。

4ビットPCMによる信号の標本化及び量子化の例。赤い線がアナログ信号であり、青い点が標本化及び量子化後のデータである。

概要

編集

アナログ信号に対して標本化および量子化を行い、数列として出力する[1]サンプリング周波数が高く量子化ビット数が多いほど変換前に近い高品質なデータになるが、データサイズが非常に大きくなるという問題がある。PCMの実用化は古く、1943年から1946年まで運用されたSIGSALYで人類史上初めて実用化された。

種類

編集

量子化の方式の違いにより、様々な種類のPCMが存在する。ほとんどの場合、現代に用いられているPCMはサンプリング周波数が一定である。PCMには非圧縮のものと圧縮されたものが存在するが、圧縮されたPCMは音質の劣化を抑えつつデータ量を削減している[注 1]。圧縮を掛けていないリニアPCMが最もエンコードデコードが簡単であり、回路やソフトウェアに掛かるコストの問題から、通信帯域が狭いあるいは記録容量が少ないなどの場合以外はリニアPCMが採用されることがほとんどである。但し、21世紀に入ってからは、圧縮する場合でも単に量子化の方法を工夫するよりは、MP3AACFLACなど、音声スペクトル分析やチャンネル間相関分析や予測などの様々な技法を駆使するデータ圧縮方式が多くなった。

リニアPCM(線形PCM)
線形量子化を用いたもの。例としては、CD-DADVD-Audio、一部のDVD-VideoBD-VideoPlayStation 3用ゲームソフトなどで採用されている。
ADPCM(適応差分PCM)
差分符号化と量子化幅の適応的制御により、品質をあまり落とさずにデータ量を圧縮するPCM。例としては、1990年代アーケードゲームなどで採用された。
DPCM(差分PCM)
差分符号化のみを用いて、データ量を圧縮するPCM。例としては、ファミリーコンピュータ音源チップの1機能として採用された。
折線量子化を用いたPCM
初期のPCMプロセッサー1977年発売のソニーPCM-1など)やNTで採用されているダイナミックレンジ圧縮のための量子化方式。3折線,5折線など、製品ごとに考慮する折線の本数に差異があり、ダイナミックレンジ伸長後の相当bit数も異なる(考慮する折線の本数が多いほどダイナミックレンジは改善するが、折線が多い分だけコストも高く付く)。
対数量子化を用いたPCM
電話網μ-lawA-law)やDATのLPモードなどで採用されている。デジタル版のコンパンディングである。
浮動小数を使用して量子化されたPCM
浮動小数点数を用いたPCM。可聴領域を-1.0~1.0と定めているが、その外部領域(-∞~-1.0、1.0~∞)の波形も潰さずに保持することが可能となっている。そのため、適切な場所で使用することで、クリッピングノイズ(音割れの一種)を防ぐことができる場合がある。また、非正規化数という例外を除き有効桁数が常に一定であることから、音量の大小で量子化歪みによる潰れ易さが変わらないという利点もある。例えば、メディアプレーヤーの内部処理や、DAWの内部処理と作業途中のプロジェクトファイルではこの形式が採用されることが多い。

ノイズと歪み

編集

変調時、以下のノイズおよび歪みが発生する。

サンプリングノイズ

編集

標本化雑音。周波数スペクトルで見るとサンプリング周波数の半分(ナイキスト周波数という)の周波数を折り目にして折り返したように現れることから折り返し雑音ともいう。

標本化定理により、最低でも音声に含まれる最も高い周波数成分の2倍以上のサンプリング周波数を持たない限り、高音の信号が折り返され、偽信号として現れる。このため、サンプリング周波数はより高いほどより高音を再現できる。

また、再生時には同様にして原信号を折り返したような偽信号が発生し、ノイズとなる。オーバーサンプリング方式では、最初に元信号をデジタルフィルタで数倍のサンプリング周波数に変換することで折り返し雑音を高周波数帯域に移動させ、その後にアナログ変換ローパスフィルタ回路による折り返し雑音の除去を行っている。

量子化歪み

編集
 
上のグラフは元の信号(青)とそれを量子化した信号(赤)を示している。下のグラフは量子化誤差(2つの信号の差分)を示している。

原理上、量子化によってアナログ量からデジタル値にする際の端数処理による誤差量子化誤差という)のため、歪み(量子化歪み)が発生する。また、これによる雑音を量子化雑音という。これを抑えるためには、量子化ビット数を増やす必要がある。

クリッピングノイズ

編集

録音時などに、音量が可聴領域(量子化できる最大音量)を超えてしまった部分の波形が切り落とされる処理(クリッピング)により発生するノイズ。これを防ぐには、音声記録時に音量を下げる必要がある。ただし、可聴領域の幅に対して音量が極端に小さい場合は量子化歪みで波形が潰れてしまうため、適切な音量で記録を行うことが大切である。

音割れを修復する作業をデクリッピングなどと呼ぶ場合があるが、この作業で得られる波形はあくまで予測によるものであり、本来のものと大きくずれている可能性がある。

用途

編集
CD-DA(音楽CD)
コンパクトディスクで採用された。サンプリング周波数44.1kHz、量子化ビット数16bit、2chステレオ。
DVD-Video
非必須。量子化ビット数16/20/24bit、サンプリング周波数は48/96kHzまで対応している。転送レートは最大1.5Mbps、チャンネル数は2chステレオが上限である。そのため、DVDビデオでは多くのソフトが、ドルビーデジタルを用いて5.1chサラウンドに対応している。
DVD-Audio
DVD-Audioは、次世代CD規格の1つであったが、音楽配信が普及した事で既に生産が行われなくなっている。サンプリング周波数は最大192kHz、量子化24bit。チャンネル数は2chステレオのものが一般的である。
BD-Video (BDMV)
サンプリング周波数は48/96/192kHz、量子化ビット数24bit、チャンネル数は7.1chサラウンド[注 2]が上限だが、2008年現在ではほとんどのソフトウェアが5.1chサラウンドである。最高転送レートは27.4Mbpsで固定式(比較対象としてHD DVDでは5.1chサラウンド、13.5Mbpsが上限)。圧縮を行わない分、可逆圧縮音声であるドルビーTrueHDDTS-HDマスターオーディオと比べて計算(エンコードデコード)は簡単になるが、使用帯域は増えることになる[2][3]。再生には、リニアPCMでのサラウンド出力に対応したBDプレーヤーと再生に対応したAVアンプHDMI端子ケーブルでの接続が必須となる。そのため、DVDプレーヤーで一般的であった光デジタル音声端子ケーブルでのリニアPCM音声出力は、2chステレオまでとなる。なお、PlayStation 3ではシステムソフトウェアバージョン3.30以降に搭載された音声出力設定のビットストリーム(ミックス)機能を使うことにより、リニアPCMで収録されたサラウンド音声をDTS、またはドルビーデジタルのサラウンド音声にダウンコンバートし、これら2規格のうちいずれかが再生可能な機器であれば、光デジタル音声端子ケーブルで接続した機器でもサラウンドを再生させることが可能になっている(一度はDTSないしドルビーデジタルに変換しているため、音質は劣化する)。

ゲームソフト

編集
PlayStation 3用ゲームソフト
最高で7.1ch (48kHz/16bit) にまで対応している。最近のPS3用ソフトはリニアPCM5.1chとドルビーデジタル5.1chのサウンドを収録したものが多く、規格上マルチチャンネルサラウンドにおいてはドルビーデジタル5.1chにしか対応していないXbox 360用ソフトに対するアドバンテージとなっている。7.1ch収録のものは特にサウンド面にこだわったソフトの場合が多く、その多くはSCE製品であることが多い。
Xbox 360用ゲームソフト
最高で2chステレオにまで対応している。ドルビーデジタル5.1chでゲームサウンドを収録していないXbox 360用ソフトは、全てリニアPCM2chでのサウンド収録であると推察される。ドルビーデジタル2chである可能性は低い。

IP電話

編集

1チャネル当たりの基本速度が64kbpsの場合、24チャネルで1.544Mbpsになる。

PCMプロセッサー

編集

アナログビデオテープレコーダーと組み合わせ、音声をデジタル信号で記録する装置。アナログ-デジタル変換回路デジタル-アナログ変換回路を備える。業務用と家庭用の製品が発売され、従来のテープレコーダーを上回る高音質の記録が可能な機器として利用された。コンパクトカセットが普及していたことから、家庭への導入はオーディオマニアなどの極僅かな事例のみに留まり、業務用レコーディングのデジタル化を中心に導入された。

PCM音源

編集

PCMデータをDA変換装置によって変換することで音を再生する装置をPCM音源という。サンプラーサンプリング音源と呼ばれることもある。

ソフトウェア技術

編集

ソフトウェアミキサー

編集

アプリケーションソフト側から見ると、任意の個数・性能の仮想PCM音源を鳴らす形となっていて、それらをPCM再生ハードウェアに向けてミキシングして送り出す機能を持つソフトウエアがあり、ソフトウェアミキサーという。近年CPUの大幅な処理速度向上により、よりリッチな表現が可能になった[注 3]DirectXで音声データに音階を付与する機能、ソフトウェアMIDI音源などはいずれもこの技術によって成り立っている。家庭用ゲーム機でこれを利用しているものの代表として、ゲームボーイアドバンスが挙げられる。一方、これをほとんど利用しないゲーム機にはPlayStation 2などがある。これはPSやPS2において、ハードウェアPCMまたはストリーミング再生というスタイルがほぼ確立しているためである。

非PCM音源によるPCMデータの再生

編集

PCM音源を持たないゲーム機では、CPUでサンプリングデータを順次DACに送信してPCMを再生したものがある。ネオジオポケット光速船などが単独でDACを搭載していたほか、メガドライブPCエンジンは音源の一部をDACとして使うことができ、それを使ってPCMを再生していた。

ハードウェア制御を細かに行うことにより、発声が可能なハードウェアをDACに見立て、音声を再生する手法も存在している。ビープ音用のハードウェアでパルス幅変調を行ったり、矩形波の出力をDACに見立てPSGによるPCM再生を行う試み[4][5]や、同様にX68000ではOPMに音色として矩形波を定義し、8チャンネルの出力ポートを利用することで、最大でモノラルでは50kHz前後、ステレオで25kHz前後のサンプリング周波数の再生を可能にしたソフトウェア[6]も存在する。DACとしては非線形指数的の特徴を持つなど、元々想定していないハードウェアであるため、再生の音質は想定した設計のものと比較し、低くなりがちである。

また、波形メモリ音源では、制御する側で1周期ごとに波形を更新してPCMを再生したソフトウェアも存在する。

インターネット

編集

マイクロフォンからの入力をADCによりデジタイズしてCPUレジスターやメモリーへ書き込み、時限的なソフトウェア割込などで、ネットワークに流す手法が一般化している。プログラミング言語で比較的容易にコーディングが行え、ビデオ会議アプリケーションやサイマルラジオ、サイマル・テレビなどの完成されたアプリケーションを利用することで遅延はあるものの技術的な内容を意識することがなく使われている。

脚注

編集

注釈

編集
  1. ^ マスキング効果ともヴェーバー‐フェヒナーの法則とも解釈できる。
  2. ^ 192kHz時のみ5.1chサラウンド。
  3. ^ 2008年現在、環境にもよるがCPU占有率1%未満。

出典

編集
  1. ^ 沖村 & 高橋 1991, p. 110.
  2. ^ HDサラウンドサウンド向けのロスレスオーディオ、ドルビーTrueHD”. ドルビーラボラトリーズ. 2013年5月1日時点のオリジナルよりアーカイブ。2021年6月20日閲覧。
  3. ^ “次世代サラウンド規格に完全対応。オンキョーのAVセンターTX-SA805に注目!”. Stereo Sound ONLINE (ステレオサウンド). (2007年5月25日). http://www.stereosound.co.jp/news/article/2007/05/25/1340.html 2021年6月20日閲覧。 
  4. ^ Oh!FM 1990年4月号「しゃべるんどすえ」[要ページ番号]
  5. ^ Oh!X 1995年12月号 BREEZE[要ページ番号]
  6. ^ Oh!X 1999年夏号「内蔵音源を駆使した高品位ステレオ PCM 再生」[要ページ番号]

参考文献

編集
  • 沖村, 浩史、高橋, 清『エレクトロニクス概論』裳華房〈機械工学選書〉、1991年。ISBN 4785365072NCID BN07023779 

関連項目

編集