mp3とwmaの違い...etc わかりますか詳解!音楽フォーマットのまとめ
フォーマットとは
音声(アナログ信号)をコンピュータに保存するには、どうにかしてデジタルなデータにしなければなりません。そこでコンピュータでは、「標本化」→「量子化」→「符号化」という作業を行っています。

音データをデジタルデータに変換

図1:標本化(サンプリング)

図2:量子化特性

図3:ビット数と階段の数
標本化(サンプリング sampling)
まず、一定時間ごとにアナログ信号の強度(強さ)を採取し、記録します。 これを標本化(サンプリング)といいます。この一定時間を標本化周期(s)といい、その逆数をサンプリング周波数(Hz)といいます。つまりサンプリング周波数(サンプリングレート sampling frequency)は、単位時間あたりのサンプリング回数を表します。図1では、赤点を採取することを示します。
例えば、電話では8kHz以上で標本化されています。つまり電話機は一秒間に8000回以上標本化しています。
どうして「電圧」が出てくるのか。
録音にはマイクを使います。音は空気の振動ですが、マイクはその振動を振動板を通してコイル(発電素子)へ伝えることで電気信号に変換しています。そして電圧となってコンピュータに伝わるのです。
量子化
次に、これらのデータをデジタルに変換します。そのためにまずは量子化特性を決めます。
量子化特性とは、標本化したデータを有限の数字に変換するためのリストのようなものです。ここで一つの項目を階段と呼びます。量子化特性の階段の範囲は、信号の変化の範囲よりも小さくなければなりません。
符号化(エンコード encode)
そして、量子化した信号に0と1を割り当てます。例えば3ケタの0と1の組み合わせを使えば階段の数を8まで表現することができます。この時3ケタで表すことを3ビットといい、3を量子化ビット数
ビットレート(ビット毎秒)
単位時間(ふつう秒)あたりに処理するデータ量のことをビットレートといいます。WAVEなどの非圧縮ファイルのおおよそビットレートは、下の式で表せます。
*1: ステレオなら2ch、モノラルなら1ch。
フォーマットの違い
大きく分けると、下図のように分類できます。
不可逆:データのうちいらない部分を除去するので、圧縮されたデータから元のデータに戻すことはできないもの。可逆圧縮より圧倒的な圧縮率が得られる。
可逆:圧縮されたデータから元のデータに戻すことができるもの。
音楽フォーマット一覧
mp3

図4:mp3とmp4
「MPEG-2 Audio Layer-3」は
「MPEG-2 AudioBC」と改称した。
MPEG(Moving Picture Experts Group)というISOとIECという国際機関の下請けのような団体が作った規格です。いままでMPEG1〜MPEG4などいくつかの規格を作ってきました。このうちMPEG-1は映像と音声の規格を含んでいて、それぞれいくつかのバージョンがあります。そのうちmp3は「MPEG-1 Audio Layer-3」と呼ばれる規格のものを指す。
人間の聞き取りにくい部分のデータを間引く(知覚コーディング)ことにより高い圧縮率を得る。現在も世界的に最も普及。著作権保護機能がないため、市販のCDからコピーしてインターネットで流通するなどの行為が問題となっている。
参考文献
08/5/1:初出


