タダキョク! 〜無料音楽総合情報〜

mp3とwmaの違い...etc わかりますか詳解!音楽フォーマットのまとめ

フォーマットとは

音声(アナログ信号)をコンピュータに保存するには、どうにかしてデジタルなデータにしなければなりません。そこでコンピュータでは、「標本化」→「量子化」→「符号化」という作業を行っています。

音データをデジタルデータに変換


図1:標本化(サンプリング)

図2:量子化特性

図3:ビット数と階段の数

標本化(サンプリング sampling)

まず、一定時間ごとにアナログ信号の強度(強さ)を採取し、記録します。 これを標本化(サンプリング)といいます。この一定時間を標本化周期(s)といい、その逆数をサンプリング周波数(Hz)といいます。つまりサンプリング周波数(サンプリングレート sampling frequency)は、単位時間あたりのサンプリング回数を表します。図1では、赤点を採取することを示します。

例えば、電話では8kHz以上で標本化されています。つまり電話機は一秒間に8000回以上標本化しています。

どうして「電圧」が出てくるのか。
録音にはマイクを使います。音は空気の振動ですが、マイクはその振動を振動板を通してコイル(発電素子)へ伝えることで電気信号に変換しています。そして電圧となってコンピュータに伝わるのです。

量子化

次に、これらのデータをデジタルに変換します。そのためにまずは量子化特性を決めます。
量子化特性とは、標本化したデータを有限の数字に変換するためのリストのようなものです。ここで一つの項目を階段と呼びます。量子化特性の階段の範囲は、信号の変化の範囲よりも小さくなければなりません。

符号化(エンコード encode)

そして、量子化した信号に0と1を割り当てます。例えば3ケタの0と1の組み合わせを使えば階段の数を8まで表現することができます。この時3ケタで表すことを3ビットといい、3を量子化ビット数

ビットレート(ビット毎秒)

単位時間(ふつう秒)あたりに処理するデータ量のことをビットレートといいます。WAVEなどの非圧縮ファイルのおおよそビットレートは、下の式で表せます。

ビットレート =(サンプリング周波数)×(量子化ビット数)×(チャンネル数*1
*1: ステレオなら2ch、モノラルなら1ch。

フォーマットの違い

大きく分けると、下図のように分類できます。

不可逆:データのうちいらない部分を除去するので、圧縮されたデータから元のデータに戻すことはできないもの。可逆圧縮より圧倒的な圧縮率が得られる。
可逆:圧縮されたデータから元のデータに戻すことができるもの。

音楽フォーマット一覧

mp3


図4:mp3とmp4

「MPEG-2 Audio Layer-3」は
「MPEG-2 AudioBC」と改称した。

MPEG(Moving Picture Experts Group)というISOとIECという国際機関の下請けのような団体が作った規格です。いままでMPEG1〜MPEG4などいくつかの規格を作ってきました。このうちMPEG-1は映像と音声の規格を含んでいて、それぞれいくつかのバージョンがあります。そのうちmp3は「MPEG-1 Audio Layer-3」と呼ばれる規格のものを指す。

人間の聞き取りにくい部分のデータを間引く(知覚コーディング)ことにより高い圧縮率を得る。現在も世界的に最も普及。著作権保護機能がないため、市販のCDからコピーしてインターネットで流通するなどの行為が問題となっている。

参考文献

音声信号のディジタル化|研究開発|OKI


疑問・質問・よりよい情報がある場合などは質問掲示板へどうぞ。
誤字脱字を見つけた場合やその他ご意見は、問い合わせまでお寄せください。

タダキョク!トップへ


更新履歴
08/5/1:初出