視覚障害者の音・音楽利用(MPEG関連技術について)
筑波技術短期大学 村上佳久
概要:視覚障害者がインターネットを通じ、様々な情報を得ることが出来るが、ここでは、最近話題のMP3(Mpeg
Audio Layer 3)について、簡単な技術解説と利用する方法について、デモも含めて説明する。
0.音や音楽の利用と合成音声
合成音声:サウンドデバイスを利用
MIDI:独立したデバイスを利用
WAVやMP3:サウンドデバイスを利用
同じ、サウンドデバイスを利用する合成音声とWAV等は同時に利用できない。
これは、技術的な問題であるが、Windows 98以降では、技術的に解決する方法もあり、これからが期待できる。
1.mpegとは
MPEG:Motion Picture Expert Group
画像や音声をデジタル化した情報を扱うための国際標準規格
MPEG-1 1993年
MPEG-2 1994年
MPEG-4 1999年予定
MPEG-7 2001年予定
MPEG-1:「転送レートの上限をおよそ1.5Mbit/sまでとした、デジタル保存メディアのための動画と音声に適合した符号化」
現在、ビデオCDなどに利用(中国などでは爆発的に利用)
MPEG-2:「限られた帯域幅において、非常に低いビットレートを要求するアプリケーションのための、低いサンプル周波数の拡張」
現在、衛星放送などに利用(スカイパーフェクトTVなど)
MPEGは、動画の部分と音声の部分に分けられ、音声の部分は、MPEG
Audioと呼ばれる。
データの圧縮は、人間の聴覚の「最小可聴限界」と「マスキング特性」の2つを利用してデータを削ることによりデータサイズを劇的に低減する。
ただし、この圧縮は非可逆圧縮であり、圧縮したデータを元に戻すことは出来ない。
転送レート:時間あたりのデータの転送量
サンプリング周波数:音を符号化・復号化する際の時間軸方向の解像度
(転送レートにより時間あたりのデータサイズが固定されるので選択可能なサンプリング周波数も限定される)
チャンネル:独立した音データ単位(Mono, Stereo,
Joint Stereo)
Joint Stereoは、音の差分データを利用し、データ量を圧縮。
MPEG-1 Audio Layer 3 の音楽(音声)だけの規格がインターネット上などで事実上標準となる。(現在、MP3
と呼ばれている)
転送速度、128kbit/sec
サンプリング周波数、44.1kHz
圧縮率、1/11程度
音楽用CD(44.1kHz, 16bit, Stereo PCM)のデータ:630MBで、60分
MP3の圧縮:約1/11の58MBで、60分
録音図書にも利用可能
更に高度圧縮を行っても、朗読音には影響しないため、1/50の圧縮も可能。
DAISY(Digital Audio Information System, デイジー)とは、別の規格。
2.MPEGファイルの作成
・音楽用CD
1)内部データをWAVファイルに変換(リッパー)
2)WAVファイルをMPEGファイルに変換(エンコード)
3)MPEGソフトウェア再生(デコード)
3.音質
圧縮は、「最小可聴限界」と「マスキング特性」の2つの音響心理学的効果を利用。
圧縮に伴う「ブリーチング現象」(息継ぎのように音が微妙に途切れる)が問題。
「サンプリング周波数」は「シャノンの定理」より最高録音再生周波数を決定する、例えば、「サンプリング周波数」22050Hzでは、最高再生周波数は、11025Hzである。つまり、11kHz以上の高音は成分として含まれていない。したがって、やや含みのある音質なる。
4.著作権
現在、インターネット上で展開されているMP3音楽ファイルの9割が著作権法違反。
著作権法 第23条 送信可能化権
インタラクティブ通信を占有できる権利、サーバにデータを蓄積する事。
有線、無線などの通信上で著作権を保護。