逸品館メルマガ191「デジタルとアナログについて(2)」

デジタルという言葉はパソコンの登場と共に広がりましたが、有史以前から「デジタルの概念」は存在します。例えば、ものを数えるときに使う「数字」はデジタルそのものです。数字の発明によりそれまで不明瞭だった「量」が定量化され、正確に伝達あるいは記録できるようになったのです。そういう意味では、言語や記録できる情報はすべて「デジタル(定量化)」だと考えられます。このように「デジタル」は特別なものではなく、情報を正確に伝え記録するために「発明」され、私たちの生活の中で古くから活用されてきました。デジタルはパソコンのための特別なものでも、アナログよりも優れたものでもなく、きわめて普遍的な概念なのです。

ではアナログとはどういうものなのでしょう?アナログとは「似た形で近似する」という意味を持っています。1個2個と数えられない曖昧な量を、曖昧なまま近似して表現できるのがアナログの特徴です。例えば今日は「ちょっと温かい」とか、「少し気分が悪い」という表現はアナログ的な表現です。きっちりした量が分からないときなどに、こういう表現は大変便利です。話はそれますが、日本語は特にこのような「アナログ的表現」が多いのが特徴の言語です。

このデジタルとアナログの概念の違いは、時計を例に考えるとさらに簡単に理解できると思います。数字で時間を表すデジタル時計は「数字と数字の間の時間」を表すことができません。しかし、アナログ時計なら「数字と数字の隙間を近似して」表せます。しかし、デジタルは「時間の一点」を示すことができますが、アナログは「ある程度の幅を持って=近似して」いなければ、時間を伝えられません。時計の例えから、デジタルは「点」でアナログは「線」だと分かります。

いったんデジタルとアナログから離れて、「映像の記録」と「映像の再生」について考えてみます。昨年からブレイクし始めた3D映像ですが、残念ながらそれは「擬似的」で本物ではありません。私たちが立体と感じる対象物は、横に回り込めば横が、後に回り込めば後ろが見られます。つまり、見る人の角度や位置によって「見える形」が変わるのが本物の立体なのです。しかし、現在の3D映像は単純に2枚の映像を合成することで「平面を本物らしい奥行きを持つ立体に見せかける技術」でしかなく、2Dと呼ばれる「遠近法や明るさの濃淡で描かれた2D立体」と大きな差がありません。少なくとも私たちが現実で見ている「立体」とは、まるで違います。

では本物の立体映像「記録」するためにはどのようにすればよいでしょう。話を簡単にするため、まず「静止映像を立体化」することを考えます。本物の立体映像を作り出すためには、対象物をあらゆる角度から撮影しなければなりません。そのためには、いっ
たいどれほどの枚数の画像が必要になるでしょう?静止画ですら、このような数え切れないほどの枚数の写真が必要になるのですから、それを「動画」で記録する場合に必要とされる情報量は想像を絶します。更に「現象」をより現実的に記録するためには、五感すなわち、音=聴覚、映像=視覚、に加えて味=味覚、感触=触覚、におい=嗅覚の情報も記録する必要があります。それは非現実的です。

そこで「人間をだます(欺むく方法)」が考え出されました。映像の場合、動画は連続する静止画で記録されているのはよく知られています。映画は1秒間に24枚(テレビは30枚)の静止画が順に送られているだけですが、人間の目には動くように見えます。逆を返せば映画やテレビが動いて見えるのは、人間の錯覚で本当は全く動いていないのです。

次に白黒とカラーの記録について考えます。モノクロで撮影される画像は、光の濃淡だけです。これをカラーにするために、「色の三原色」を考え出しました。プリズムを使って光をR(レッド)、G(グリーン)、B(ブルー)の3つに分け、それぞれの光の強さを記録し、再生時にはR・G・Bを撮影された光の強さで混ぜ合わせれば、「フルカラー」の映像が作り出せます。カラー映像は我々の目に合わせて光を便宜的に三つの波長=三原色に分離し、それぞれの明るさを記録し、再現することで「波長=色の再現」を実現したのです。現実的には、自然界に「色」という現象は存在せず、光が持っているのは強さ=明るさと波長の二つだけです。

では、どうして静止画のコマ送りを動画に見せたり、光を三原色でカラー表示するという考え方が生み出されたのでしょう?それらは「私たちの感覚に合わせて情報を減らす努力の結果」なのです。先にも書きましたが、私たちは五感で現実を認識します。現象を正しく記録しようとすれば映像(視覚)や音声(聴覚)に加え、味覚、嗅覚、触覚のすべての情報を連続的かつ、立体的に記録しなければなりませんが、こんな記録は現実的には不可能です。だからこそ「人間をうまく欺く方法」として考え出されたのが、これらの記録方式なのです。このように動画は現実とは完全に違うものですが、私たちは映画を疑似現実(バーチャルリアリティー)として抵抗なく受け取っています。では、同じ疑似現実のオーディオだけが「現実」と比較されるのはなぜでしょう?それはオーディオがビデオよりも遙かに「現実的な虚構」だからではないでしょうか。

オーディオ機器から再生される音が現実と変わらないように聞こえるのは、人間がその違いを認識できないほど「うまく人間を欺いている」からです。この「恐ろしいほどうまく作られたオーディオの基本原理」は、驚くことに音声の記録方法として発明された100年以上前と全く変わりません。もしかすると最初に発明された方法が、あまりも出来が良かったため、それが逆に災いしてオーディオは「人間の感覚不在」で進歩してきたのかも知れません。映像は似て非なるから、似せる努力が行われ、オーディオは最初から似ていたから、どうすれば更に似せられるか?という努力が行われないままに「市場」が成立した結果、技術と人間の感覚のすりあわせが疎かになり、今も軽視されていると考えています。

映像同様、記録される音声もその段階ですでに「不完全」です。現実の音は私たちの体全体を包んでいますが、マイクが捉えた音は「空間の一点の空気振動」でしかありません。それは音を記録-再生しやすくするために「想定された情報量の間引き」を行わねばならないからです。
 
ここで話をデジタルによる情報の記録全般に広げます。デジタルが記録するのは「音」や「映像」だけではなく、情報がバイナリー(数値)に変換できれば、どのような情報でも記録ができます。PCで一番重宝するのが「文字(数字)情報」ですが、文字や数字はPCに取り込まれる以前に「デジタル化(記号化)」されているため、デジタル記録しても情報の欠落や変化が生じません。また、これまでのアナログ記録では伝達・保管時に情報が変化し歪みが生じたのに対し、デジタルでは伝送・保管時に一切の変化が生じません。文字や数字ならば、「デジタルはアナログよりも正確」ですが、元がアナログ情報の場合、この考えは通用しません。
 
マイクやカメラ捉えた信号は「線」で構成されますが、この信号はデジタル化で「点」に分解されます。線を点に分解するためには、高周波の切り捨てが必要です。「デジタル化」された「波形」を復元するためには、切り捨てられた高周波の復元が必要になります。デジタルで点に分解された信号は、そのままでは階段状の波形にしか再現できません。この角を丸めて、滑らかな曲線で繋ぐのが高周波の復元です。デジタル化で失われた波形の「曲線部分」が「高周波成分」なのです。

映像や音声のデジタルの復元には「アップサンプリング」という技術が用いられます。これは失われた高周波成分を「デジタル演算」で復元する方法です。最近はPCの演算能力が進歩し、前後の波形から失われた高周波成分(さらに細かい情報)をかなり正確に復元する技術も生まれています。私はCATVで「Star Trek」を見るのが大好きですが、古い映像を最新のハイビジョン映像に生まれ変わらせるのが「デジタルによる高周波成分の復元技術」の成果なのです。

話が迷走してしまいましたが、デジタルで情報を記録保管するためには「切り捨て」が必要です。どれほど技術が進歩しても切り捨てはなくならず、切り捨てられた情報は「近似値」でしか復元できません。この「近似値」をどのように復元するかで、再現される音声や映像の品質が変わります。アナログの場合切り捨てが行われないので、原理的には情報を完全な形で保存できます。しかし、保存や再生時に「情報の劣化」が避けられないので、再現される音声や映像の品質は、やはり変化します。結局は、デジタルとアナログのどちらの記録方法も完全ではなく、それを完全にするための工夫が求められるのです。
音をどれだけ綿密に記録し正確に伝送しても、再生される音に二つと同じものは存在しえません。それはすべて「異なる近似値」だからです。オーディオとは、そういう不完全な技術です。だからこそ自由だし、面白いのだと私は思います。枠にはめ考えるのは、面白さを損ないます。音楽も全く同じで、ジャンルや種別で音楽を分類し上下や甲乙を付けるのは、不自由だと感じています。正解の存在しないオーディオも、音楽も自由に楽しくやるのが一番だと思いませんか?

カテゴリー: メルマガ, 本日のブログ パーマリンク