可視光通信…菓子交通神?お菓子と交通の神じゃないって

可視光通信とか眼や光にまつわるもろもろ

色覚ってさ、ドレファだったよ

私は最近は可視光通信関係の開発やってますが、かつて、電子楽器の開発に関わっていたこともあり、割と自然に音のほうも考える方です。楽器はちょっとしかできませんが・・、そんな流れで考えた、意味のない思いつきを披露いたします。

(この思考実験に基づいたMIDIファイル変換のスクリプトも作成中です。その実験結果は次回で披露できればと。)

※なお、たんなる例え話で、なんら科学的、技術的な意味はな無いですから。そのところ重々ご承知おきを。


まず視覚(というか色覚)と聴覚。
これを周波数範囲と、分解能という観点で図にしてみましょう。
(いちおう横軸は、両者とも周波数で対数軸を意識しましたが、縦軸に関して、聴覚はdBによる対数、色覚は無単位比率のリニア軸です。)

上が聴覚(*1)、下が色覚(*2)です。

まず聴覚を見てみましょう。
すごいです。周波数範囲にして10オクターブ以上をカバーします。(1オクターブとは、周波数が2倍になる関係です)周波数の分析能力だって、この図では、いいかげんに書きましたが、1オクターブの中を百から二百に分離して聞き分けるだけの能力があります。(*3)

さて次は、下の色覚です。
今回の話では、網膜の中の細胞で、明暗視に関わる杆体のほうは、バッサリ無視して、S錐体(青担当)、M錐体(緑担当)、L錐体(赤担当)という色を感じる細胞の特性だけグラフにしました。

まず、色覚全体の周波数範囲をオクターブで考えると、下が380nm、上が700nmなので波長に2倍の開きもない、つまり1オクターブもないということがわかります。
(なぜ、この範囲を視覚の範囲としたかについての考察は、「なぜこの周波数の電磁波だけ”可視”光?」で書きました) そして、聴覚と比べて際立つのは、周波数分析のユルさです。だらだらだして、周波数範囲も重なりまくってます。よくみるとL錐体なんて、青領域でも反応してたりします。

とにかく、色覚はゆる〜い3つのピーク持つ周波数分析してると。これ重要。
おかげで、3色用意すれば、私たちの色覚はいくらでもだませるので、カラー表示装置はあのシンプルな構造で作れるわけですね。もちろん、印刷なんかだと、4色とか6色用意することはありますが、あれは色のキレのためであり、やっていることは結局これらの3種類の細胞に対する刺激パタンをいじるという事につきます。
もし、人間の視覚が光波帯フルスペクトル感覚だったら、21世紀の今でもカラー表示が発明できてるか・・・かなり難しいですね。

とにかく、このユルさゆえに、
例えば、この感覚だと、単一スペクトルの(まあ波長570nmあたり)の「純色の黄色」を見たとき、「あ!すげー鮮やかな黄色だ!」と思いますが、それとまったく違う電磁波、520nmの周波数と 600nmの周波数の光がまざって光ってるのを見ても、やっぱり、「あ!すげー鮮やかな黄色だ!」とおもうわけです。

緑と赤の錐体が同じ配分で刺激されていとき、私たちの視覚では、その刺激結果でしか光を見ていないわけです。なんの区別もしていません。刺激パタンが同一なのですから。
このように、「特定の色」というのを生じさせる光の組合せは、無数にあるわけです。
(※色覚については、この物理的な生体構造以上のことがあり、まだいろいろわかってないところあるようです)

音でいうと、レの音が鳴っていることと、ドとミの音を少し小さく同時に鳴っているのが、まったく同じ音に聞こえるような感じです。シとファが同時になってもやっぱりレに聞こえたり、・・みたいな感じです。


ということで、ここで「 if 」ですが、聴覚の周波数分析能力が視覚並に貧弱だったら?  ということを考えてみましょう。

周波数の対応関係としては、いちばん周波数の低い側のRの感覚のピークを、ド(C3=261.6Hz)と見立ててみましょう。
そうすると、周波数の比の関係から、M錐体(G)のピークは、290HzくらいでD3(レ)にあたり、S錐体(B)のピークは、340HzくらいでF3にあたることがわかります。
ちなみに、半音は、オクターブを12平均律等比数列にする周波数列です。その周波数比は2の12乗根=1.0595 倍の関係です。この音の対応には、この比率をあてはめています。

おお、これで、色の感覚ピークは、R・G・Bがそれぞれ ド・レ・ファ であることがわかりました!
しかもこの場合の音の感覚は、だいたいA3からG3の1オクターブにも満ちません。

つまり、色覚くらいあらっぽい周波数分析能力で聴覚がなってしまったら、世の中のあらゆる音が、ド・レ・ファ の和音のそれぞれの刺激のされかたの組合せの知覚になるわけです。

この場合、ド#の音を聞いても、ドとレの音が同時に刺激されても、それは同じ「音」に聞こえるわけです。へんですね。しかも、非常に広い感覚スペクトルが可能にしていた、音色(倍音成分)の違いはもちろんわからない。

ということで、聴覚ヤバイ。もう、周波数わかりすぎ。超すごい。ってことでした。

ただ、「おまいら!RGB感覚を音でたとえるとドレファだよ。
         1オクターブにみたない範囲の3つの音の組合せだお!」
ということで、考察終わるわけですが・・・・なんか面白くないですね。


ということで、実際にその片鱗を感じられるスクリプト着手しています。(ついでに、いまさらRubyをかじっておこうと、Rubyで書いています。)
ひとつの音がなったとき、その音に応じて、3つの音の強弱組合せになるという原理で、任意のMIDIの楽曲ファイルを、変換するものです。 MIDIのバイナリファイルいじるプログラムなんて、20年ぶりに書いた忘れてた。
単音旋律だと変換動くようになったけど、複雑なMIDIファイルだと、和音で連なってる時の動作にバグ?があるのと、はてダでMIDIデータなどの上げかたわからないので、とりあえずこの考察だけまずあげました。
実験結果は後日!(できるか?) 乞うご期待。
  =>RGBはドレファだった・・実験報告 を参照


視覚は、あきらかに周波数分析より、電磁波の空間強度分布(つまりは結像)に走った知覚なんだということがわかります。もし本当にフルスペクトルの視覚をもってたら、モノを見て素材がわかったり、相当すごい知覚にはなったはずなんですけどね。

まあ、とにかく、最後に我田引水ですが、視覚も空間強度分布重視で進化した点から見ても、可視光通信において、イメージセンサ通信というのは、スジがいいかと思います。


最後に質問。この「ド・レ・ファ」の和音って、コードでいうとなんでしょうね?
Csus2 あたりだと思うのですが、これド・レ・ファ・ソとかですから、ちょっと余分ですよね。



(1*)この図は、産総研さんのページのラウドネス曲線の40ホンあたりをもとにしました。
    http://www.aist.go.jp/aist_j/press_release/pr2003/pr20031022/pr20031022.html

(2*)この図は、「illustrator講座」さんの中の http://illustrator-ok.com/illustrator_koza/color/contents/color3.html#shisaibo_color
  などを参考にしました。(変換スクリプトのためにここから、値をいいかげん読みとりしました)杆体の感度についてはここでは、無視することにしました。

(3*)聴覚は色覚みたいに「特定の周波数に特定の細胞が反応する」という形ではなく、基底膜という耳の中の器官の振動をいわばアナログ的に判別するので、こういう、単独の感度曲線が重なるっていうものではないです。
なお、聴覚の弁別精度は1/20半音くらいは分離できるようです。だからこのグラフに分割した感度範囲を書くなら1オクターブの中は200-300個で分割することが可能ということになります。
細かい周波数の分解能力については、「臨界帯域幅」というよりは、音程知覚を元に語っています。(音の丁度可知差異(jnd、Just noticeable difference)は約5セント(半音の5/100)  http://ja.wikipedia.org/wiki/音高


(*)念のためにいっておきますが、物理的な周波数分析として音の感覚より貧弱であるので、美の感覚として劣っているというのは、意味しておりません。 世界の光が我々にもたらず色彩の素晴らしさは、感覚器の物理的実体と別に我々の内部に存在するものです。