冷麺のトップに戻る

2001年02月27日

王様の耳はロボの耳

パターン認識という言葉がある。PCの音声認識や文字認識なんかでも使われる言葉だ。例えば「あ」という文字を書くとする。これは人によって上の横棒が長かったり、したの丸い部分が大きかったりするだろう。PCのような厳格な世界では、なかなかこれを同じ「あ」という文字だと認識するのが難しい。そこで横棒の長さや下の丸い部分の大きさが違っていても「あ」という文字だと認識させる技術が必要になってくる。これがパターン認識だ。

ところで人間はこのパターン認識を何の苦もなく自然にやってのけている。その最たるものが顔の記憶だ。よくよく考えてみれば人間の顔というものはみんな同じ要素によって出来上がっている。2つの目と2つの耳、真ん中に鼻、下のほうに口だ。しかし僕らはそれぞれの顔をしっかりと記憶することが出来る。しかも帽子をかぶろうが、髪型を変えようが、眼鏡をかけようが、どんな変化が起ころうとも、その顔がその人のものだと即座に判別することが出来る。これは実は結構すごいことだ。もしも人間のパターン認識がPC並に貧弱だったら、このようなちょっとした変化で別人と勘違いしてしまうことになる。

前々回に僕は右耳が全く聞こえないのだと書いた。そのため普通の人よりも会話に苦労することが多い。特に困るのは初対面の人でボソボソ話す人だ。こういう人が相手だと、何を言っているのか全くわからないということもしばしばである。ボソボソ話す人でも、ごく親しくて何度も会話を交わしたことがある人ならば、少し楽になる。それはパターン認識を総動員して、聞こえなかった部分を補うことが出来るからだ。「あ」という文字を半分隠されても僕らはそれが「あ」という文字だと推測することが出来る。それと似たようなことが声を聞くときにも通用するのである。

だから何度も話して、その人独特の話し方のクセや音の調子をパターンとして記憶すると、半分聞こえなくても大体何を言っているのかわかるようになる。もちろん音声だけではなく、前後の文脈から話の流れを推測するということもある。実は僕はほとんどの場合、こうやって推測しながら会話をしているのである。当然のことながら推測が大ハズレを起こしていて、全くちぐはぐな会話になることも多い。

A「コーヒーと紅茶どっちがいい?」
僕「何それ?」
A「いやどっち飲む」
僕「うん」
A「いや、うんじゃなくてどっちよ……」
僕「へ?」

テレビ朝日系の「タモリ倶楽部」という番組の人気コーナーに「空耳アワー」というものがあるが、僕は恐らく日本でも有数のソラミミストなのである。



Amazon.co.jpアソシエイト

楽天

MENU

冷麺最新5件の記事

冷麺最新3ヶ月


Amazonトップセラー