ある考え方では

あるの視点から

視覚と大脳

はじめに

私たちが認識する視覚は、目から直接得られるものではなく、大脳で情報を再構成して作られた「世界」です。私たちは2つの目を持っていますが、それを1つの像として認識し、左右の視差から距離を測ることができます。この再構成は、自動的に、そして私たちの知らないうちに行われています。

私は1917年2月に脳出血を起こし、その結果として複視を経験しました。この経験を通じて、視覚が単なる「見える」ことではなく、脳での処理によるものであることに気づきました。視覚の仕組みについて関心がある人には当たり前のことかもしれませんが、多くの人にとってはあまり意識されていません。

この感覚の大脳による再構成について、ブログにまとめてみました。

再構成される利欠点

以下は、視覚が大脳で再構成される際の利点と欠点を表にまとめたものです。

項目 利点 欠点
情報の処理能力 ・膨大な視覚情報を効率的に処理し、必要な部分だけを強調することが可能。・複雑なパターン認識や予測(顔認識、動きの予測など)が可能。 ・処理の遅延が発生する場合がある(例:反射的な動作が必要な状況では遅れが致命的になる)。
認知と解釈 ・経験や学習に基づいて視覚情報を補完し、不完全な情報でも意味を理解可能(例:不完全な画像を補完する能力)。 ・誤認や幻覚など、不正確な情報処理が発生する可能性がある(例:錯覚や先入観による誤解)。
柔軟性と適応性 ・環境や状況に応じて情報の優先順位を変えることが可能(例:危険を即座に認識する能力)。 ・優先度の変化が意識的に制御できない場合、重要な情報を見逃す可能性がある。
エネルギー効率 ・エネルギーを節約するため、視覚情報の一部を抽象化し簡略化して処理する。 ・抽象化が過剰になると、細部の情報が失われる可能性がある。
学習と記憶 ・過去の経験を元にした予測や学習が可能で、状況に対する適応能力が向上する。 ・過去の経験が偏見となり、新しい情報を正しく処理できない場合がある。
複雑な認知の統合 ・視覚以外の感覚(聴覚、触覚など)と統合し、より精度の高い判断を行うことができる。 ・他の感覚情報との統合が誤作動する場合、視覚情報の解釈を誤る可能性がある。
創造性と想像力 ・視覚情報を元に新しいアイデアや創造的な構想を生み出すことができる。 ・非現実的な想像や妄想が視覚情報に干渉する場合がある。



視覚情報の流れ

  1. 光の受容: 網膜にある視細胞(錐体細胞杆体細胞)が光を感知します。

  1. 視神経を通じた伝達: 受け取った光の情報が視神経を通じて脳に送られます。

  2. 視覚野での処理: 脳の後頭葉にある一次視覚野や周辺の領域で、情報が処理されます。

    • 形状、色、動きなどの異なる特性を別々に分析。
    • 両目から得た情報を組み合わせ、奥行き感立体視を作り出します。
  3. 高次認識: 頭頂葉や側頭葉でさらに統合され、意味のあるイメージや物体として認識します。

    • 例えば、単なる「赤い丸」ではなく、「リンゴ」として認識するプロセスです。

再構成の重要性

この過程で脳は、補正推論を行います。

  • 盲点の補正: 視神経が網膜を貫く部分には光を受容できない「盲点」がありますが、脳が周囲の情報を基に埋めます。
  • 錯覚: 脳が過去の経験やパターン認識を基に情報を「予測」するため、視覚的な錯覚が生じます。


面白い点

私たちが見ている「現実」は、実際には物理的な光景そのものではなく、脳が解釈して構築した「認識された現実」です。そのため、視覚の仕組みを深く理解することで、人間の脳の働きや限界を知ることができます。

また、記憶が出来なくなってくることが認知症として、高齢化社会では問題となっていますが、脳の再構成に問題が起こっているのでしょう。

 

曖昧さの原点 

人間の知覚は、外部からの感覚情報(視覚、聴覚、触覚など)を単に受け取るだけではなく、それを大脳が再構成し、解釈する過程が含まれています。記憶と予測が構成に関わり、曖昧さ(ファジー)になります。これがコンピュータと人間の認知プロセスの大きな違いを生む要因です。


知覚と再構成のポイント

歩くとき、私たちは進行方向に重心を移動させ、倒れないように足を前に出し続けます。この動作は一定のリズムで行われ、速度の調整も含まれています。このリズムを作り出しているのは脳であり、特に自動化の役割を果たしているのが小脳です。小脳はいくつかの神経回路を形成し、それらが協働することで効率的な動作を可能にします。

スムーズに動作ができるようになるまでには練習が必要で、その過程ではスランプも経験します。しかし、この繰り返しによって新たなスキルが習得され、自転車に乗れるようになるのも同じ仕組みです。アスリートが常人では想像できないパフォーマンスを発揮するのも、このプロセスを繰り返し実践した結果であり、それは個人の能力と努力による成果なのです。

  1. 情報の補完と予測
    知覚情報にはしばしば欠落があります。人間の脳は記憶や経験をもとに、不完全な情報を補いながら現実を解釈します(例: 視覚的な盲点を埋める)。
  2. 文脈と意味の依存
    同じ刺激でも、文脈によって全く異なる意味を持つことがあります。たとえば、曖昧な音が「言葉」として聞こえる場合、脳はその文脈から最も適切な解釈を選び出します。
  3. 主観性
    感覚情報は個々人の経験や感情によって異なる解釈を与えられます。この個別性が創造性や独自性を生む要因です。
  4. 認識の速度
    それは早く認識することを可能にします。動態視力もこの機構によると思います。

コンピュータが苦手な理由

  • 非線形性と曖昧さ
    コンピュータはスイッチが付いているか消えているかの積み重ねです。どちらかでなければいけないので、正確で決定的なデータ処理を得意とし、曖昧さや不確定性を扱うのは苦手です。
  • 膨大な文脈依存
    人間の脳は膨大な文脈をほぼ瞬時に適用できますが、コンピュータはそれをシミュレーションするのに多大な計算リソースを要します。
  • 柔軟性の欠如
    機械学習やAIは特定のタスクに特化するのは得意ですが、人間のように「全般的な柔軟性」を持つには、さらなる発展が必要です。


さいごに

ファジー理論は、この曖昧さを数学的に扱おうとする試みです。特に、「部分的に正しい」状態を表現し、複雑な現実世界の問題に対処するために設計されています。しかし、これを大脳のようにリアルタイムで行うのは、現在の技術ではまだ挑戦的な課題です。これがAIの難しさであり、面白いところです。