学習・情動の仕組み
人は、たとえばスポーツや楽器の演奏など、系列的な動作や秩序だった行動を、試行錯誤を重ねることによって習得することができます。そのような経験的な学習の過程において、脳内のドーパミンという物質の放出度合が、思いがけなく良い結果が得られた場合には一過的に増え、逆に良い結果を期待したのに叶わなかった場合には減る、というように、結果あるいはそれに伴う広義の「報酬」の「予測誤差」に近い挙動を示すという可能性が、最近20年ほどの人および動物における研究から、明らかになってきました。
ドーパミンは神経結合に作用する神経修飾物質の一つで、結合前後の細胞が活動するのと同時にドーパミンが一過的に増えることによって、結合が強化されることが、少なくともある種の神経結合において、示唆されています。そこで、上述の知見と合わせると、ある動作・行動を行って(期待よりも)良い結果につながった場合には、ドーパミンが多く放出されて、その動作・行動の発現に関わる神経結合が増強され、逆に、悪い結果につながった場合には結合が弱められる、ということによって学習が進む、言い換えれば、それこそがそうした学習の物理的実体である可能性が考えられます。
こう書くと、そんな単純な・・、と思われるかもしれません。実際、そんな単純に言い表されるものでないことは言うまでもありません。しかし、そのようなごくシンプルな規則に従って行動様式を変えていくだけでも、かなり複雑巧妙な行動パターンが学習できてしまうことが、理論的にも示され、のみならず工学的に応用もされてきています(試しにYouTubeで「強化学習 ロボット」と検索してみてください)。そこまで出来るというならば、上に書いたことが、人の学習の、ある部分の非常に粗い近似くらいにはなっていても、そんなに不思議ではないかもしれない、と思えてこないでしょうか(「いや無理」という方も、仮にそう思えたと思って、もう少しだけお付き合い頂けたら幸いです)。
個性・価値観
上で漠然と「良い結果」と書きましたが、飲食物、金銭、他者からの評価など、人間が感じることのできる様々な種類の「価値」ないし「報酬」に対して、その「予測誤差」を表すようなドーパミン応答が起こる可能性が示唆されてきています。これは、ドーパミンの放出度合が、様々な種類の価値を測る普遍的な尺度となりうる可能性を示唆します。たとえ、ある条件下でのみ成り立つ、ごく粗い近似であるにせよ、一次元的な価値の尺度のようなものが脳の中に存在しているかもしれないというのは、驚くべきことです。もしもこの近似を認めてしまうならば、個性や価値観・選好とは、ある意味で、多次元の価値の空間から、その一次元にいかにマップされるかということだと言ってしまえる部分があるかもしれません。さらには、何をもって良しとするか・悪しとするか、というのは、たとえば人の利他性・社会性、あるいは倫理感の問題にもつながります。
飴と鞭
仮に、上述のような、ドーパミンの放出度合が一次元的な価値の尺度となるという仮説が、近似的・限定的にでも成り立つとすると、次には、どの程度正確に一次元的かということが問題になります。中でも、正の方向と、負の方向が真に対称的か、それとも何らかの偏りや逸脱があるかという問題は、褒められて伸びるか、それとも叱られるのをばねにして伸びるか(人によっても違いがあるように思います)というような教育において重要な問題や、行動経済学のプロスペクト理論で記述されるような利益と損失の主観的非対称性などとも密接に関わりうる問題です。現代のシステム神経科学は、ドーパミン放出の増加と減少の非対称性の解析や、ここ数年で新たに発見された、逆符号すなわち期待よりも悪い結果が得られた場合に活動を上昇させる神経細胞群の解析、そして、それらの仕組みの探求を通じて、この問題に迫れるところまで来ています。
理性と感情
ここまで我慢して読んでこられて、いや、人間というのは、そんな単純なものでは全くもって無い筈だと思われる方もいらっしゃることと思います。私自身、そんな単純であって堪るものかと思います。実は、上に述べたようなドーパミンに基づく機構は、同様あるいは同等の機構が、色々な動物種に存在していることが示唆されています。動物と共通する機構についてのみならず、人ならではの部分を明らかにしていかない限り、人の学習をよく理解することができないのは明白です。ただし、だからといって、そんな単純な機構は人には全く関係ない、と言い切ることは出来ません。進化的に古くからある単純なシステムが、意識せずとも「ひとりでに」動いてしまう、ということがあっても不思議ではありません。その仕組みを探っていく途上に、理屈では分かっていても気持ちがついていかなかったり、逆に、感情が暴走してしまったり、というようなことが何故起こるか、また、やる気・モチベーション、より広くは情動はいかに生じるか、あるいは「偏見」はなぜ生じるか、というような問題を探る鍵があるかもしれないと思います。
私は、たとえば上で述べたようなことを念頭に置きつつ、学習・情動の仕組みに迫っていきたいと思っています(上ではドーパミンのことばかり書いてしまいましたが、もちろんそれについてのみ研究していく訳ではありません ― このページの解説もいずれ拡充していきたいと思います)。アプローチとしては、大まかに言えば、文献(生理学・解剖学・行動科学・心理学・数理科学など)の調査・分析、実験データの解析・モデル化、神経回路などのシステムのモデルの構築・シミュレーション・解析、そして実験的に検証可能な予測の導出・検証実験のデザイン及び実施といったプロセスを繰り返しながら、研究を深化させていきたいと考えています。実験には人における実験と動物における実験が含まれ、前者については、本コース内での実験(脳波・筋電計測等)と外部施設での実験(MRI等)を、共同研究も含めて進めていけたらと考えており、後者については、専ら共同研究として、国内外(たとえば生理学研究所・ケンブリッジ大学など)の共同研究者の方々と協力して研究を進めていきたいと考えています。