Sitemap
Pinterest でシェア
人間の心は、常にもっと多くを欲しがるバイアスを持っているかもしれません。アル・バリー/ゲッティイメージズ
  • 研究者は、強化学習モデルを使用して、私たちが不幸になるにもかかわらず、習慣化して比較する理由について詳しく学びました。
  • 彼らは、習慣化と比較が、学習を助ける適応行動において重要な役割を果たす可能性があることを発見しました.
  • 彼らは、自分たちの調査結果が、なぜ私たちが常により多くを欲しがる傾向があるのか​​を明らかにするのに役立つ可能性があると結論付けました.

幸福は、人間の最も求められる感情の 1 つです。しかし、長期的にそれを達成することは、多くの人にとって達成不可能です。

これは、人々が「幸せになるための新しい理由」にすぐに慣れるようになる期待の変化に幸福がかかっているためです。それはまた、人々が自分の持っているものを他の人と比較するか、それとも持っていたいと思うかによっても異なります.

慣れと比較の両方が、終わりのない欲求と欲求のサイクルにつながる可能性があり、メンタルヘルスと幸福に悪影響を及ぼします.

習慣化と比較のコストとメリットを理解することは、研究者がこれらの精神的偏見に対処するためのポリシーと大規模な介入を開発するのに役立つ可能性があります。

最近、研究者は、強化学習として知られる計算フレームワークを使用して、さまざまなレベルの慣れと比較の効果をモデル化しました。

彼らは、比較を行うと幸福度が低下する一方で、学習がスピードアップすることを発見しました。

博士プリンストン大学の計算論的および理論的神経科学の教授である Nathaniel Daw 氏は、この研究には関与していませんが、Medical News Today に次のように語っています。

「さまざまなオプションから選択できるロボットを構築するのは簡単だと思うかもしれません。すべてにスコアを付けて、最良のものを選択するだけです。しかし実際には、ロボットに適切な選択をさせるためにそのスコアを設定する方法を理解することは、驚くほど難しいものです。この論文は、この観点から人間の幸福を考察しています。」

「[特に、研究者は次の質問に答えます:] 同じ結果が、今日は楽しいのに、明日はつまらないのはなぜですか?彼らは、それには利点があることを示しています—私たちが決して満足しない場合、私たちは常により良い結果を見つけようと駆り立てられます—しかし、これは、私たちがすでに達成したことを絶えず切り下げるという犠牲を払っているため、極端になる可能性があることを著者が示唆しているため、欠点もあります。うつ病に関連しています。
— 博士ナサニエル・ドー

この研究は PLOS Computational Biology に掲載されました。

期待を比較して超える

研究者は強化学習フレームワークを使用しました。Rachit Dubey 氏、5 年目の Ph.D.プリンストン大学の学生で研究の筆頭著者は、MNT に次のように語った。

「強化学習法は、エージェント (たとえばロボット) のトレーニングに焦点を当てており、エージェントは状況を行動にマッピングする方法 (チェスのプレイ方法の学習など) を学習します。これらの方法の指針となる原則は、報酬を使用してエージェントをトレーニングすることです。つまり、望ましい行動には正の報酬を、望ましくない行動には負の報酬を提供します。

「これは、私たちが報酬から学ぶ方法と似ています。私たちは、お金や賞賛などの肯定的な報酬を与える行動を取る可能性が高く、痛みや悲しみなどの否定的な報酬を与える行動を避けます。」彼が追加した。

この研究では、研究者は、以前の予想と他のエージェントのパフォーマンスを超えるたびに「報酬」を与えることで、エージェントをトレーニングしました。次に、エージェントを使用してさまざまな環境でさまざまな実験を行いました。

そうすることで、慣れと比較に対して報酬を与えられたエージェントは、標準的な報酬ベースのエージェントよりも大幅に速く学習することがわかりましたが、満足度は低くなりました。

これは、慣れと比較が強力な学習シグナルとして機能することにより、適応行動を促進する可能性があることを意味します。

彼らはまた、比較を行うことがエージェントに探索インセンティブを提供するため、学習をスピードアップし、特に報酬がまばらな環境では、適切な期待が比較の有用な補助として役立つことも発見しました。

しかし、彼らはさらに、比較がチェックされずに放置された場合、および選択肢があまりにも多くの同様のオプションがある場合、エージェントは不満を抱いており、最適に機能していないと指摘しました.

これは、多くの選択肢に直面したとき、比較に頼らずに決定を下すように努めるべきであることを意味すると Dubey 氏は述べています。

より多くのことを学びますが、満足度は低くなります

報酬関数がどのようにエージェントをより速く学習させるのかを尋ねられたとき、Dubey は次のように述べました。

「慣れと比較は不幸を引き起こします。なぜなら、エージェントは既知のシナリオから肯定的な報酬を引き出さないからです。エージェントはすぐに良いことに慣れてしまうからです。また、自分自身をより優れたものと比較するため、優れたシナリオから得られる肯定的な報酬はほとんどありません。ただし、エージェントが新しいアクションや新しいシナリオを試すように動機付けられるため、エージェントがより速く学習するのに役立ち、不快なものをすぐに回避できる可能性があります。」

「これを説明するために、私がテストで 90% の点数をとったとします。これは私をとても幸せにします。しかし、一般的に私より成績が悪い同級生が、テストで 96% の成績を収めていることがわかりました。私のテスト結果が変わっていなくても、これは私を非常に不幸にします.この不幸な結果は、次のテキストでより多くのことを達成し、より多くのことを達成するように私をやる気にさせるかもしれません」と彼は説明しました.

研究者たちは、自分たちの結果が、欲求と欲望の果てしないサイクルに囚われがちな理由を説明するのに役立つと結論付けました.彼らは、彼らの結果が「うつ病、物質主義、過剰消費などの精神病理に光を当てるかもしれない」と付け加えた.

研究者は、実験が過度に単純化された環境で行われたため、現実世界のシナリオに一般化できない可能性があることに注意しました.

彼らは、将来の研究では、罪悪感や嫉妬などの幸福の他の側面と、これらが不安や退屈などの感情状態とどのように相互作用するかについても考慮する必要があると付け加えました.

「慣れと比較が適応行動を促進する上でどれほど有利であるかを考えると、これらの機能は私たちの心に深く根ざした偏見である可能性があります.これは、現代の私たちの「どんな犠牲を払っても成長する」という強迫観念と、消費レベルが劇的に増加し、減速の兆候を見せていない理由を説明するかもしれません。」
— Rachit Dubey、筆頭著者

この研究の将来への影響について尋ねられたとき、Dubey 氏は次のように述べています。

「地球の急速な劣化をもたらし、将来の世代を深刻に脅かす過剰消費という非常に差し迫った問題に真剣に取り組みたいのであれば、人間の心の偏見に取り組むための具体的な政策と大規模な介入を開発する必要があります。」

すべてのカテゴリ: ブログ