303|303 奖赏系统(被劫持的快乐源泉)
(一)
趋利避害是动物的本能,也是我们生存和繁衍的基础。
我们是怎么记住那些有利的东西或行为呢,答案就是奖赏系统。它在每一次我们“做对了”的时候给我们一点奖励,让我们感觉快乐,促使我们牢牢记住这种行为。就是说,如果你的一个行为产生了回报会带来良好的感觉,你就会倾向于一次又一次地重复这个行为。
(1)到一家特色餐厅吃到了可口的饭菜,尽管我们知道自己已经吃饱了,但是仍然忍不住多吃几口。
(2)热恋的人整天黏在一起,沉浸在爱情的幸福美好里,一刻也舍不得分开。
(3)运动会上你咬牙跑了第一名,站上领奖台的那一刻你感觉十分美好,下次训练更有动力了。
这些让你感到快乐并促使你做出重复的行为,背后都是奖赏系统在发挥作用:他会在你每做“对”一件事情之后,给你一点奖励。所谓“对”,就是对生存和繁衍有利的行为。好的食物可以促使你更好地生存,和异性一起可以促使人类繁衍。在社会中占据优势会让我们生存的更好,有更多的生存和繁衍机会。
这个奖励不是传统上我们认为的物质奖励,它包含多个方面:
(1)基本的需求要满足。饿了就要吃,渴了就要喝水。食物、水和性可以满足我们的基本需求,也是促使我们寻找的强大动力。如果动物不够饥饿,它便没有寻找食物的驱动力;如果雌性动物不处于发情期,雄性追求的动力也会很小。正因为美食和性爱让人感觉美好,身体才愿意重复这类行为以再次享受愉悦。
(2)享用奖励的过程。当我们努力了,然后费尽千辛万苦得到食物开始享用时。大脑会产生愉悦、满足等享乐感觉。
(3)精神层面的愉悦。我们因为取得了某些成果而获得社会赞许;我们成功实现了自己的愿望,我们享受这一过程带来的愉悦体验。同时,我们和朋友的一个拥抱、和恋人的一个接吻、来自他人的一句赞扬的话都会引起我们多巴胺的升高。甚至有研究发现,简单地数钱动作都能产生快乐进而减轻疼痛。
这其中,第一项是生理层面的愉悦,它是动物生存和繁衍的基础。而后面的内容,就属于更高层次的追求了。我们的很多行为得益于强化学习,也就是我们的行为会因为后果(奖励或惩罚)而调整,如果某种行为经常受奖励,我们就经常做;反之则会减少。
举个例子:
假如某天我们被外星人劫持了,外星人把我们装到一个笼子里。这时我们又饿又渴,却不知道如何跟外星人交流。为了获得可能的食物,我们着急地对着他们做各种动作,蹦跳、大声喊叫等等,然后生气地在原地转圈。这时,外星人突然扔下来一个香蕉。吃完香蕉后你拼命在思考刚才做了哪个动作才获得的香蕉。于是你蹦跳,没有;大喊,没有;原地转圈,果然,你又获得了一个香蕉。经过几次重复号,你了解了转圈和获得香蕉之间的关系。
这里,每一次获得香蕉,就是我们被奖励的过程。这种奖励让我们深刻地记住了转圈这个行为是“有用”的,是可以获得奖励的,我们以后在需要的时候会完美地重复这一行为。
(二)
我们人类社会中的行为,很多时候都比简单地“原地转圈获得香蕉”要复杂的多,它通常是多维度且相互纠缠着的。于是,我们的大脑进化出了一套神经网络来计算和权衡各种因素,捕捉行为背后的利弊得失,然后最终确定行为的选择。
这个神经网络由一系列的大脑区域构成。它包括皮层区域的眶额皮层、腹内侧前额叶和前扣带皮层等;腹侧基底核包括腹侧纹状体、腹侧苍白球以及中脑多巴胺神经元等等。腹侧纹状体接受来自皮层区域的信号,然后将信息传输给苍白球,然后通过丘脑将信息传回前额叶。这样就形成了一个信息环路。鉴于本书的目的,我们这里不对这一生理特征进行额外的细节描述,只是说明它是由一系列脑区组成的复杂神经回路。
奖赏系统给我们的“鼓励”,就是让腹侧被盖区的神经元释放神经递质多巴胺。多巴胺是一种神经传导物质(神经递质),它能释放激活多巴胺受体,进而引起快乐体验。我们所有的外部行为最终被神经元的电流冲动而得到表达。
当我们已经吃饱了,但是却忍不住多吃的时候,其中的过程是大脑纹状体会分泌多巴胺,让这种愉悦体验来麻痹我们感觉腹部肿胀的大脑系统,进而让我们继续进食,以储存更多的能量。饮水、性等行为也都遵循同样的原理,因为它们对我们的生存和繁衍是有益的,奖赏系统会让这些行为感觉良好。
文章图片
奖赏环路 奖赏系统不但鼓动你单次的饮食等行为,它还努力确保你以后会重复这个行为。每次吃火锅都让你感觉幸福满满,那么你非常容易就很想再吃一次。这是因为奖赏系统不但能够让你感觉良好,它还连接到我们的与记忆和行为相关的大脑区域,在你每一次的咀嚼、吞咽时都感觉愉悦,那么我们就非常容易再吃一顿火锅。就是这样一个过程,奖赏通路会促使我们不断重复这一行为。
很多人会怀疑“暴饮暴食”是否是“有益”的行为,因为现代社会很多人受到营养过剩的困扰。但是在人类进化过程中,食物并不都是充足的,人们经常面对食物匮乏期;同时食物也不能确保一日三次准时就餐,饥一顿饱一顿是正常的情境。因此,当我们觅到食物时,会尽可能地吃更多。这不仅能确保我们获得所有必需的营养,也可以防止竞争对手偷吃我们的食物。这一特征在远古时期是生存的重要保障;只是,它已经无法适应现代社会了而已。
(三)
这种人类自带的“奖赏机制”是克制而轻微的。比如,它所“奖励”的都是人们基本的生存需求,我们都需要付出一定的努力或者等待才能获得;同时,人们要付出很多的努力才能获得的奖励比较轻微,并且这轻微的奖励又往往是转瞬即逝的。于是,它我们在日常生活中不断努力,进而获得一些奖赏系统的青睐,盼望它给我们一点微薄的鼓励。比如,我们刻苦学习很久,才可能考到一次好成绩;我们努力很久才有一次晋升;我们训练了很久才可能获得比赛名次。这种需要努力才能获得奖励的机制让我们成为一个努力工作的人,然后我们每个人的行为促使了这个社会的正常运转和发展。
但是,成瘾药物可以破坏这一切。所有成瘾类物质的共同特征就是它们会直接/间接地刺激奖赏系统分泌多巴胺,让人产生愉悦感。它打破了克制与等待才能获得奖励的传统机制:一次静脉注射,一次吸食,一次吞云吐雾,都可以在极短的时间内让人获得愉悦感,不再需要辛苦的付出和等待;同时,成瘾性物质会过度激活奖赏系统,导致细胞分泌大量的多巴胺,因此它的愉悦感是强烈而持续的,能让人极度兴奋。
成瘾性物质带来的“奖励”极度剧烈、持久,且不需要付出太多的努力。在它面前,传统上要通过努力和等待才能获得的轻微“奖励”显得微不足道。这些行为和努力在成瘾物质面前都不堪一击,它极易导致?对于这种简单获得而持久的愉悦体验?分迷恋,所以会想不停的反复的进?这种?为,刺激多巴胺不停的升?。一旦进入了这种恶性循环,人们传统的价值观就会彻底被颠覆,传统上推崇的勤奋刻苦、坚持不懈等社会行为都敌不过一点点的成瘾性药物。很快,寻找成瘾性药物成了很多人生活的全部。
成瘾药物带来的多巴胺的升?会让?产?持续而强烈地兴奋,更刺激人们想不停的反复的进?这种?为,以刺激多巴胺不停的升?。幸运的是,?类同样有纠错机制,当多巴胺频繁升?的时候,?体中的其它神经细胞?会释放出γ-氨基丁酸抑制感受器神经受到的过度刺激,强迫让你的神经?脑休息,从?达到让?不会过多刺激升?多巴胺,?避免因过度兴奋和刺激伤害?脑以及各器官。
但是,在成瘾性物质面前,传统的纠错机制已经无法平息如洪水般汹涌的多巴胺频繁升高。于是,大脑会通过减少多巴胺相关细胞的数量来减少多巴胺带来的刺激强度,以应对多巴胺过多的现状,减少下一次的多巴胺大量涌现对大脑及身体器官的伤害。这一操作很好地保护了我们的大脑,但这对成瘾物质使用者来说,就是同样的用量没有达到他们希望的欣快程度,这也叫做耐药性。于是,他们只有通过进一步加大药量来达到同样“嗨”的程度,导致成瘾越陷越深。随着大脑持续适用毒品,负责判断和记忆的大脑区域也发生了变化,这种行为的多次重复使吸毒成为习惯且越陷越深,难以戒除。
这时候,因为多巴胺系统的敏感性降低,传统的那些给我们奖励的行为根本无法引起任何的愉悦,我们彻底失去了对日常行为的乐趣。
(四)
【303|303 奖赏系统(被劫持的快乐源泉)】上面用大量的篇幅解释了成瘾的机制,成瘾物质如何劫持了人类的奖赏系统,使人沉溺于简单且持久的快感,进而失去对生活的乐趣的过程。其目的,是想在介绍网游成瘾之前,明白成瘾的原理,以便更好地理解网游成瘾。
网游成瘾和传统成瘾不同。如上面讲述的,传统成瘾的特征是成瘾物质劫持了人类的奖赏系统。但是,游戏仅仅是一种行为,游戏的过程不存在成瘾物质的输入,更不存在成瘾物质劫持奖赏系统的过程。它似乎和传统上我们通过一定的努力和等待,然后获得奖励的过程一样。不同的是,这是一种通过网络进行的游戏而已。
那为什么游戏依然会让我们成瘾?因为,虽然游戏没有成瘾物质的特征,但它同样劫持了我们的奖赏系统。这是网络游戏的特点决定的。
网络游戏通过巧妙的设计,特别是即时反馈、随机奖励、社会互动等特征,牢牢地吸引着玩家,让他们在游戏上花费更多的时间和金钱。通过在恰好的时机给予恰当的奖励,通过计算何时玩家出现疲倦反应,然后及时给予奖励等策略,在任何一个玩家可能放弃的时间点之前给予恰当的反馈,特别是随机化的奖励等,让玩家能够继续玩下去。
科学家已经发现,在我们玩游戏的时候,游戏的各类反馈系统让奖赏系统十分活跃,持续分泌大量的多巴胺,让玩家得到持续的快乐。同时研究也发现,那些长期玩游戏的人,对待奖赏,特别是与游戏相关的奖赏十分敏感。比如,即便只是看到一张游戏图片,网游成瘾的人的奖赏系统也会非常活跃,让玩家产生欣快感。研究发现,不论是看游戏图片,还是玩游戏,他们都能给玩家带来快乐,而这种欣快感又促使他们更多重复这种行为,以获取更大的欣快感。
这种可以即时获得反馈和“奖励”(尽管这个奖励仅限于精神层面)的行为,同样也会劫持奖赏系统。我们日常必需通过勤奋和努力,还需要伴随着等待才能获得一些“奖励”,但是,在游戏的过程中,我们可以简单快速且密集地获得奖励。一旦我们体验到这种可以简易获得的且密集的快感,日常通过勤奋和努力才能获得的快乐立刻显得逊色许多。这也是造成很多人沉迷游戏而导致学习成绩下降、工作懒惰的原因。
同时,面对频繁且长期的多巴胺过多分泌,同面对毒品刺激一样,我们大脑的防御机制也开始作用。?体中的其它神经细胞?会释放出γ-氨基丁酸抑制感受器神经受到的过度刺激,强迫让你的神经?脑休息;如果不成功,同样会通过减少相关细胞的数量来减少多巴胺带来的刺激强度,以应对多巴胺过多的现状。这就造成游戏玩家在玩同样时间长度的游戏时,所获得的快感有所降低,迫使他们投入更多的时间在游戏上。于是,恶性循环开始,玩家在一轮一轮的循环中网游成瘾的程度不断加深。
从上面的分析我们可以看到,网游成瘾和成瘾性物质,尽管它们在形式上存在差异,但是它们成瘾的原理是具有相似性。成瘾性物质通过其生化特征过度激活奖赏系统,产生过多的多巴胺让人体验到简单且持久的快感;过度网络游戏通过巧妙设计的精神层面的奖励过度激活奖赏系统,同样也可以让人体验到简单且持久的快感。这些简单持久的快感让人沉溺其中难以自拔,并且越陷越深,最终让真实的生活失去吸引力。
推荐阅读
- 如何在Mac中的文件选择框中打开系统隐藏文件夹
- 单点登陆
- 操作系统|[译]从内部了解现代浏览器(1)
- 游乐园系统,助力游乐园管理
- 中国MES系统软件随工业化成长
- 推荐系统论文进阶|CTR预估 论文精读(十一)--Deep Interest Evolution Network(DIEN)
- Jsr303做前端数据校验
- Cesium|Cesium 粒子系统学习
- Android系统启动之init.rc文件解析过程
- 程序员|【高级Java架构师系统学习】毕业一年萌新的Java大厂面经,最新整理