一、解释概念
(一)学习
学习是经验引起的行为或行为潜能的比较持久的改变。首先,学习发生的情境不限于学校,包括个体与环境之间的各种相互作用。其次,学习的发生离不开经验的作用。在经验的影响下,个体获得了知识,习得了技能,或者改变了态度,并导致行为发生了变化。最后,学习引起的变化要相对持久。学习刚刚结束之后出现的改变可能不是学习的真实结果,而只有能够持续一定的时间,或者能够在不同的学习情境下迁移的学习才是真正的学习。例如,你刚记了一个电话号码,但是打过电话后就忘了,这不是学习。如果你掌握了一种解题方法,能够解答其他类似的问题,或者在几个月之后仍然能够解答该问题,这才是学习。
学习能力是人脑的重要功能,但是“学习是如何在人脑中实现的”这一问题却仍然不清楚。通过计算机程序来模拟人脑学习的过程是研究人脑学习规律的一种重要手段。计算机程序表现出来的能力,包括学习能力,叫作人工智能。对这些程序或算法的研究属于机器学习。目前,虽然对人脑学习规律的研究仍然进展缓慢,但是机器学习和人工智能领域取得了重要进展。
知识链接
机器学习和人工智能
2016年,关于学习问题最具有轰动效应的一件事可能非谷歌公司的“Alphago”与世界围棋冠军李世石之间的对决莫属。下围棋被认为是一项非常复杂的智力活动,也被认为是考验人类智能极限,特别是学习能力的一项活动。但是正是在这样一个人类引以为傲的活动中,人类败给了人工智能。
人工智能是采用计算机算法来模拟人脑的思维方式的,并通过深度学习和一定的算法对其进行大量的训练,这个过程类似人脑的学习过程。这些算法可能借鉴了人类大脑的工作方式,而有一些则不是人类的,或是回避了人脑的短处,发扬了计算机资源的长处,如其中的蒙特卡洛算法。所以说,“Alphago”结合了人脑和计算机的双重优势。
但是,无论如何,“Alphago”毕竟还是计算机程序,人类在学习能力上败给了自己设计的计算机程序,这足以引发人类进行更深层次的思考。
图13-1 人工智能的计算和模拟
(二)学习迁移
迁移是指在一个情境或者领域内获得的知识和技能会影响到其他情境或者领域内的知识或技能水平。例如,学会了英语再学习法语就会比较容易,这就是迁移现象。迁移是学习中一个非常普遍的现象。是否能够迁移是衡量学习效果最重要的指标之一。在各种学习迁移中,近迁移和远迁移是近年来心理学家比较关注的两种迁移。当学习中对情境和信息的认知加工越概括,与已有知识结构整合得越好时,不同学习情境之间迁移的可能性就越大;反之,对学习情境和信息的加工越细致和具体,在相似情境之间就越有可能进行迁移。前者称为远迁移,后者称为近迁移。
(三)联结主义学习
联结主义学习是对一系列学习理论的统称,包括巴甫洛夫的经典条件作用和斯金纳的操作性条件作用等。这些学习理论之间虽然在具体细节上有差异,但是其基本观点是相同的,即都强调增强刺激和反应之间的联结,而不强调中间的认知加工过程。联结主义学习理论在后来的语言学习理论中又延伸出了平行分布加工理论。该理论认为,关于语言的知识输入人脑后,知识将作为节点保存下来。但是,知识之间的联系不是固定不变的;这些联系会随着新刺激的不断输入和经验的积累而发生动态的改变。这些联系的强度决定了学习效果的外在表现形式。由于联结主义观点非常接近人工智能和计算机模拟,所以后来出现了很多基于联结主义的计算模型。
(四)强化
如果某种行为带来了积极的刺激,或者消除了令人厌恶的刺激,那么这种行为反应再次出现的概率就会增强,这就是强化。例如,如果上次考试分数比较高,给孩子奖励,那么下次考试的分数可能也会比较高,这就是正强化;同样,如果考试分数比较高,孩子可以不用做家务,那么下次考试的分数可能也会比较高,这是负强化。无论是正强化还是负强化,都会增强行为反应再次出现的概率。强化的使用有一定的限度。过度使用强化不仅不会提高学习效果,反而会降低学习效果,甚至使学习过程中断。
(五)惩罚
心理学中的惩罚特指操作性条件作用中,通过带来消极感受或者减少获得的利益来减少行为再次出现的概率。惩罚有正惩罚和负惩罚。前者指在某个反应出现后通过呈现不愉快的事物减少该行为反应再次出现的概率。例如,儿童因为跟小朋友打架被罚站。后者则指在某个反应出现后通过减少或者消除愉快的事物减少该行为反应再次出现的概率。例如,由于考试不及格,不准去参加夏令营活动。过度使用惩罚也会带来相反的效果。
(六)认知地图
认知地图是托尔曼学习理论中的一个重要概念,用来描述动物在迷宫中所学习到的一系列信息,是由对当前情境的认知、达到目标的手段和途径等组成的一个完整的符号系统。认知地图其实还包含更广泛的含义,并反映了学习理论的演变。具体来说,联结学习和认知学习是两种主要的学习理论,但是两者都无法单独解释所有的学习现象。其中,联结学习可以解释一些比较简单的学习现象,特别是包含了刺激、反应和强化三要素的学习。但是,人类的学习要复杂得多,很多学习现象都无法通过简单的刺激、反应和强化来解释。于是,研究者认为,比较复杂的学习可能包含了一个认知加工阶段,这个阶段通过对刺激进行处理,形成一种心理表征,继而对行为反应产生影响。即便是相同的刺激,由于认知加工方式不同,也会导致完全不同的反应。这个认知加工阶段可以看作刺激和反应的中介变量,而认知地图可以看作在对刺激的认知加工后构建的一种心理表征。
(七)潜伏学习和观察学习
托尔曼的学习实验发现了一种有趣的现象,即在同样的学习情境下,那些得到强化的白鼠立即表现出了行为改变,而没有得到强化的白鼠则没有行为变化。但是几天之后,对这些没有变化的白鼠进行强化时,它们立即表现出行为变化。这种没有立即在行为上表现出学习效果的学习现象叫作潜伏学习。潜伏学习再次表明了认知在学习过程中的中介作用。
通过观察他人的行为进行的学习叫作观察学习。为了说明观察学习在儿童学习中的重要性,美国心理学家班杜拉等人进行了一个实验(Bandura et al.,1963)。他们先让儿童观察成人对待玩具娃娃的行为,然后再让他们接触玩具娃娃,结果发现,成人对待玩具娃娃的方式对儿童的行为产生了很大影响。这表明,虽然自己没有亲自经历,但是通过观察成人的行为方式,儿童的行为方式也发生了改变,即发生了学习。由于很多经验不可能亲身经历,而只能通过观察别人进行学习,所以观察学习在儿童成长过程中发挥着非常关键的作用。
知识链接
暴力影视和游戏
在美国,每个儿童每天平均看4小时的电视,而其中2/3的节目涉及暴力。据估计,到了12岁,美国儿童通过电视平均看了超过8000个谋杀和10万个暴力犯罪事件。在我国,虽然没有严格的统计,但是儿童看电视的时间每周至少有2~4小时。儿童最喜欢的动画片节目大都涉及各种暴力情节。此外,还有各种电影、游戏、视频等也涉及了暴力情节。因此,与暴力相关的内容已经不可避免地成为儿童成长过程中的一部分了。
大量的证据表明,暴力影视相关的内容会增加儿童的攻击行为。统计表明,接触到的暴力内容越多,儿童就越容易出现攻击行为。两者的统计关系非常显著,就好像吸烟和癌症或者学习时间和考试成绩的关系一样显著。更加让人担忧的是,如今更为流行的手机游戏也涉及暴力游戏。例如,一些角色扮演游戏要求游戏者扮演暴力角色,对角色的个性特点和行为进行认同,主动选择攻击对象,有的甚至要杀死对方。如果成功了,那么游戏者会得到各种奖励,包括游戏点数或者升级。
暴力影视和游戏对儿童的影响过程其实就是一个学习的过程。儿童通过观察学习,行为方式已经发生了变化。并且,这种变化可能是持久的。因此,为了儿童的身心健康和社会的未来,应该尽量减少暴力影视和游戏的数量,并控制儿童接触这些内容的时间。
(八)认知学习
认知学习是一个新的概念,它是以认知过程为对象的学习,即通过学习之后,认知过程的加工能力得到显著提高。这里的认知过程可能是初级的感知觉,也可能是高级的思维、决策和语言。由于认知过程的复杂性,不同层次的认知学习可能表现出不同的特点。例如,初级感知觉学习可能表现出刺激的特异性,即经验什么就学到什么。但是高级认知学习则可能表现出非特异性,即没有经历过的东西也可能学习到。这是因为初级认知学习主要是初级大脑皮层参与的,而这些脑区的功能更加专一化,表现出对特定刺激的专门化加工。高级认知学习主要是高级大脑皮层参与的,如前额叶。这些脑区往往承担了不止一个功能,所以比较容易在不同的功能之间进行迁移。另外,初级和高级认知学习的特异性和非特异性都是相对的。有些高级认知学习可能也会表现出特异性的特点。例如,在语言学习中,汉字的学习不大可能迁移到英语拼写的学习中。在初级感知觉的学习中,如果能够主动地加入高级认知过程,如抽象概括和逻辑思维、提高注意力等,可能会提高学习的效果,并促进学习效果在不同学习内容之间的迁移,表现出非特异性的特点。
(九)练习曲线
学习是一个过程,往往不是一次就能完成的,需要反复多次进行。例如,学习打网球时,击球的动作需要不断地进行重复练习。而且,如果有反馈,练习的效果会更好。这种反馈可以是自己的个人感受,如身体姿势和手的位置等,也可以是客观的响应,如教练的纠正等。每次练习都会有一个结果,将多次练习的结果用曲线连接起来,就称为练习曲线。练习曲线反映了行为结果如何随着练习次数的增加而不断变化的趋势。练习曲线可能是上升的,也可能是下降的,这取决于记录结果的方式。例如,如果用解题的数量来记录,则是上升的;如果用解题的时间来记录,则是下降的。
(十)练习的高原现象
在各种形态的练习曲线中,很多时候都会在快速变化之后出现一个相对比较平缓的阶段。我们把这个平缓的阶段称为高原期,这种现象称为高原现象。最早在实验中报告高原现象的是布瑞安和哈特。高原现象是研究学习的内在机制和动态过程的一个非常好的窗口。很多因素都会对学习过程产生影响,但是具体哪些因素会导致高原现象、影响高原期的长短,以及如何克服高原现象等问题,都是学习领域非常重要的研究课题。