更正:前两篇标题的章节数标错了,是从第四章开始写这个专栏的,不是第三章。
一、学习的研究
1.学习——行为表现差异(learning-performance distinction)是什么意思?
你学到的和你在外显行为中表现出来的内容之间的差异。
2.为什么华生强调可观察行为的学习?
内省法——人们对感觉、表象和情感的言语报告——不是研究行为的好方法,因为太主观了。科学家无法检验私人经验的准确性。意识状态,精神迹象,是无法被客观证实的,出于这一原因,它将拥有不会成为科学的数据。心理学的首要目标定义为:“预测和控制行为”
3.行为分析的主要目标是什么?
在具有可比性的情景下,去发现适用于人类在内的所有动物的普遍学习规则。
4.习惯化的定义是什么?
当刺激重复出现时,你会减少行为回应。
二、经典条件作用:学习可预期的信号
1.反射行为在经典条件作用中有什么作用?
2.UCS(无条件刺激unconditioned stimulus)和CS (条件刺激 conditioned stimulus)的区别是什么?
有无条件,行为是否为自然诱发。
3.刺激辨别(stimulus discrimination)有什么意义?
生物体学会在某些维度上,对与条件刺激不同的刺激做出不同反应的过程。提高对相似刺激的区分,避免对任何事物都恐惧不安,耗费时间和精力消除不安。
4.为什么相倚在经典条件作用中如此重要?
在罗伯特·雷斯科啦(Rescorla,1966)的实验中,他设计了不同的对比清洁,一个是声音(CS)和电机(UCS)几乎同时出现——如果巴浦洛夫是正确的,这足以产生经典条件作用;另一个情景是,声音能可靠地预测电击的出现。
随机组,UCS(电击)的施加是随机的且独立于CS(声音),而相倚组,UCS总是出现在CS之后。所以,在相倚组,声音可以有效预测电击的出现(狗才能学会在CS与UCS之间建立联结)。
在此实验之前,巴浦洛夫认为,经典条件作用来自CS和UCS的简单配对,建立经典条件反应,要求CS和UCS在时间上接近。Rescorla的实验认为,除此之外,CS嗨必须可靠地预期UCS的出现。因为在自然情景中,刺激并非如实验室中有条理的简单方式出现,而是成群出现的。
关于经典条件作用的补充:刺激作为经典条件作用的要求除了相倚性之外,还需要刺激必须在环境中能够提供信息。
比如已经习得了声音能够预测电击的老鼠,如果再加入新的灯光刺激,同时预测了电击,但是当灯光随后单独出现时,老鼠们并未习得灯光预测电击。因为声音的条件作用阻断了灯光的条件作用,灯光并没有比声音提供更多的信息。刺激越强,与其他刺激对比越鲜明,越容易被注意到。
因此,只有中性刺激既有相倚性又有信息性时,才能成为有效的CS。
5.当经典条件作用在药物成瘾中起作用时,条件反应的是什么?
毒品的使用情境是条件刺激物(CS),机体对药物的预期效应做好生理准备(CR)。(这也是耐药性产生的原理,随着条件性补偿反应本身的增强,所需药量越来越大。)
Shepard Siegel 认为,毒品的使用情景作为条件刺激物存在,个体在情景中通过阻止药物的常规效应而学会了保护自己。当人们吸毒的时候,毒品(UCS)会带来某些生理反应,即机体试图重建体内动态平衡而采用的药物对抗反应,对抗反应时无条件反应(UCR)。随着时间的推移,这种补偿反应就变成了条件反应。
批判性思考:思考在老鼠身上进行的论证条件性海洛因耐受性实验,为什么在测试那天要给老鼠两倍于平时剂量的海洛因呢?
一组老鼠,在一种情景中注射海洛因;在另一种情景中注射葡萄糖。实验第一阶段给老鼠注射少量海洛因形成耐药力,在测试当天把老鼠分成两半,在两个情景中注射大药量(两倍)海洛因,结果葡萄糖溶液情景中死亡的老鼠是注射海洛因场景的两倍。 (控制变量是场景)
因此,在通常情景中接受海洛因注射的老鼠对潜在危险情景更有准备,因为情景(CS1)引发了对抗药物的生理反应(CR)
两倍剂量的海洛因,是为了检测不同场景下耐药力的程度,如果只有一倍剂量,也许本身的耐药力就可以抵抗毒品,无法产生显著结果,两倍剂量使结果对比更明显。
三、操作性条件作用(operant conditioning):对行为结果的学习
1.什么是效果律(law of effect)
带来满意结果的反应出现的概率会越来越大,而带来不满意的反应出现的概率会越来越小。
2.强化和惩罚怎样影响行为出现的概率
强化 是在反应出现之后呈现强化物。
正强化和负强化都能增加行为发生的可能性。正强化通过继反应之后呈现令人喜爱的刺激而增强行为反应的频率;负强化则相反,它通过接触、减少或阻止反应之后出现令人讨厌的刺激来增强行为反应的可能性。
惩罚 是在反应之后施加惩罚物。
惩罚用来降低某一行为反应概率。某一行为之后伴随着厌恶刺激时,为阳性惩罚(positive punishment);某一行为之后伴随有喜爱刺激的消除时,为阴性惩罚(negative punishment)
3.在操作性条件作用中的辨别刺激有什么作用?
辨别性刺激(discriminative stimuli)
辨别性刺激——行为——结果,三项相倚(three-term contingency)通过操作三项相倚的成分,可以将某一行为限定在某一特定背景下。
4.强化的固定比率和固定间隔程序表的区别是什么?
固定比率程序表(fixed-ratio schedule),强化物在有机体做出一定次数的反应后才出现。(次数上的累计)
固定间隔程序表(fixed-internal schedule),强化物是经过一个固定的时间间隔后,有机体第一次做出某反应时出现。(时间上的累计)
关于四种强化程序表(schedules of reinforcement)的补充
在现实生活或实验室里,强化物可以按照比率程序——经过一定次数的反应之后给予强化;或者按照间隔程序——经过一个指定的时间间隔之后给予强化。
部分强化效应(partial reinforcement effect):在部分强化程序表中习得的反应比那些在连续强化中习得的反应更能抵抗行为的消退。
FR 固定比率程序表,强化物在有机体做出一定次数的反应后才出现。FR-1即每一次反应后都伴有强化,FR-25即25次反应之后才给予强化。销售人员必须卖出一定数量的货物,才能得到报酬(强化周期拉长,会导致反应消退)。
VR可变比率程序表(variable-ratio schedule)强化物之间的平均反应次数是预先确定了的。VR-10即平均每10次反应后伴随1次强化,但是强化可能是在1次反应后即出现,也可能是20次反应后才出现。VR产生的反应速率最高,抗消退能力最强。从低的VR值开始训练有机体,逐渐提高VR值,即使取消强化, 反应仍会持续很久。赌博似乎就是受VR程序表控制。VR让你去猜测奖赏何时出现——你打赌它下次就出现,而不是许多次反应后才出现。
FI固定间隔程序表(Fixed-interual schedule),强化物是在经过一个固定的时间间隔后,有机体第一次做出某反应时出现。FI-10即参与者得到强化后,必须等待10秒钟,再有反应才会被强化——强化与反应次数无关。随着回报时间的临近,参与者的反应越多。
VI可变间隔程序表(variable-internal schedule),平均时间间隔是预定了的。VI-20,平均每经过20秒就呈现一次强化物。VI产生中等但稳定的反应速率,消退比FI慢许多。比如课上教授常有临时、无规律的测验,所以学生可能会每天上课前都复习笔记。
5.什么是塑造?
连续接近塑造法(shaping by successive approximations),对任何连续接近并最终与预期反应相匹配的行为进行强化。
要让塑造法起作用,必须定义向着目标接近的各个行为成分,并运用差别强化来推进这一过程中。
批判性思考:在黑猩猩的实验中,为什么研究者在转向代币前,最初使用葡萄干进行训练?
因为葡萄干时初级强化物(primary reinforcers)强化特性时由生物学因素决定的。随后根据时间的推移,与其他中性刺激联合在一起,变成条件性强化物(conditioned reinforcers)
四、生物学与学习
1.什么是本能漂移?(instinctual drift)
即使动物学会了进行完美的操作反应,随着时间的推移,“习得的行为也会向着本能行为漂移”
2.是什么使味觉—厌恶学习不同于操作性条件反应?
味觉——厌恶学习(taste-aversion learning)
味觉厌恶仅仅通过CS(新异味道)与其后果(潜在的UCS结果——实际引发疾病的成分)的一次匹配即可形成。只要经历一次,味觉厌恶永久保持。
遗传因素/生物性准备,使得该物种的成员只需要少于正常的学习经验便能获得条件性反应。
五、认知对学习的影响
1.托尔曼从他开创性的研究中得出了什么结论?
条件作用不仅涉及刺激情境之间或反应与强化物之间形成简单的联结,他还包含对全部行为背景中其他各方面的学习与表征。
2.什么证据证明了鸽子能灵活地概念化刺激?
鸽子能够在自然刺激物和人工刺激物实验中做出正确反应。
3.替代强化有什么意义?
将自己的认知能力用于记忆和推理,从而依据他人经验来改变自己的行为。
4.为什么用观察学习的视角评价孩子观看的电视节目是重要的?
观看暴力电视的孩子在成人后更容易变得富有攻击性;
观看有亲社会行为榜样的电视节目时,他们也可以学习亲社会的主人行为。
批判性思考: 思考电视观察研究。研究者要通过什么步骤才能确保对从数据中揭示的相关关系进行了正确的因果解释?
通过自我报告、他人报告,测量攻击水平。