Social Science in SNP(4)
1. 神奇的25%定律 Experimental evidence for tipping points in social convention, Science
经济学家 Rosabeth Kanter 曾经发表过这样一项研究:他发现女性员工在企业中的工作效率取决于群体当中女性的数量:当女员工占比很低的时候,她们会收到刻板印象、性别角色分工、骚扰等各个因素的影响。但是,当女性数量超过一定的比例时,Girl helps girl 的作用就发挥出来了,女性会通过建立自己的联盟,以小博大,反对“主流”所带来的影响。
文章希望探究的是,究竟这个以小博大的百分比,究竟是多少?直观的想,你或许会认为这个比例应该是51%,即少数派需要拥有绝对的话语权才会影响主流的社会准则。然而,通过一项巧妙的游戏,作者发现这个比例只需要达到25%,就能够对于社会既定的规则进行改变。在学术上,25%被称为群聚效应(Critical Mass)的转折点。
感兴趣的同学可以看看已经发表的这篇科普读物:少数服从多数?No!颠覆传统只须25%的关键少数
2. (不再)流行所引起的概念转变 Prevalence-induced concept change in human judgment, Science
这是个很有意思的JDM文章,它描述了这样一种现象:当人们发现一个概念所涵盖的事件发生概率在变小的时候,人们会倾向扩大这个概念所能涵盖的事件范围 (When instances of a concept become less prevalent, the concept may expand to include instances that it previously excluded, thereby masking the magnitude of its own decline.) 这句话听起来有点绕,但却是一个特别普遍的现象,作者把它命名为 流行所引起的概念转变 (Prevalence-induced concept change) 用文章中的实验来举例:
在实验中,作者给被试紫色和蓝色的点。一个组为概率稳定组,即紫色圆点和蓝色圆点出现的概率一直为50%;另一个组为蓝色点概率递减组,蓝点的概率从50%(1-200 trial)下降到40%(201-250 trial),再到28%(251-300),随着蓝色圆点出现的概率降低,人们会倾向于把更大比例的圆点判断为蓝色,即人们对于蓝色圆点的概念“膨胀”了。
突然好奇,这个效应跟人们会高估低概率事件发生的可能性,同时低估大概率事件发生的可能性之间有没有什么联系呢
3. 关于沉默成本的探究 Sensitivity to “sunk costs” in mice, rats, and humans
“沉默成本 (suck cost)” 是人们在决策时考虑那些已经付出了,并且不可回收的成本。文章比较了沉默成本对不同物种(大鼠、小鼠和人)的影响。为此我还专门查询了一下 mice 和 rats 之间的差别…
作者使用相似的实验范式,考察人类以及啮齿类动物对于沉默成本的态度。对于人类被试而言,ta需要选择观看或者跳过四种奖励视频。如果选择观看,则需要付出时间等待视频加载完成。等待过程中会有倒计时出现在屏幕上,被试可以停止直接进入下一个视频。在大鼠以及小鼠的实验中,研究者把奖励视频换成了四种食物。随着等待时间的延长,处于等待中途的人类参与者选择坚持的可能性更高,即人们在决策的时候考虑了沉默成本。
与人类决策类似的是,啮齿类动物同样会受到沉默成本的影响。小鼠和大鼠同样会落入“沉没成本”的陷阱,愿意花更长的时间等待。
感兴趣的可以戳知识分子的科普再了解一波:面对一往情深,人类并不比小鼠高明-专栏-知识分子
PS: 这么说来,人和 的区别好像也没有那么大了 (嘉心糖预警!快逃鸭…
4. 餐桌上的“异见” The effect of partisanship and political advertising on close family ties, Science
通过匿名投票数据集和地理位置的数据集,作者发现,在感恩节期间,如果家庭成员中有支持不同政党的家庭成员在一起吃饭(即处于同一地点的状态下),人们的平均就餐时间会缩短 50 分钟(对比家庭成员支持同一政党)。考虑到大选的时间以及大选前后的政治广告投放(political advertising),这个效应在2016年大选期间是显著的,但是在2015年的数据中没有观察到类似的效应。作者推断,执政者可以利用位置信息来进行政治广告的投放;同时,社交媒体以及政治广告对于人们行为的改变会产生影响。
5. 政治说服广告真的有用嘛 The small effects of political advertising are small regardless of context, message, sender, or receiver: Evidence from 59 real-time randomized experiments, Science advance
文章使用了一种很“浪费”被试的实验方法,每周做一次实验,每次招募1000(或2000)人,从大选前持续到大选期间来观察政治广告对于最后人们对不同政党后续人的好感程度,以及最终投票的倾向是否有影响。分组的变量是观看政治广告是偏共和党的、偏民主党的、或者是都不包含的。结果发现:真的就是没什么用…
研究者同时考虑了信息接受者自身的异质性,就是接受者自己是偏民主党/偏共和党还是中立人士,会不会影响他们对于政治广告的态度,结果发现考虑了异质性也没有很大的效应。
我感觉吧,这个实验就是人太少了(扶额),如果effect又比较小,那么自然就很容易不显著了。
6. Pay-What-You-Want 的公益应用 Shared Social Responsibility: A Field Experiment in Pay-What-You-Want Pricing and Charitable Giving, Science
所谓 Pay-What-You-Want 指的是商家不定价,消费者根据自己的意愿支付金额。研究者们发现,在普通的购物场景下,Pay-What-You-Want 和正常定价大家购买的意愿是差不多的。可是,如果提示了商品的价格是用作公益活动,那么 Pay-What-You-Want 就能大大促进人们的意愿支付金额。也就是说,Pay-What-You-Want 可以被很好地应用在公益场景中。
如此看来,发 Science 还是要看时间和机遇的,2010年十万的样本已经算是很大很厉害了,可拿到2022年看就不见得能发 Science 了…
7. 世界各地的人们是否会归还丢失的钱包?Civic honesty around the globe, Science
这个paper名声在外,相信即便是不做行为研究的读者也对文章的结论有所耳闻。这个团队的成员一共前往了40个国家的355个城市,在公共场所假称自己捡到了钱包,钱包中包含名片(含有电子邮件)、钱(没有钱、少金额、大金额)和和购物清单。作者希望通过观测获得钱包的人在接下来的100天是否会主动联系失主,来估计不同地区人们的诚实程度。
其中在中文语境下最出圈的原因,莫过于在这个实验中,中国参与者的归还比例是较低的,引起了一波热议。作者在后续的媒体采访中也提到,自己并不清楚应该要如何解释这种现象。相关的报道也提到了其他在国内完成的诚信测量相关的研究,如浙大周欣悦老师的研究,感兴趣的读者不妨进一步了解。 拾金不昧,中国排名倒数第一?研究者回应称,本意并非如此-深度-知识分子
8. something about BLM. Dissecting racial bias in an algorithm used to manage the health of populations. Science
文章用一家大型的科研型医院(academic hospital)的数据验证了美国的医院系统算法存在对于黑人患者的歧视,具体而言,由于算法依据的是能够承担的健康费用(health care cost),而不是疾病严重程度 (illness) 来对病人进行医疗的救治。所以,对于黑人患者而言,它们会由于健康费用较低而受到算法的歧视。
可以看到的是,在同等 illnesses 的情况下,白人能够获得的医疗资源比起黑人来说是更多的。虽然但是,文章发表在BLM运动之前…只是相关的执政人员没有引起重视罢了。Dissecting Racial Bias in an Algorithm that Guides Health Decisions for Millions 附赠作者在 Microsoft research 演讲该研究的视频(需要梯子享用)
9. 学前陪伴的作用 Cognitive science in the field: A preschool intervention durably enhances intuitive but not formal mathematics. Science
文章对于运用不同种类(5个社交类、5个数学类)的游戏,提升学龄前儿童在数字和几何认知能力进行了探究。通过对印度1540名小孩长达四个月的随机对照实验,研究者发现学龄前的社交类游戏介入能够对于儿童的非数学相关的认知能力有明显的提升,但是对于正式数学课的预测力不足。作为一项政策检验相关的研究,作者呼吁要提升对贫困地区学龄前儿童的教育,以满足他们上小学时候所需要的能力。
这个文章的作者之一就是前两年通过 RCT 随机对照实验 获得诺贝尔经济学奖的 Esther Duflo,由此可见与政策评估相关的研究确实是非常重要的。
10. 助推究竟有没有用?The effectiveness of nudging: A meta-analysis of choice architecture interventions across behavioral domains, PNAS
文章对于多种选择行为介入 (architecture interventions) 的效应进行元分析,对超过200项实验的450个效应量进行分析,发现平均效应量为 Cohen’s d = 0.45(这里文章提的是small to medium effect,但我感觉这个效应量已经很大了)。
不过,这个文章在某些有些研究者眼中问题却是比较大的。感兴趣的读者可以自行吃瓜https://statmodeling.stat.columbia.edu/2022/01/07/pnas-gigo-qrp-wtf-approaching-the-platonic-ideal-of-junk-science/
11. 女生真的“不够聪明”吗?Gender stereotypes about intellectual ability emerge early and inf luence children’s interests, Science
人们对于那种高层次的智力水平(高智商、天才特质)存在性别的刻板印象,会认为男孩会更聪明、更具有天赋 (“brilliance = males” stereotype)。研究者们通过考察年龄为5-7岁的小孩子对于不同游戏的选择,希望探究这样的想法是从什么时候开始的。ta们发现,在6岁的时候,女生就开始会规避那种“智力游戏 (smart game)”,同时比起男生,也不会认为作为同一性别的女生会是非常非常聪明 (really, really smart) 的人;但是5岁的小朋友就不会有这样的认知倾向。因此,作者认为 “brilliance = males” stereotype 是一种在小时候就开始慢慢被塑造的观念,并且会影响个体长大以后的想法和决策。
12. 媒体信息与参政议政 How the news media activate public expression and influence national agendas, Science
这个研究关注了一个与人们日常生活特别相关的问题:通过人们接触到媒体信息是否会影响人们对于国家议题(national agenda)的讨论程度。要研究这个问题面临几个现实的难题。首先,要去操纵大量的媒体,让他们去传达研究者所希望讨论的问题难度是非常巨大的;同时,以往的研究没有办法规避掉的是新闻信息之间可能会存在溢出的效应,即看了A新闻的人,可能会对于B议题产生兴趣。为了解决上述的问题,研究首先选择与48家小的新闻媒体合作,确保他们的受众是足够广泛的,同时也不会有比较强的溢出的效应;其次,这些小的新闻媒体之间是相互竞争的关系,所以他们会尽量规避与其他媒体的同质内容,通过在真实媒体环境中设计并随机化分配媒体资讯考察人们对于个体公共意见是否会受到新闻信息的影响。结果发现,在传达特定的新闻信息内容的日期中,人们参与相关问题的讨论会显著提升。
Material from
在我看来,这是一个特别具有重大的研究意义,但是在国内可能会被诟病甚至是被抵制的研究。”操纵新闻媒体“,这个名字要是在国内有人敢去做,那才是真的奇怪了。另外,考虑到国情之间的差异,所谓的公开议题是否是适宜讨论的,以及讨论的边界在哪里,或许都需要人们进一步进行思考。But personally, I really like it.
13. 社交网络影响政治意见 A 61-million-person experiment in social influence and political mobilization, Nature
这是我在看上一篇文章的时候顺藤摸瓜找到的与计算社会科学有密切相关的鼻祖文章。结论在今天是很显然的:在线的社交网络能够影响人们的政治行为。通过对2010年美国大选时,对6100万Facebook用户实施发送政治动员消息进行随机对照分组。研究者发现政治动员消息直接影响网民的政治自我表达、信息搜寻和现实投票行为。这种影响还会对信息接受者社交网络中的网友,以及网友的网友的多层关系产生影响。
14. 数据反映的历史痕迹 Semantics derived automatically from language corpora contain human-like bias, Science
人们社会的发展形成了很多固有的印象关联和偏见,例如:性别的刻板印象(男生更喜欢数学,女生更喜欢艺术)、创伤的认知(心理上的创伤是暂时的,身体上的创伤是更长久的)等。这些偏差都可以通过隐性关联测试(Implicit Association Test)进行识别。文章做了一件很有意思的事情,通过把互联网当中的历史数据进行搜集,通过机器学习的算法希望探究人们在互联网中留下的语料是否能够反映人们的各种认知偏差。也就是回答了一个问题:机器学习之所以做出有偏差的决策,是因为人们”喂“给了程序有偏差的数据。
15. 说出自己的”弱者“身份能获得更多的帮助。When seeking help, women and racial/ethnic minorities benefit from explicitly stating their identity, Nature human behaviour
这个文章通过两个实地实验和一个实验室实验,探究了人们对于不同求助者身份展露(是否在求助中提到了自己是少数族裔)的帮助情况,在第一个实验中,求助者以在校大学生的身份询问关于职业规划的建议。自变量为是否为少数族裔学生,以及是否在求助信中强调了自己的少数族裔身份。结果发现,人们会更愿意帮助在求助信息中展露了自己少数族裔信息的学生。
在后续的实验中,作者使用了不同的学生样本,更换了求助的请求,也更换了测量的方式,得到了比较一致的结论。作者认为,人们在选择帮助对象的时候,一是考虑到帮助的对象是否是与自己的价值观是相符合的(participants were motivated to act consistently with their values),另外就是考虑到了人们有印象管理的需求,认为帮助少数族裔能够让自己感觉更好(participants considered impression management motives)。
这个研究怎么说呢emmm,只能说身份问题或者说是平等问题还是一个特别需要关注的问题吧
16. 城市发展与人类大脑及行为的关联 Global urbanicity is associated with brain and behaviour in young people, Nature human behaviour
文章用一种基于遥感卫星数据评估城市环境的方法UrbanSat获取了被试所在的城市的指标(包含中国21个城市和欧洲8个城市),然后用这个指标跟青年被试大脑的各项指标(如,内侧前额叶和小脑体积、皮层表面积、大脑网络连接等)呈现显著的相关关系。童年处于城市环境当中的影响,与青少年时期的城市环境与大脑的认知有正向的相关关系。这个研究对于城市化建设如何影响人类行为作出了一定的探讨。
17. 对于贫困家庭的金钱补助与婴儿脑部发育 The impact of a poverty reduction intervention on infant brain activity, PNAS
这个文章在Twitter上引起了很大的讨论,说的是研究者们实施了一项名为”孩子的第一年 (baby first year)“干预,给贫困家庭的母亲提供每月高额($333)的金钱补助,对比低额($20)的金钱补助,持续52个月,探究会对小孩子产生什么样的影响。结果发现,提供了高额补助的家庭的小孩脑部发育更好,使用EEG进行测试的时候,有更活跃的脑部表现。这个文章目前存在一定争议的地方在于其进行的时间比较短,测量的是小孩一岁的脑部发育,并不清楚是否能够有持续且稳健的影响。其次,是假设检验拒绝原假设的p值最小也就是在p=.02, 不是特别地显著,所以很有可能会出现假阳性,即其实两个组别之间没有差别,但是被判定为有差别了。
这个项目的网址是Home | Baby’s First Years 感兴趣的朋友可以自行浏览相关的项目介绍与信息。