0717-7821348
爱彩人app

爱彩人app

您现在的位置: 首页 > 爱彩人app
浙江11选5爱彩人网-2015年经济诺奖得主评本年诺奖:随机对照试验办法有限制
2019-11-10 22:19:35

【写在前面】:

2019年诺贝尔经济学奖揭晓,获奖者为阿比吉特班纳吉(Abhijit Banerjee)、埃斯特迪弗洛(Esther Duflo)和迈克尔克雷默(Michael Kremer),以赞誉他们“在减轻全球贫穷方面的试验性做法”。三位诺奖得主率先在经济学中运用“随机对照试验”,但该种试验办法在经济学家中掀起争议。

本文改编自《有关随机对照试验的访谈》(Experimental Conversations: Perspectives on Randomized Trials in Development Economics)一书的一章,该书由麻省理工学院出书社于2016年出书。该书收集了在开展经济学中运用随机评价和实地试验对学术界和方针首领的访谈。原文是英文访谈稿,采访人为蒂姆奥格登(Timothy N. Ogden),受访者是2015年诺贝尔经济学奖得主、美国普林斯顿大学微观经济学家安格斯迪顿(Angus Deaton),由张亚声(美国加州大学洛杉矶分校经济学系博士生)翻译,王勇(清华大学经济学研讨所副所长,清华大学民生经济研讨院履行副院长)整理成介绍性短文,张维迎(北京大学国家开展研讨院教授)修正定稿。

一、随机对照试验是样本太小的部分性研讨

许多查询性研讨都运用全国代表性的数据,如超越2000万个人口普查的数据。而随机对照试验(Randomised controlled trials,RCT)是样本太小的部分性研讨,这是其最大问题所在。

我以为现在的开展经济学家,有点像五十年代的做回归塞翁失马焉知非福剖析的经济学家。在上个世纪50、60年代,经济学家们刚刚开端凭借回归剖析进行计量研讨。在他们眼中,回归剖析是一个“奇特东西”(magic tool),能够提醒简直一切作业。他们将对各种事物进行多变量回归,并以一种因果关系结构内对其进行解说,虽然依照今日的规范,这彻底不合理。后来,经济学家和其他学者了解到,这样的计量研讨存在种种问题。在今日的计量经济学课程中,现已不再着重回归剖析这种魔法性,而会着重着重回归剖析存在的种种缺陷。

在现在的开展经济学家们看来,他们现在也有一个“奇特东西”——随机对照试验(RCT),但对这个东西的坏处还不甚了解。当然其他任何估量(estimation)办法也都有其长处和缺陷。但我以为RCT的坏处很大,很少能到达人们日益对其高涨的预期。人们之所以挑选RCT,是由于他们厌恶了关于外生性、东西变量和样本选取(sample selection)等等的争辩。可是,一切这些问题其实在RCT中都以不同的办法从头呈现。因而,我没有看到RCT带来研讨的质量有什么进步,坏的研讨仍然层出不穷。

好的试验研讨在很大程度上取决于细节。在30到40年前,试验经济学刚刚开端开展时,学者们一开端并没有重视细节,做了不少无效的试验,得到了许多经验。对此,虽然许多作业也现已被遗忘了,但仍然有许多学者记取这些经验,比方像查克曼斯基(Chuck Manski)和吉姆赫克曼(Jim Heckman)等人。

在曼斯基的最新作品(《Public Policy in an Uncertain World》, 2013, Harvard University Press)中,对RCT的试验办法中细节问题进行了较为细心的研讨,特别棒的是,他指出了RCT中的一些隐含假定。虽然喜爱运用RCT的学者们对此争辩论,进行RCT研讨并不需求假定。但实际上,当人们去推行运用根据RCT研讨得出定论或建议,就需求考虑这些隐含假定。

特别是浙江11选5爱彩人网-2015年经济诺奖得主评本年诺奖:随机对照试验办法有限制,当把部分试验得出定论进行推行运用时,人们需求考虑内部和外部有用性问题((internal and external validity))。假如你去阅览70年代和80年代其时的研讨,就会发现人们常常考虑怎么从一个试验中取得成果以及怎么将这个成果运用于其他当地。在当今的开展经济学文献中,我简直看不到这样的考虑。或许我错过了一些东西,可是当我读J-PAL试验室[1]网页的时分,我以为他们便是在标明那些预算值简直能够在任何当地运用它们。这真是奇怪的做法了。由于,因果关系是具有部分性的,即便在某地进行的RCT研讨发现了因果关系,也并不意味着这种因果关系会在其他当地发挥作用,即便在其他当地也存在这种因果关系,也不意味着作用的巨细是相同。

二、RCT办法无法确保因果关系的树立,不该夸张该办法的长处

其实,RCT这一办法在开展经济学之外,如美国的社会方针试验等范畴现已运用很长时刻了。而且直到今日仍然还在持续运用。其间有不少高质量的研讨。而且这些高质量的研讨都对RCT的长处和局限性有着仔细的考虑和清醒的知道。但惋惜的是,在开展经济学范畴,人们把这一办法神化了。这像是对魔法的崇奉,让RCT具有它们不具备的特点。

例如,不少开展经济学以为 RCT能够确保因果关系的树立。但这种观念是荒唐的。首要,RCT研讨中会存在规范误差(standard errors),而且在许多状况下很难正确地处理规范误差。即便咱们发现因果关系,咱们也需求论说因果关系能够在其他某个当地以相同的办法起作用,更不用说这种因果关系的一般性了。

其次,RCT应该自觉主意设法确保试验组和对照组之间的平衡。人们常常性地误以为RCT具有很高的信度(reliability)或许无偏性(unbiasedness)。但这是对计算学的过错了解。信度与精度(precision)有关。而RCT自身便是RCT,它对精度没有任何作用。可是,不少经济学的文献以为RCT能够进步信度的建议。其实,在无偏估量量中,咱们取得不了任何关于信度的信息。

咱们从计算学中学到的榜首件事便是,无偏性或许是人们想要的,但无偏并不像挨近现实那么重要。因而,假如相似字典序偏好那样(lexicographic preference)偏心RCT办法,把其置于一切的研讨办法前面,看成是“黄金规范”论据,这其实就像咱们要将无偏性推重至其他一切计算学性质之上。而这正是计算学榜首课告知咱们不该该做的作业。

在其他范畴的RCT文献中,比方医学,人们常常运用这种黄金规范论据,来阐明咱们只需求考虑随机对照试验的估量值,或至少将其优先考虑。而在开展经济学中,咱们常常看到一些随机对照试验,每个试验组只要少数查询成果,而且存在巨大的规范误差。但RCT的推重者好像觉得这比那些运用了1亿个数据但存在潜在偏倚性的研讨更可取。这底子没有道理。每个研讨都有必要被单独地考虑和剖析。RCT很好,可是它们仅仅许多东西中用来发现事物的技能之一。

我以为,现在文献对RCT的优点夸张太多。这不只会造成对该办法的运用不妥,而且树立一种过错的信仰,以为这种办法能够做一些无法做到的作业。这是用魔法的思维替代了计算学。

三、 RCT办法相同存在大样本计算剖析的问题

在我看来,曩昔这四五十年来,经济学家们对进行大样本数据剖析现已十分厌恶了,由于需求对样本挑选(sample selection)、辨认(identification)、误差(bias)和计算有用性(validity)等计算剖析问题进行十分冗杂的处理。这种厌恶导致了RCT办法在开展经济学范畴得到了人们的追捧,以致于发生了RCT运动。

但上述计算剖析问题在RCT研讨中也是无法防止的;实际上,不管运用哪种办法,都有必要以一种或另一种办法面对它们。虽然如此,仍是有不少人以为,RCT研讨能够让方针制定者能够更好的了解和承受研讨定论,由于RCT研讨直观展现出试验组和对照组的均匀值的不同。

但这仅仅他们的期望。Kremer和Miguel(2004)凭借RCT研讨了怎么怎么协助肯尼亚贫穷儿童驱虫(防备和医治蛔虫)的研讨。他们发现向学生发放驱虫药物的作用是最好的,而对学生进行卫生防备教育简直没什么作用。后来,Miguel和Bobonis(2006)在印度重复(replicate)了该研讨,得出了相似的定论。这两项研讨让一家名为“Evidence Action“的慈悲组织树立“为国际儿童驱虫项目“(Deworm the World)来将驱虫举动进一步扩大到国际范围。可是,另一家慈悲组织,Cochrane Collaborations,查询了这一项意图作用,发布了一份长达150页的陈述《 Cochrane Review》,陈述指出,该项目没有得到和Kremer和Miguel的研讨共同(consistent)或显着的作用。我并不是Cochrane Collaborations这家慈悲组织的粉丝,也不热衷于元剖析(meta-analysis),关于驱虫这件事也没有特其他见地,我仅仅想借这件作业阐明,RCT并不能消除争议。

现在我不知道谁是对的,这也不是我在这里想议论的。可是,当你考虑了一瞬间今后,或许就会意识到或许这些研讨和陈述里边就不存在对的。在一个当地起作用的东西或许在另一当地不起作用,特别是关于比如驱虫这样杂乱的作业而言,它取决于环境和卫生条件,还取决于孩子是否穿鞋,传达程度以及一切相似的东西。或许Cochrane Collaborations Review企图在寻觅一些底子不存在的东西。我也了解到Michael和Ted正在对Cochrane Collaborations的剖析提出质疑。

但这正是回到了咱们开端这类研讨之前的状况。不同的研讨给出了不同的成果,而没有人能够实在处理这些差异。我以为这是一个十分好的比如,它标明跟着咱们取得更多成果,咱们仍然不会得到一个明晰的处理方案,由于即便咱们正确并精准地完成了这些试验,有时成果也会遍地开花。RCT与大样本计算剖析之间的差异不只仅是无偏性和有偏性的问题!

在我看来,RCT倡导者们曾以为他们将处理一个我以为无法处理的问题。没有全能的子弹(magic bullet)。这便是现实。浙江11选5爱彩人网-2015年经济诺奖得主评本年诺奖:随机对照试验办法有限制应该让这些RCT倡导者来解说一下为什么他们不更多地议论60、70年代所做的研讨,这应该很风趣。让他们解说一下为什么那些研讨并没有改动国际,以及为什么它们让学者中失掉了动力。

四、大规模查询数据具有广泛有用的信息,是巨大思维的来历

我十分喜爱US Financial Diaries(一个关于美国家庭金融数据的研讨项目)的作业,而且从中学到了许多东西。别的,我现在正在处理的美国人口普查数据(American Community Survey)。这些数据会集有2000万个观测值,触及成百上千个问题。对我而言,它们比针对某一主题的一系列随机试验更为有用,由于它们具有许多广泛有用的信息。我能够自己考虑它们的代表性和随机性,我也没有被那种除非是R浙江11选5爱彩人网-2015年经济诺奖得主评本年诺奖:随机对照试验办法有限制CT不然就没价值的张狂主意遮盖双眼。

当然,取得这些大规模的查询数据需求花费不少钱,但它们的本钱在很大程度上取决于提出的问题以及问询办法。假如1000个人都想增加一个问题,而假如你铺开让人们去做,它将彻底失掉操控。别的,还存在其他办法的本钱,如官僚体系担任低效率,以及在美国,这些查询(尤其是经过电话进行的查询)很难让人们通电话超越20分钟。因而,进行获取这些大规模的数据普查本钱的确存在实在的束缚。不过,在印度或肯尼亚这样的国家,进行数据普查所需求的本钱会大幅下降,特别是美元在这些国家的实在汇率(依照购买力平价,ppp)往往高于名义汇率,依照实在汇率换算成美元今后,本钱其实会更低。

虽然处理收集这些数据面对这样或那样的约束,但这便是才智的开端。做科学研讨十分困难。假如有一台奇特机器(magic machine),那么咱们都会变得简单得多。但并没有。对US Financial Diaries这一类大规模数据进行深化的研讨十分重要。曩昔100年中,社会科学中的大多数巨大的思维都是来自这类研讨。

五、根据RCT研讨进行的方针调整让人感到不安,需求树立RCT的可移植性理论

我以为方针调整是一件十分杂乱的作业,一般很慢,触及许多的政治要素。前几天,我读了戴维格林伯格(David Greenberg)和马克史罗德(Mark Shroder)的一本书,社会试验概要(The Digest of Social Experiments),书中写到,他们研讨的数百份1999年的社会试验,有75%的试验是有钱人对贫民所做的。从那今后,比较较于发达国家,人们在开展中国家进行了更多的试验,因而百分比只会变得更糟。我对此感觉不是很舒畅。特别是,假如RCT背面隐含着的方针改变理论是家长制(paternalism),那我将十分对立。

我读过Judith Gueron 与 Howard Rolston合写的一本书,《为牢靠性根据而奋战》(Fighting for Reliable Evidence)。Judith Gueron是MDRC(一个美国慈悲研讨组织)的总裁,这本书评论了哪些研讨能够成为制定方针的牢靠根据。许多经济学家都曾在前期参加其间,但尔后的参加人数却很少,但MDRC,Abt和Mathematica等组织从那时起就持续进行这些试验性研讨,为了联邦政府,州政府以及加拿大的政府做这些试验。因而,我对它们在方针范畴的运作办法感到猎奇。

我不以为这些试验的成果会对学术常识发生太大影响,但我以为那些试验能够处理不同政治观念之间的争辩。当一个新的政府发生后,他们会说:“一切本来的这些方针都应该废弃”,或许,“假如咱们让人们去上班,然后再给他们福利,这将使他们自己挣钱并为浙江11选5爱彩人网-2015年经济诺奖得主评本年诺奖:随机对照试验办法有限制政府节省本钱”之类的。在美国,此类争辩有必要由国会预算办公室(Congressional Budget Office,CBO)来承当。CBO有必要估量那些拟议的方针调整发生的财政猜测是否靠谱。当里根当政时,他们底子不热衷于进行任何试验,可是当CBO不同意他们的估量时,他们便成为了试验的支持者,由于他们信任试验将标明他们是对的。这样以来,这些试验首要研讨方针调整对各州和联邦政府预算的影响。他们承当着许多的作业,而且他们一般不关怀贫民的福祉,更关怀政府预算。RCT对此很有用,由于它供给了均匀本钱。而在这种状况下,均匀本钱便是你想要了解的。它处理了争端。

可是,在不了解其机制的状况下,该均匀值一般无法在其他当地运用。MDRC从一开端就与寻觅机制的问题作斗争,但他们从未能处理这个问题。他们以为,经过深化研讨细节,他们能够找到能够推行或传达的机制,而他们从未设法做到这一点。运用RCT无法做到这一点。你有必要将它们与理论和观测的数据结合起来,但浙江11选5爱彩人网-2015年经济诺奖得主评本年诺奖:随机对照试验办法有限制这样你也就回到了一开端的起点。

因而,在根据RCT进行方针调整之前,需求先树立RCT的可移植性(transportability)的理论,该理论需求答复RCT在这里起作用,为何也能在那里起作用?一般,那些研讨RCT的人仅仅假定这些数字能够适用,而很少评论怎么将这些研讨成果从一个当地移植到另一个当地。

六、RCT运动会式微,不会为消除贫穷供给长时间处理方案

经济学是一个十分敞开的工作。与许多以晚年人为主导的学术范畴比较,那些有好主意的年轻人受到了许多重视。虽然必定会有咨询公司为特定意图进行RCT,例如过后基准评价,但我以为[RCT运动]或许会以30年前的式微相同的办法式微。跟着对RCT存在的问题的更好了解,学术届对它的爱好将衰退。我不否定RCT在经济学家东西箱中的位置将比20年前要更高,而且与其他办法论相同,咱们将对RCT在何种状况下适用有更明晰和成熟的认知。东西当然越多越好,但我不以为其间一种东西是魔法,或许说它是咱们仅有需求的东西。人们还将持续进行RCT以及其他研讨。

我以为RCT不会供给任何长时间处理方案。咱们当然不会以这种办法消除国际贫穷。咱们应该更多地考虑政治而不是微观细节研讨。在这一点上,我和达隆阿西莫格鲁(Daron Acemoglu)和吉姆罗宾逊(Jim Robinson)观念根本相同,处在同一条船上。正如我在书中所说的那样,协助正在使状况变得更糟,而不是更好。有或许的状况是,某时某地咱们发现了一个美妙的协助体系,这个别系能告知咱们应该怎么发放协助。这或许会使当地状况变得更好,能够抢救生命,能够使人们承受教育,但不会消除国际贫穷,由于这与政治有关,与金钱无关。常识当然能够供给协助,但相同的,这是一个关于常识可移植性的问题。怎么将其从一个当地带到另一个当地,有必要有一些理论,这需求理论、概括和某种结构模型。它们纷歧定是跨期动态范式(intertemporal dynamic programs),虽然该范式在当今被以为是开展经济学中的首要结构。

我以为,在政治方面在脱节贫穷还有许多作业要做。例如,不支持苛捐杂税的独裁统治。至于个别研讨人员参加其间,也有其必要性,可是它有必要是部分性的。由MIT或NYU的人员组成团队在某个当地进行试验,其成果首要在当地比较适用,不该该将其交给国际银行以便在其他当地施行。麻省理工学院或纽约大学或其他任何当地的团队实际上要做的是协助人们了解那些机制。我总是举一个比如,法国和美国人一同发现了艾滋病是一种经过性传达的疾病,并了解了它是怎么起作用的。这关于全国际,尤其是在东非和疫情十分严峻的当地,是十分有用的信息。咱们需求做的也是相似的作业。当学生来找我,问我:“我应该怎么协助国际贫民,我应该去孟加拉国,我应该去非洲吗?”我说:“不,你应该去华盛顿。当然,这不是对美国贫民,而是对全国际的贫民。

(原标题:2015年诺贝尔经济学浙江11选5爱彩人网-2015年经济诺奖得主评本年诺奖:随机对照试验办法有限制奖得主安格斯迪顿对随机对照试验办法的批判)