【量化历史研究】二十世纪初美国难民的语言优势
历史
历史 > 自媒体 > 正文

【量化历史研究】二十世纪初美国难民的语言优势

20世纪初的埃利斯岛入境检查站大厅

(图片来源于 NYPL Digital Collections)

背景与问题

自1850年起,迁往美国的海外移民已经逾亿,其中有相当部分是由于担忧政治迫害或暴力的难民或政治庇护移民。在国际移民中,难民通常被认为处于一定的劣势,在抵达后面临的各种不利条件使他们难以快速融入当地社会,个人发展也难以与其他移民或本地人齐平,这也被称为“难民差距”(refugee gap)。然而,美国的难民似乎有所例外,许多人成功克服了最初的差距,甚至比其他类型的移民融入得更好。

不少学者将美国难民的成功归因于各项福利与援助政策,但这并不能解释政策出台前的现象:1948年之前的难民并未得到美国政府的支持,但他们的融入速度似乎仍比经济类或家庭类移民更快。Abramitzky等学者去年发表于NBER的文章选择聚焦于20世纪初的美国移民,根据历史访谈记录从词汇、句法、口音等多维度衡量出移民的语言水平(language proficiency),证明在尚无政府援助的时期,难民仍比其他移民有着更高的英语水平。

方法与主要结果

作者选取的研究对象是1893-1957年间抵达美国埃利斯岛的移民及后代的口述史笔录或录音,共筛选出1190份有效样本。访谈最初由自由女神像—埃利斯岛基金会(SOLEIF)于20世纪70年代至80年代间组织完成。比起相关研究常用的自我评估语言水平或是在校儿童能力分数,英语口述史记录更能反映移民真实的英语水平、原先的社会经济状况以及迁移的目的。

首先,作者团队整理了材料中的移民时长、来源国、城乡居住、父亲职业、宗教等各项社会经济状况的数据,并任用两名助理通过双重编码识别出其中的难民,即两次都被识别成难民的移民才定义为“难民”、仅一次被识别成难民的定义为“多因”移民。难民通常会描述移民前的战乱或灾难经历,非难民则常谈论美国的机会。

随后,作者计算出受访者所用单词的平均习得年龄(AoA)、平均语句长度、口音、每分钟音节数,即从词汇、句法、口音和语速等四个维度衡量英语水平。AoA变量基于Kuperman等 (2012)对三万多个英语词目的年龄赋值,表示某词汇一般在几岁时学会。图1展示了两位受访者“MH”和“PD”的访谈内容被量化的过程,“MH”的用词平均习得年龄更高、平均语句长度更长,可以判断其英语水平比“PD”更高。

图 1 单词平均习得年龄与语句平均长度的测量案例

为进一步讨论难民身份与英语水平之间的关系,研究者建立了以下回归模型:

其中被解释变量𝑦i分别取四项语言指标之一(词汇、句法、口音或语速),主要解释变量REFUGEEi表示是否为难民,其它控制变量则包含了年龄、性别、到达时期、出生国,以及移民前的环境等多项因素,样本仅选取到达时已年满12岁的移民。

基准回归模型结果显示,20世纪初前往美国的难民的英语水平高于同一原籍国或宗教群体的其他移民(即经济或家庭移民)。图2标注出作为难民对四项语言指标的影响程度(β值),其中,难民在词汇平均习得年龄、平均语句长度和每分钟音节数三方面均比其他类型移民高0.1-0.4个单位,只在口音方面略微逊色(图2实心点)。在加入原籍国、童年宗教信仰、成长环境、父亲职业等控制变量后,难民的语言水平优势稍有降低,但总体优势不变(图2空心点)。

图 2 基准和控制变量回归结果系数(12岁以后到达的移民)

机制检验

本文作者进一步采取多种方法检验结果稳健性。考虑到影响访谈表现出的语言水平可能有差异,比如谈论政治迫害和冲突等话题采用的高级词汇会拉高AoA,将特定词汇删除后进行回归(图2橙线)。考虑到由于难民身份识别的主观模糊性,将“多因”移民也视为难民进行回归。考虑样本中犹太人口较多,作者细分“犹太”与“非犹太”群体进行回归,对集体苦难记忆的描述可能造成更多犹太受访者被定义为难民;考虑到样本选择性的问题,加入来自英语国家的移民;将样本从12岁缩至14岁以上等等。这些都没有明显改变实证结果中难民的语言优势。

作者还特别考虑到二战时期东欧难民中有大量教育和英语水平较高的专业人员,排除1933年以后的移民进行回归,这使得难民在句法(即平均语句长度)上的优势消失,也印证了语言句法上的优势可能来源于良好的社会经济条件。

最后,研究者又采用新移民调查(NIS)的首期数据作为参照,受调者为2003年5~11月间获永居权的移民,检验当代的美国难民是否仍有语言优势。他们选择学界广泛使用的“是否说英语”和“英语水平是否较好”两个变量衡量英语水平,加入年龄、性别、移民时长等人口特征和教育年限、成长地区、宗教等社会经济特征作为控制变量,又控制了难民是否参加政府支持的语言课程。结果发现,难民比其他类型移民更可能会说英语,但水平上并无显著区别。

总 结

这篇文章将质性的访谈材料进行了定量分析,利用语言学方法多层次地衡量了语言水平,给未来基于文本史料的移民研究提供了经典的范例。作为美国移民中的特殊群体,难民长期表现出的融入优势是因为他们有意或无意地参与了提高其语言能力的行为,而各类扶助政策或许对该优势起到了推动作用,却不是其产生的必要条件。难民并不指望短期内能返回家园,让他们更可能参与当地生活并依靠美国的教育体系和比其他国家更为开放的劳动力市场寻找到工作、住房和社交网络,所以学习英语的动力也更高。

文献来源: Abramitzky, R., Boustan, L., Catron, P., Connor, D., & Voigt, R. (2023). The Refugee Advantage: English-Language Attainment in the Early Twentieth Century(No. w31730). National Bureau of Economic Research.

轮值主编:何石军 责任编辑:彭雪梅

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载