在研究人口迁移方面,中国姓氏有着得天独厚的优势。一方面,中国是世界上最早使用姓氏的国家,由于受儒家文化影响,中国人一般不会改姓,这使得中国姓氏的传递具有很好的稳定性和可靠性。另一方面,中国地域广阔,行政区划层级丰富,具有很好的空间分辨率,特别适合将姓氏分布与地理信息相结合,研究人口迁移的相关问题。
以姓氏分布为基础,利用不同空间尺度的系统分析,配合运用指标分析、聚类分析、因素分析等社会统计学的研究方法,可以探讨与人口迁移相关的许多问题,如大规模的人口迁移事件、地理隔离对群体结构的影响、人口迁移率的计算等,为研究人口迁移问题提供新的视角。
姓氏分布与大规模人口迁移
大规模的人口迁移会增加迁入地的姓氏多样性,导致迁入地和迁出地的姓氏分布呈现较高的相似性,因此,通过考察不同地区姓氏分布的特点,能够判断哪些地区曾发生过大规模的人口迁移,从而为史料中记载的人口迁移事件提供佐证。我们利用全国12.8亿人的姓氏数据,根据同姓率和姓氏距离两个指标,对我国历史上出现的一些大规模人口迁移事件进行了分析。
同姓率的概念最早由达尔文提出,用来估算近亲结婚的比例,其意指是在一个地区随机选取两个人,而他们具有相同姓氏的概率。显然,一个地区的姓氏数量越多,每个姓氏的人数越平均,同姓率就越小,说明该地区有较好的姓氏多样性,很有可能是人口的迁入地。对比我国的各个地区,可以发现,长江中下游地区有较低的同姓率和很好的姓氏多样性,这与北宋南宋时期大量移民从黄河流域迁移到长江流域的史实是一致的。相反,在某些比较隔绝的少数民族聚居区,遗传漂移占主导作用,导致姓氏比较单一,例如甘肃省广河县的20多万人口中有17万人姓马,同姓率很高。而同样是少数民族聚居地的嘉峪关、曲靖等城市,由于历史上曾经作为物质和文化交流的中心,吸引了大量外来人口,其同姓率比普通城市还低。
姓氏距离是在地区间同姓率的基础上得到的,反映的是每一个姓氏在不同地区所占人口比例的相似程度,相似性越高,姓氏距离就越小,说明两地之间可能存在人口迁移。在省级层次上,我们通过聚类分析发现东北三省和山东虽然隔着北京、天津、河北等省份,但他们的姓氏距离却最小,这反映了“闯关东”的社会移民现象。姓氏距离还能考察城市之间的移民现象,比如新疆石河子市,与中原地区很多城市的姓氏距离远小于其与周围地区的姓氏距离,这是因为石河子的大部分人口是来自河南、安徽、陕西、江苏等地的支边建设者