《西藏日报》 《西藏日报藏文版》 《人民日报藏文版》 《西藏商报》 《西藏法制报》 《西藏法制报藏文版》

2021年06月28日

第一问:

世居西藏各民族源流三问

—西藏民族大学高原人群遗传基因科研成果一瞥

本报记者 孙开远

图灵二进制是电脑的运行密码。

遗传基因是生命的运行密码。

分子人类学领域很早就开始关注世居西藏各民族源流问题。

从上世纪80年代至今,国内外多个科研团队通过对相关遗传基因的统计分析,对世居青藏高原民族源流问题做了研究,其中的主流观点是:世居西藏各民族在史前时代来自东亚北方,与汉族和西南地区许多少数民族同源,并可能从东南亚和东亚进藏。

在已有研究的基础上,西藏民族大学医学部康龙丽团队在做高原人群健康样本分析研究的同时,也试图回答有关世居西藏各民族源流的三个问题。

相关研究论文早前已在《分子学进化杂志》等国内外专业刊物上陆续发表。

从哪里来?

现在的人们到青藏高原有陆地和空中多条路线选择,而史前人类又是从哪里走上青藏高原的呢?

为了找到更明确的答案,西藏民族大学康龙丽研究团队联合复旦大学现代人类学教育部重点实验室进行了世居西藏各民族37个Y染色体多态性位点的基因分型。

众所周知,人类的基因存在于人体的细胞核和线粒体中,细胞核里有23对染色体,其中有一对决定人的性别。女性的性别基因被命名为XX染色体的组合,男性的性别基因被命名为XY染色体的组合。

Y染色体只能由父亲传给儿子,其基因片段相对较短,遗传与变异遵循一定规律。以检测Y染色体相关位点的遗传变异规律,并以统计学分析计算现在生活在不同地区的人在一两代甚至上万代以前时间跨度上的遗传关系以及在地域跨度上的联系,是国际分子人类学界的常用方法。这个方法用于法医学已经10余年。所以,通过检测Y染色体多态性来追踪西藏自治区主要民族群体的起源迁徙和群体遗传关系是最好的办法。

目前,世界上已发现有20多种类型的Y染色体单倍型,被分别用A到Z命名,其中,被命名为O、C、D、N、P的Y染色体广泛分布在东亚地区。进一步追溯,以上几种类型的下游,标记为O3*-M122、O1a*-M119、O2a*-M95、C*-M130、D*-YAP和P*-M35的Y染色体,在东亚群体中分布广泛,遗传变异类型多样,其中包含了与东亚人类相关的起源和迁徙细节。

汉族和青藏高原各民族中普遍存在同一种标记为O3*-M122的Y染色体。由于汉藏族群的成功扩张,这也是Y染色体O下游频率最高、分布最广泛的一个类型。

康龙丽研究团队从西藏自治区各地采集了7个地区康巴、卫藏、安多3个大方言区的藏族男性染色体样本588份、僜人样本120份,珞巴族样本130份、门巴族样本34份、夏尔巴人样本87份、定日县藏族样本113份和工布藏族样本104份。

经检测,藏族群体的Y染色体O、D比例占78.64%;夏尔巴人群体占95.41%;僜人群体占93.67%;珞巴族群体O、D比例占56.16%。在研究过程中,康龙丽团队把目光投向O3*-M122下游的亚群,标记为O3a3c*-M134和O3a3c1*-M117。通过对这两类Y染色体单倍型的研究,能够更清晰地追寻到世居西藏地区各民族的迁徙、扩散的信息。

研究发现,O3a3c*-M134和O3a3c1*-M117在东亚、东南亚群体中平均频率为25%-35%,而在青藏高原群体中的频率从20.9%(那曲市藏族群体)到超过90%(僜人群体)不等;在中印东部交界地区的两个藏缅语族人群中频率分别为85%和76%,而在其他的印度和巴基斯坦群体中没有发现。这说明,青藏高原的人群与南亚次大陆的人群在遗传血缘上是完全不同的。

经研究,复旦大学李辉团队得出结论,汉藏语系起源于桑干河流域的磁山文化及上游大同境内的前体人群,之后南北分化为仰韶文化和红山文化。

在用统计分析方法,计算、比较了Y染色体O3a3c*-M134和O3a3c1*-M117在东亚一带的频率分布规律后,康龙丽团队得出结论:

世居西藏的各个民族都有着这两种主要类型,他们都来自新石器时代的中原地区,迁入青藏高原喜马拉雅山区可能有东、北两条路线。东线是从四川省、云南省迁徙至喜马拉雅山区域;北线是经过青海省到喜马拉雅山区域。

研究结果还显示,在西藏自治区这5个世居人群中,珞巴族群体在遗传关系上距离藏族群体近,而僜人群体跟羌语支群体和东南藏缅语族群体遗传关系较近。这些民族,无论哪个,都是与汉族同源的汉藏语系民族。

第二问:

谁先来?

藏缅语族的各个民族大多可以追溯到中原的仰韶文化,在新石器时代晚期和青铜时代分数批从不同路线南迁,有些进入青藏高原。青藏高原居住着近20个民族,其中包括藏族、门巴族、珞巴族、僜人和夏尔巴人5个藏缅语族的世居人群。

从地理位置上看,青藏高原靠近中亚、西欧亚和南亚。史前时期,除了有东亚北方藏缅语族人群迁徙高原外,有没有其他地区人类也迁徙到高原?在这5个世居西藏的群体中,迁徙顺序是怎样的呢?

在人体细胞核外,还有一种基因,遗传学界将其命名为mtDNA,也就是线粒体DNA。作为细胞核外的遗传物质载体,线粒体具有在分子人类学研究中更特别的特征,因为它大小只有细胞核内基因的四分之一,但突变率却是其10倍以上, 只能由母亲遗传给子女,并只能由女儿传下去。

与Y染色体类型相比,人类线粒基因则更加多样,主要有近40种,被分别用字母和字符来标记,其中东欧亚型有标记为A、B、C、D、E、F、G、Y这几大类。

康龙丽团队收集了藏族、门巴族、珞巴族、僜人和夏尔巴人这5个藏缅语族的世居民族群体共计1005份线粒体样本。根据线粒体序列和编码区25个位点的分型信息,康龙丽研究团队共观察到62种不同的单倍群,分别采用了主成分分析和多维尺度分析两种方法,考察了青藏高原地区人群与亚洲其他群体的关系,并得出了结论。

通过对西藏世居各民族群体的母系遗传结构分析,西藏自治区藏族群体母系遗传成分也主要来自于东亚北方。

从线粒体DNA来看,藏族群体具有多重起源,以被命名为M62、A、C*、D*和M9*的单倍群为代表,曾被认为是藏族群体一个重要来源的中亚地区,并没有产生大规模遗传贡献。分析显示,藏族群体与中亚群体的距离较远,中间隔着北亚群体,故推测在母系遗传上,藏族母系同父系同样具有北方起源特征。在藏族群体各类型线粒体库中也没有发现高频率南亚地区线粒体类型。

这说明,喜马拉雅山在现代人群迁徙中起到极强的遗传阻隔作用。

从线粒体研究结果来看,门巴族和珞巴族群体距离南方藏缅语族群体较近,而夏尔巴人群体距离北方藏缅语族群体较近。僜人群体介于南方藏缅语族群体和北方藏缅语族群体之间,处于距离西藏自治区其他藏缅语族群体较远的另一侧。这说明僜人群体在进化过程中可能存在与其他人群长期隔离,并存在某个人数较少时期。

研究还发现,藏缅语族南方人群南迁的历史更久,线粒体已经积累了大量独特的多样性。门巴族和珞巴族与他们遗传距离更近,说明他们到达现在居住地的时间更早。在世居青藏高原的5个民族群体中,门巴族和珞巴族比藏族和夏尔巴人更早踏上青藏高原。

第三问:

怎么适应?

青藏高原平均海拔在4000米以上,稀薄的空气会给人带来不适——但世居西藏的各民族却可以在这样的环境下繁衍生息。

高原人群身体的高原适应能力一直吸引着多国科学家进行研究。

遗传学认为,高原低氧适应可能是多基因相互作用的结果。通过比较世代居住在高海拔群体和低海拔群体,国内外科学家已经发现了包括南美洲安第斯人、东非的阿比西尼亚人和青藏高原各民族在内,在基因上存在不同方式的适应性。

2019年,中国科学院青藏高原研究所、兰州大学和德国马普进化人类学研究所学者领衔的团队在《自然》杂志发表研究成果。研究揭示,一件发现于青藏高原边沿夏河县的古人类下颌骨化石距今已有16万年,属于一个被称之为丹尼索瓦人的远古人类。这种古人类化石最早被发现于西伯利亚。

2020年11月,国家文物局召开的“考古中国”重大项目重要进展工作会上,科学家研究揭示,丹尼索瓦人曾长期生活在青藏高原。

有研究认为,世居西藏人群适应高寒缺氧环境的基因EPAS1来自丹尼索瓦人。

国内外学者还一致认为,标记为EPAS1、EGLN1、HMOX2等9个基因,在世居西藏各民族中发生变异,有助于适应高原缺氧环境。

西藏大学和美国凯斯西储大学有关研究分别揭示了藏族人群血液一氧化氮在高原低氧环境中的钝化调节机制,在加快血液流速的同时保护心血管系统不受到伤害。

线粒体是生物体的“能量工厂”,负责生命体的能量代谢。氧气代谢是否与线粒体基因也有关系呢?

西藏民族大学康龙丽研究团队采用二代测序法,对世居西藏5个民族的线粒体进行全测序分析,有了新发现。

夏尔巴人群体线粒体组成与藏族群体接近,存在M9a1a1c1b1、C4a3b1和A4e3a三个主要单倍群,其中C4a3b1、A4e3a为夏尔巴人所特有。这些线粒体的遗传与变异和高海拔适应有关。

夏尔巴人居住在喜马拉雅山区,以强悍的登山实力闻名于世。这两个类型的线粒体相应的两个位点中,原来的G3745A突变为A147T,T4216C突变为Y304H。这两个突变,在能量代谢活动过程中一方面减少机体耗氧量,另一方面又使血液释放氧气能力得到增强,从而使机体尽可能充分利用现有氧气。

如果把常染色体EPAS1、EGLN1等基因通过适量增加血红蛋白浓度,增强机体携氧量比作涡轮增压发动机,那么线粒体C4a3b1、A4e3a基因减少氧气消耗和提高利用效率的突变则是省油且热效率高的发动机。

也就是说,到目前为止,已经发现夏尔巴人同时具备上述两套适应高原缺氧的遗传机制。

生命密码的复杂和奇妙,难以想像。

图①:康龙丽教授在指导学生进行人类基因样本提纯。

图②:康龙丽(左三)团队合影。

图③:西藏民族大学研究生对采集到的血样进行提纯。

本报记者 孙开远 摄

图④:人类遗传关系示意图。

图⑤:汉藏语系演化示意图(图中数字为距今大致年数)。

康龙丽制图