当前位置: 首页 > 医疗版 > 疾病专题 > 中医疾病
编号:138591
Nature Genetics:PrediXcan算法可确定基因表达水平与疾病相关性
http://www.100md.com 2016年6月28日 Nature Genetics 2016.06.28
     最近,来自芝加哥大学的科学家开发出了一种新的计算方法,可以提高我们检测引发复杂疾病和生物性状的基因的能力。这种算法称为PrediXcan,可估算全基因组的基因表达水平,并将其与全基因组关联研究(GWASs)数据结合起来。与传统方法相比,PrediXcan算法能够更快、更准确地鉴定靶基因,相关研究结果发表在近期的Nature Genetics杂志上。

    该研究由芝加哥大学遗传医学研究助理Hae Kyung Im领衔,她指出:“PrediXcan算法通过了解基因型、基因表达水平(来自大规模转录组研究)和疾病关联(来自GWASs研究)之间的联系,可以告诉我们哪些基因更容易影响疾病或性状。这是能够解释基因调控机制的第一种算法,可以应用于任何遗传疾病或表型。”

    全基因组关联研究(GWASs)是一种可检测复杂疾病如糖尿病和癌症相关基因的重要工具。GWASs可通过识别单字母的DNA变异(更频繁地出现在患有疾病或具有目标性状的个体中),来确定这些基因间的关联。

    不过,这些基因变异的作用机制还不清楚。大多数疾病相关的基因变异并不能改变某个基因的功能,而只能改变细胞中这些基因的复制数量。而GWASs目前还无法确定,基因调控与致病基因表达水平之间的因果关系。

    为克服GWASs的这一局限,科学家进而进行了转录组研究(如美国国立卫生研究院的GTEx研究)以阐明基因表达和调控机制及其与疾病的关系,但转录组的研究也有很大的局限性,例如不能确定反向因果关系——基因的表达水平是否可被疾病所改变,或者疾病的产生是否归因于基因表达的改变。

    鉴于此,为了开发一种能够检测基因和性状之间关系,并能避免上述问题的方法,Im及其同事将转录组数据和GWASs数据整合到了一个单一的计算框架中,他们称之为PrediXcan。该方法使用PrediXcan算法,基于大规模转录组数据集(如GTEx),来了解基因组序列如何影响基因表达,进而可以通过该算法对任何全基因组序列或芯片数据集进行基因表达水平的估算。

    比如GWASs数据中已被测序的基因组,可以通过PrediXcan算法运行,生成一种基因表达水平谱,然后对该水平谱进行分析,就可以确定基因表达水平与疾病状态或目标特征之间的相关性。

    通过该方法,不仅可以识别潜在的致病基因,还可以确定其方向性——高或低水平的表达是否可能导致疾病或性状。由于该算法以序列数据而不是物理测量为基础,因此可以将基因表达的遗传决定组件和性状本身的影响因素及其他因素(如环境)区分开来。此外,该方法还可用于现有基因组数据的再分析,以高通量的方式重点解决机制问题,从而填补了GWASs研究的一大空白。

    不过,虽然PrediXcan算法可以一种高通量的方式确定基因和性状之间的联系,但是Im指出,因为该算法是基于基因组序列数据进行估算的,因此它对具有强烈遗传性的性状估算是最准确的。“然而,几乎所有的复杂性状或疾病都有遗传成分,因此该算法可用于预测这些遗传成分的影响,从而减少后续研究的复杂性。”Im说。

    《医学科学报》 (第34期 第5版 国际期刊), http://www.100md.com