当前位置: 首页 > 期刊 > 《遗传学报》 > 2000年第5期
编号:10257848
脊椎动物肌动蛋白顺式作用元件分布的进化
http://www.100md.com 《遗传学报》 2000年第5期
     作者:刘涛

    单位:军事医学科学院基础医学研究所, 国家生物医学分析中心生物医学信息实验室, 北京 100850

    关键词:脊椎动物;肌动蛋白;5′调控区;顺式作用元件;进化

    遗传学报000503

    摘要: 具有组织和发育表达特异性的基因,很可能具有独特的顺式作用元件的分布模式,这种模式在很大程度上决定表达的特异性。脊椎动物肌动蛋白各亚型的表达具有严格的组织特异性。为改进和完善1种顺式元件匹配预测方法,在实 验资料的基础上,统计出5种顺式元件的核苷酸分布权重矩阵模式,对脊椎动物肌动蛋白基因的5′调控区进行顺式元件的匹配预测和序列分析,获得了相应亚型的特异性的顺式元件编码分布模式,并分析了其进化趋势。

    中图分类号: Q756 文献标识码: A 文章编号: 0379-4172(2000)05-0391-09
, 百拇医药
    Evolution of Distribution Patterns of cis-Acting Elements in 5′Regulative Regions of Vertebrate Actin

    LIU Tao

    (Institute of Basic Medical Sciences, Academy of Military Medical Sciences, Lab. of Computer Analysis for Biomedical Information, National Center of Biomedical Analysis, Beijing 100850, China)

    Abstract: Actins are expressed in a rigorous tissue-and development-manner which implies tthat there most probably are some unique distribution patterns of cis-acting elements in their 5′regulative regions. We improved a method to predict cis-acting element and constructed nucleotide distribution weight matrixes of 5 cis-acting elements which are concerned in vertebrate actin genes’ transcription regulation. Using this method, we matched these factors in 5′ regulative regions of vertebrate actin genes by comparing the sequences with these matrixes, and got six isotype-specific distribution models of these cis-acting elements. The evolutionary trends of the six models were also analyzed. ′regulative regions. We improved a method to predict cis-acting element and constructed nucleotide distribution weight matrixes of 5 cis-acting elements which are concerned in vertebrate actin genes’ transcription regulation. Using this method, we matched these factors in 5′ regulative regions of vertebrate actin genes by comparing the sequences with these matrixes, and got six isotype-specific distribution models of these cis-acting elements. The evolutionary trends of the six models were also analyzed.
, 百拇医药
    Key words: vertebrate; actin; 5′ regulative region; cis-acting element; evolution

    基因表达模式失常会导致各种病变[1,2],因而调控表达模式的各种因子可能是医疗潜在的有效目标[3]。真核转录调控的基本机制,一般认为,反式转录调控因子分别与相应的顺式作用元件结合[4],而顺式元件有一定的分布模式,使反式因子相互协调,共同对基本转录起始复合体进行调控作用[5];不同的顺式元件分布模式,在很大程度决定着不同 的特异性表达模式[6]

    肌动蛋白家族在进化上极其保守,各成员的表达具有物种无关的组织特异性[7]。脊椎动物肌动蛋 白家族至少编码6种蛋白,2个横纹肌型(α-心肌型,α-骨骼肌型),2个平滑肌型(α-血管平滑肌型,γ-内脏平滑肌型),和2个细胞质型(ρ和亚型)[7]。成体肌肉细胞表达的肌动蛋白中以该肌肉亚型的为主[7~9];两种细胞质型肌动蛋白则以不同的比率表达于不同类型的所有非肌细胞中,但总以β型为多[10]。各亚型的氨基酸序列同源性非常高 (>90%),其转录调控区序列却有较大差异。这无疑是与转录调控紧密关联的。本文改善了1种最新模式匹配方法[11],利用实验得到的相关顺式元件的序列,统计出5种顺式元件的核苷酸分布权重矩阵模式,对脊椎动物肌动蛋白基因5′调控区的核酸序列进行了顺式元件的模式匹配分析和序列分析,获得了顺式元件的6种亚型特异性的编码分布模式,并分析了其进化趋势。
, 百拇医药
    1 数据和方法

    1.1 5′调控区核酸序列数据以及顺式作用元件序列数据的采集

    肌动蛋白基因5′调控区(本文指转录起始位点上游)序列数据源自EMBL核酸数据库第52版本(1997年10月)(表1)。本文选取肌动蛋白转录调控研究中涉及到的资料较完善的、较重要的5种顺式元件作为分析对象:SRF结合位点,结合蛋白是SRF,可诱导TFIID的构象优化,利于转录起始复合体的组装[14];Elk?结合位点,结合蛋白是Elk?,可以与SRF、SRF结合位点协同形成复合体,对转录起正调控作用,复合体的形成对这两种位点间的方向及距离的要求不高[15];MyoD结合位点,结合蛋白是MyoD,它对肌肉特异性基因起正调控作用[17,18],是引起细胞成肌分化的主要基因产物[19];YY1结合位点,结合蛋白是YY1,根据所结合基因序列的不同,它可以增强或削弱基因的转录[20];数 据取自转录因子数据库TransFac3.3版本(1998年1月)。
, 百拇医药
    表1 脊椎动物肌动蛋白基因5'调控区序列范围一览表

    Table 1.Range of 5' regulation region of vertebrate actin genes 物种Species

    代号Code

    亚型Subtype

    范围Range

    EMBL来源Origin in EMBL

    智人

    Homo sapiens

    HSCA

    心肌cardiac
, http://www.100md.com
    -485

    HSACTCA,HSACTCA1

    HSSK

    骨骼肌skeletal

    -707

    HSSAACT,S57815

    HSSA

    平滑肌α smoothα

    -1746

    HSACTAF,HSACTSA

    HSSG

    平滑肌γsmoothγ
, 百拇医药
    -657

    HSACTSG1/2,HSACTSG

    HSCB

    细胞质βcytoplasmicβ

    -2013[12]

    HSACTBPR,HSACCYBB

    HSCG

    细胞质γcytoplasmicγ

    -474

    HSACTGA,S57813

    牛
, 百拇医药
    BTSK

    骨骼肌skeletal

    -2779

    BT02285

    Bos taurus

    家猪

    SSSK

    骨骼肌skeletal

    -1929

    SS16368

    Sus scrofa

    小鼠
, 百拇医药
    Mus musculus

    MMC

    心肌cardiac

    -676

    MMACTCA1

    MMSK

    骨骼肌skeletal

    -879

    MMACTSK1A,MMACASA

    MMSA

    平滑肌α smoothα

    -1074
, http://www.100md.com
    MMU63129,MMAACT

    MMSG

    平滑肌γsmoothγ

    -1076

    MMGAS1,MMGAS2

    MMCG

    细胞质γcytoplasmicγ

    -964

    MMGA

    大鼠

    Rattus norvegicus

    RNSK
, http://www.100md.com
    骨骼肌skeletal

    -191

    RNAC02,RNACSKA

    RNSA

    平滑肌α smoothα

    -7115

    S76011

    RNCB

    平滑肌βsmoothβ

    -233

    RNAC01,RNJACCYB

    田鼠
, 百拇医药
    CGCB

    细胞质βcytoplasmicβ

    -195^

    CG20114

    Cricetulus griseus

    原鸡

    Gallus gallus

    GGCA1

    心肌1cardiac 1

    -1090

    GGACACA

    GGCA2
, 百拇医药
    心肌2cardiac 2

    -298

    GGACTAC

    GGSK

    骨骼肌skeletal

    -264

    GGACAREG,GGACASK

    GGSA

    平滑肌α smoothα

    -1013

    GGASMA01

    GGCB
, 百拇医药
    细胞质βcytoplasmicβ

    -542[13]

    GGAC01

    肯尼亚爪蟾

    XBCA

    心肌cardiac

    -789

    XLACTPRD

    Xenopus borealis

    非洲爪蟾

    Xenopus laevis

, 百拇医药     XLCA

    心肌cardiac

    -778

    XLACTCAG

    XLSK2

    骨骼肌2skeletal 2

    -416

    XLACTA2

    XLC5

    细胞质5cytoplasmic5

    -491

    XLACTIN5A
, http://www.100md.com
    XLC8

    细胞质8cytoplasmic8

    -526

    XLACTIN8A

    Xenopus tropicalis

    XTCA

    骨骼肌2skeletal 2

    -184

    XTACTA2

    鲤鱼

    CCCB

    细胞质βcytoplasmicβ
, http://www.100md.com
    -209

    CCACTBA

    Cyprinus carpio

    草鱼

    Ctenopharyngodon idella fugu rubipes

    CICB

    细胞质βcytoplasmicβ

    -210

    CIACTB

    FRCA2

    心肌2cardiac 2
, 百拇医药
    -766

    FR38960

    FRCA3

    心肌3cardiac 3

    -871

    FR38961

    FRSK1

    骨骼肌1skeletal 1

    -730

    FR38850

    FRSK2

    骨骼肌2skeletal 2
, 百拇医药
    -735

    FR38958

    FRCB1

    细胞质β1cytoplasmicβ1

    -732

    FR37499

    Oryzias latipes

    OLCB

    细胞质βcytoplasmicβ

    -843

    S74868

    注:“$”“∧”的序号分别根据与智人同一基因的比较而定
, http://www.100md.com
    Note:'$'and '∧'thesenumber are defined in comparison with the same genes of human

    1.2 顺式作用元件的定位方法

    对某种顺式元件的所有序列数据进行对准,统计出每个位置A、C、G、T和空格的出现频数,从而得到其核苷酸分布权重矩阵,并按照公式1计算每个位置的保守性指数 C(i)[11] (1)

    其中P(i,b)代表在第i个位置上核苷酸b的相对频数。

    我们对Kerstin等[11]的模式匹配方法作了两方面改进。首先,原方法将4个连续的、保守性指数之和最高的位置定义为元件核心区,而大量实验证实该元件最为保守和重要的核心位置并不连续,因此原方法不能全面反映元件的核心保守信息,我们将其改进为4个不一定连续的、保守性指数之和最高的位置,并定义为元件核心位置;其次,我们为原方法增设了匹配阈值的确定方法,计算矩阵样品序列与矩阵模式间的匹配得分,排除得分偏离模式中心较远的(如果有的话),从剩余得分中选取最小值作为匹配得分阈值(不得高于肌动蛋白样品的匹配得分值),得分不低于阈值的序列片段即被检出;这个阈值远高于按统计学推算的随机序列的阈值,从而在很大程度上降低了错检的几率。
, 百拇医药
    首先用公式(2)计算未知序列片段与元件核心位置模式间的匹配得分(core _sim): (2)

    其中score (b, j)代表矩阵第j个位置上核苷酸b的值,max score (j)指:

    在核心位置匹配得分不低于相应阈值的情况下,进一步用公式(3)计算该序列片段与整个元件模式间的全长匹配得分(mat _sim): (3)

    其中n代表该元件的长度。在全长匹配得分也不低 于相应阈值的情况下,即判定该片段是此种元件。

    2 结果
, http://www.100md.com
    2.1 同一物种不同亚型基因的横向分析

    图1显示,同物种不同亚型间的元件分布有着显著差异,一是同种元件虽然在各种亚型中都存在,但数量和分布明显不同,如智人SRF结合位点,心肌型有4个,分别位于 -243、-206、-155和-115,骨骼肌型有3个,分别位于-231、-185和-104,π平滑肌型有2个,分别位于-127和-77,平滑肌型有3个,分别位于-439、-116和-79,ρ细胞质型有1个,位于-68,细胞质型有1个,位于-98;另一种差异表现是,同种元件并不出现在所有亚型当中,如Fugu rubripes SRF结合位点的分布,心肌型中没有这种元件,而在骨骼肌型和ρ细胞质型中则有。

    图1 不同物种自身各型肌动蛋白基因5'调控区顺式元件的分布图代SRF结合位点,代表MyoD结合位点,分别代表正向的反向的Elk-1结合位点,分别代表抑制性的和增强性的YY1结合位点
, http://www.100md.com
    Fig.1 Distributionof cis-acting elements in 5' regulative regions of different species'actin genesis SRF binding site,is MyoD binding site,and are Elk-1 binding sites in positive and reverse direction respectively, and are negative nd positive YY1 binding sites respectiely
, 百拇医药
    2.2 不同物种同一亚型基因的纵向分析

    2.2.1 脊椎动物β细胞质型肌动蛋白基因5′调控 区顺式元件的分布如图2所示。在 -65~-70位置上有1个SRF结合位点,其序列在从硬骨鱼到智人的各物种中非常保守。哺乳纲在-76/-73位置增加了1个序列相同的Elk?结合位点cgTTCCgaaa;鲤鱼和草鱼在-35位置上有1个序列相同的起负调控作用的YY1结合位点tgccgTCATataaaaga。

    图2 脊椎动物β细胞质型肌动蛋白基因5'调控区顺式元件分布图

    Fig.2 Distribution of cis-acting elements in 5'regulative regions of vertebrate β cytoplasmic actin genes
, 百拇医药
    2.2.2 脊椎动物细胞质型肌动蛋白基因5′调控区顺式元件的分布如图3所示。在 -95~-99和-94~-98位置分别有1个SRF结合位点和1个起抑制作用的YY1结合位点,其序列在爪蟾、小鼠和智人中非常保守。哺乳动物在-147/-148位置新增MyoD结合位点gcccCAcgTGtccc,省去了爪蟾在-412/-446的1个保守的SRF结合位点和 -396/-431的1个保守的起抑制作用的YY1结合位点。

    图3 脊椎动物γ细胞质型肌动蛋白基因5'调控区顺式元件分布图

    Fig.3 Distribution of cis-acting elements in 5'regulative regions of vertebrate γ cytoplasmic actin genes

, 百拇医药     2.2.3 脊椎动物π平滑肌型肌动蛋白基因5′调控区顺式元件的分布如图4所示。鸟纲和哺乳纲有两个非常保守的SRF结合位点,它们的位置和序列几乎相同。哺乳纲有1个序列保守的起负调控作用的YY1结合位点,位于-500~-515的位置上。除上述之外的元件分布都是哺乳纲各物种自身特有的元件分布。

    图4 脊椎动物α细胞质型肌动蛋白基因5'调控区顺式元件分布图

    Fig.4 Distribution of cis-acting elements in 5'regulative regions of vertebrate α cytoplasmic actin genes

    2.2.4 脊椎动物平滑肌型肌动蛋白基因5′调控区顺式元件的分布如图5所示。在智人和小鼠间有4个顺式元件在序列和位置上保守,从5′到3′依次为起增强作用的YY1结合位点、SRF结合位点、MyoD结合位点和另一个SRF结合位点。
, 百拇医药
    图5 脊椎动物γ平滑肌型肌动蛋白基因5'调控区顺式元件分布图

    Fig.5 Distribution of cis-acting elements in 5'regulative regions of vertebrate γ smooth muscle actin genes

    2.2.5 脊椎动物骨骼肌型肌动蛋白基因5′调控区顺式元件的分布如图6所示。在-100附近有1个SRF结合位点,序列在各物种中保守,进化历程中唯一较大变化就是在两栖纲中位置移到了-155附近;还有1个序列较保守的SRF结合位点,在硬骨 鱼中处于~-305的位置,在原鸡中位于-187,在哺乳纲处于-230附近;原鸡和哺乳纲之间有1个序列较保守的SRF结合位点,在原鸡中位于-142,在哺乳纲处于-180附近;可见,随着 进化向哺乳纲和鸟纲的分支,后两个位点的位置也相应出现了分支现象,而且,哺乳纲 在-230附近的SRF结合位点上叠加了1个序列相当保守的起抑制作用的YY1结合位点。
, 百拇医药
    图6 脊椎动物骨骼肌型肌动蛋白基因5'调控区顺式元件分布图

    Fig.6 Distributionof cis-acting elements in 5' regulative regions of vertebrate skeletal muscle actin genes

    2.2.6 脊椎动物心肌型肌动蛋白基因5′调控区顺式元件的分布如图7所示。从两栖纲开始出现SRF结合位点,两栖纲在-100左右的SRF结合位点到哺乳纲时移位到了-115附近,两栖纲在-235左右和-190左右的SRF结合位点到哺乳纲时略向上游移动,而到鸟纲时则分别向下游有较大位移,分别移到-205和-160左右,而且分别在元件的3′端和5′端叠加了1个抑制性的YY1结合位点和 1个MyoD结合位点。哺乳纲在-60独有1个MyoD结合位点;另外还有1个序列保守的MyoD结合位点,位于智人的-447和小鼠的-481,其序列与硬骨鱼-390的MyoD结合位点的序列较为保守;肯尼亚爪蟾-342和非洲爪蟾-335的MyoD结合位点的序列相同,与智人-397的MyoD结合位点的序列较为保守。两栖纲在-135附近的抑制性YY1结合位点在原鸡中移到了-125左右,在智人中偏移到了-154,并与1个智人特有的SRF结合位点相重叠。
, 百拇医药
    图7 脊椎动物心肌型肌动蛋白基因5'调控区顺式元件分布图

    Fig.7 distributionof cis-acting elements in 5' regulative regions of vertebrate cardiac actin genes

    3 讨论

    本文改进的顺式元件定位方法准确反映了元件的核心位置(本文中所定出的元件核心位置与实验结果相符);其次在不丢失已经为实验证实的元件的前提下,大大降低了错检几率。

    从结果来看,无论在何种进化阶段,同一物种不同亚型基因间的元件分布总是存在显著差异的,这与不同亚型的不同表达特异性是相对应的。随着物种进化,在各亚型的基因中分别形成序列和位置均非常保守的元件,这预示着它们对相应亚型基因共同的表达特性具有非常重要的意义(如π平滑肌基因中-76/-77和-126/-127的SRF结合位点是其组织特异性表达所需要的元件[21]),并构成了相应亚型特异性的元件分布模式。某些顺式元件虽为不同亚型模式所共有,但在序列上却有着明显的亚型特异性,这种序列上的差异,可能表现为对相同反式因子的反应程度的差异上;不同物种同亚型基因又各自具有本物种特有的元件分布,其生物学效应可能主要表现为同亚型基因在不同物种中的细微表达差异上。所有这些元件差异很可能导致以这些模式为模板组装起来的“转录调控机器”的不同上,体现为各种风格迥异的亚型特异性表达方式。
, 百拇医药
    脊椎动物同亚型肌动蛋白形成共同的时空表 达特性,相应的基因也形成共有的顺式元件分布模式,说明基因转录调控机制达到一种宏观稳定,但物种间也依然存在元件分布上的某些差异,这可能是与不同物种要适应不同的具体生存环境所相适应的,如心肌型和骨骼肌型基因,哺乳纲和鸟纲的分布模式间有较为明显的差异。

    结合实验,系统研究元件分布模式、基因表达模式、物种对基因产物的机能需求情况以及物种生存环境之间的关系,对从基因水平理解生命运做本质,理解我们与环境间的正确关系,理解许多由于基因表达模式失常而导致的病变的机理、并探索相应防治对策[1~3]是非常有意义的(目前已有人从这一角度探索心衰疾病的致病机理)。

    军事医学科学院创新启动基金

    参考文献

    [1] Zhang L, Zhou W, Velculescu V E et al. Gene expression profiles in normal and cancer cells. Science, 1997, 276: 1268~1272.
, 百拇医药
    [2] Bargou R C, Jurchott K, Wagener C et al. Nuclear localization and increased levels of transcription factor YB-1 in primary human breast cancers are associated with intrinsic MDR1 gene expression. Nature Med., 1997, 3: 447~450.

    [3] Wang X M, Zinkel S, Polonsky K et al. Transgenic studies with a keratin promoter-driven growth hormone transgene: Prospects for gene therapy. Proc. Natl. Acad. Sci. USA, 1997, 94: 219~226.

    [4] Struhl K. Chromatin structure and RNA polymerase II connection: Implications for transcription. Cell, 1996, 84: 179~182.
, 百拇医药
    [5] Novina C D, Roy A L. Core promoters and transcriptional control. Trends in Genetics, 1996, 12: 351~355.

    [6] Chen S S, Ruteshouser E C, Maity S N et al. Cell-specific in vivo DNA-protein interactions at the proximal promoters of the proalpha 1(I) and the pro alpha 2(I) collagen genes. Nucleic Acids Res., 1997, 25: 3261~3268.

    [7] Vandekerckhove J, Weber K. Chordate muscle actins differ distinctly from invertebrate muscle actins: the evolution of the different vertebrate muscle actins. J. Mol. Biol., 1984, 179: 391~413.
, 百拇医药
    [8] Hayward L J, Schwartz R J. Sequential expression of Chicken actin genes during myogenesis. J. Cell Biol., 1986, 102: 1485~1493.

    [9] Gabbiani G, Schmid E, Winter S et al. Vascular smooth muscle cells differ from other smooth muscle cells: predominance of vimentin filaments and a specific α-type actin. Proc. Natl. Acad. Sci. USA, 1981, 78: 298~302.

    [10] Erba H P, Eddy R, Shows T et al. Structure, chromosome location, and expression of the human gamma-actin gene: differential evolution, location, and expression of the cytoskeletal beta-and gamma-actin genes. Mol. Cell Biol., 1988, 8: 1775~1789.
, http://www.100md.com
    [11] Kerstin Q, Kernelie F, Holger K. MatInd and MatInspector: new fast and versatile tools for detection of consensus matches in nucleotide sequence data. Nucleic Acids Res., 1995, 23: 4878~4884.

    [12] Ng S Y, Gunning P, Liu S H et al. Regulation of the human beta-actin promoter by upstream and intron domains. Nucleic Acids Res., 1989, 17: 601~615.

    [13] Thomas A K, Nicholas T, Stephen H H. The nucleotide sequence of the chick cytoplasmic beta-actin gene. Nucleic Acid Res., 1983, 11: 8287~8301.
, http://www.100md.com
    [14] Zhu H, Roy A L, Roeder R G et al. Serum response factor affects preinitiation complex formation by TFIID in vitro. New Biologist, 1991, 3: 455~464.

    [15] Treisman R, Marais R, Wynne J. Spatial flexibility in ternary complexes between SRF and its accessory proteins. EMBO J., 1992, 11: 4631~4640.

    [16] Schroeter H, Mueller C G F, Meese K et al. Synergism in ternary complex formation between the dimeric glycoprotein p67SRF, polypeptide p62TCF and the c-fos serum response element. EMBO J., 1990, 9: 1123~1130.
, 百拇医药
    [17] Lassar A B, Buskin J B, Lockshon D et al. MyoD is a sequence-specific DNA-binding protein requiring a region of myc homology to bind to the muscle creatine kinease enhancer. Cell, 1989, 58: 823~831.

    [18] lassar A B, Weintraub H. Transfection of a DNA locus that mediates the conservation of 10T 1/2 fibroblasts into myoblasts. Cell, 1986, 47: 649~656.

    [19] Sassoon D, Lyons G, Wright W E et al. Expression of two myogenic regulatory factors myogenin and MyoD1 during mouse embryogenesis. Nature, 1989, 341: 303~307.
, 百拇医药
    [20] Ajay S, Kathryn C. An analysis of genes regulated by the multi-functional transcriptional regulator Yin Yang-1. Nucleic. Acid. Res., 1994, 22: 5151~5155.

    [21] Hautmann M B, Thompson M M, Swartz E A et al. Augiotensin II-induced stimulation of smooth muscle alpha-actin expression by serum response factor and the homeodomain transcription factor MHox. Circ. Res.,1997, 81: 600~610.

    1999-02-03

    1999-12-30, 百拇医药