-
质体蓝素(Phytocyanin,PC)是一类存在于植物中的古老超蛋白家族,该家族均有质体蓝素样结构域(Plastocyanin-like domain,PCLD),具有2个能形成二硫键的半胱氨酸(Cys),其中, 部分成员含有4个保守的铜离子结合位点:2个组氨酸(His)、1个半胱氨酸和1个甲硫氨酸(Met)或谷氨酰胺(Gln)[1-2]。根据铜离子结合位点的氨基酸残基类型、光谱和氧化还原性能、蛋白结构组分等特征,PCs家族分为4个亚家族:花青苷样蛋白(Uclacyanin-like protein,UCL)、漆树兰蛋白(Stellacyanin-like protein,SCL)、质体蓝素样蛋白(Plantacyanin-like protein,PLCL)和早期结瘤素样蛋白(Early nodulin-like protein,ENODL)[3]。UCL和PLCL有相同的铜离子结合位点(2个His,1个Cys和1个Met),但UCL属于嵌合型糖蛋白,其蛋白骨架中含有糖蛋白样结构域,而PLCL为非糖蛋白[3]。SCL的铜离子结合位点中Gln替代了Met,SCL和UCL家族不仅包含天冬酰胺(Asn)残基连接的N-糖基化位点, 还具有通过丝氨酸(Ser)和羟脯氨酸(Hyp)残基连接的O-糖基化位点[4]。ENODL与其它亚家族之间有高度的相似性,但该亚家族成员的蛋白骨架缺完整的铜离子结合位点,铜配位体中的4个氨基酸残基部分或全部被其它氨基酸残基取代[5]。研究发现,拟南芥(Arabidopsis thaliana)和水稻(Oryza sativa)中的大多数ENODLs是嵌合的阿拉伯半乳聚糖蛋白,其蛋白骨架包含N-端信号肽(Signal peptide,SP)和阿拉伯半乳聚糖蛋白样域(Arabinogalactan protein-like region,ALR)[5-6]。
PC家族中能结合铜离子的3个亚家族(UCL、SCL和PLCL)为电子传递体。研究显示,PCs在植物发育和抗逆过程扮演着重要角色[5, 7-8],PCs参与了植物对非生物胁迫的应激反应,如干旱胁迫、盐胁迫、冷胁迫和金属离子等[5, 9-11]。
全基因组分析是鉴定基因家族成员、阐明其生物学作用的首要步骤和有效途径。利用生物信息学分析方法对植物PC家族基因全基因组分析的报道不多,仅在拟南芥、水稻和大白菜(Brassica rapa)基因组中分别发现38、62和84条PCs基因[5-7]。铁皮石斛(Dendrobium officinale)为兰科石斛属植物中具有观赏价值和医药价值的一种附生兰,其基因组测序的完成为该物种PC基因家族(DoPC)的全基因组预测和生物信息学分析提供了宝贵资源,有助于了解该基因家族的潜在功能。本研究可为石斛属PC基因家族功能验证提供数据基础。
HTML
-
利用BLASTP搜索比对工具从铁皮石斛蛋白数据库中分别找出与拟南芥PCs(AtPCs)和水稻(OsPCs)相似度较高的序列(E-value < 0.001),经过SMART预测和Pfam数据库比对两种方法验证,在拟南芥和水稻中均有38条PC样蛋白序列(DoPCs)含有1个PCLD结构域。已知拟南芥基因组中含有38条PC基因[6, 15],在数量上与铁皮石斛的PC基因相同;而水稻和大白菜基因组中分别含有62条和84条PC基因,远多于铁皮石斛和拟南芥基因组中PC基因的数量。
对DoPCs家族成员的PCLD结构域进行多重序列比对分析,结果(图 1)表明:38条DoPCs蛋白序列均含有2个Cys残基,Cys在DoPCs家族中高度保守;19条DoPCs蛋白序列中含有4个完整的铜结合配体(His、Cys、His、Met/Gln),其中,11条为His、Cys、His、Met类型,8条为His、Cys、His、Gln类型。19个可结合铜的DoPCs蛋白归类为3个亚家族中:5个花青苷样蛋白(DoUCLs)、8个漆树蓝样蛋白(DoSCLs)和6个质体蓝素样蛋白(DoPLCLs);其余19个不含铜结合位点的DoPCs为早期结瘤素样蛋白(DoENODLs)(表 1)。多重序列比对发现在DoENODLs亚家族中,与其它亚家族的铜结合位点所对应的位置上有一些较保守的基序,这些氨基酸残基取代了His、Cys、His、Met/Gln,可能与结合铜有关。用亚家族名称命名后的DoPCs所对应的铁皮石斛基因ID、结构域数量及铜结合位点等配体信息见表 1。
名称Name 基因IDGene ID AA 信号肽Signal peptide PCLD 铜结合位点Copper-binding sites N-糖基化位点N-glycosylation sites ALR GAS DoUCL1 Dendrobium_GLEAN_10023378 148 — 1 H-C-H-M + NC + DoUCL2 Dendrobium_GLEAN_10044449 256 + 1 H-C-H-M + + — DoUCL3 Dendrobium_GLEAN_10077806 128 + 1 H-C-H-M + — — DoUCL4 Dendrobium_GLEAN_10077807 129 + 1 H-C-H-M + — — DoUCL5 Dendrobium_GLEAN_10129350 128 + 1 H-C-H-M + — — DoPLCL1 Dendrobium_GLEAN_10014563 170 + 1 H-C-H-M — + + DoPLCL2 Dendrobium_GLEAN_10014564 170 + 1 H-C-H-M — + + DoPLCL3 Dendrobium_GLEAN_10021763 220 + 1 H-C-H-M — + + DoPLCL4 Dendrobium_GLEAN_10070311 191 + 1 H-C-H-M — + + DoPLCL5 Dendrobium_GLEAN_10077794 128 + 1 H-C-H-M — + — DoPLCL6 Dendrobium_GLEAN_10092500 191 + 1 H-C-H-M — + + DoSCL1 Dendrobium_GLEAN_10027914 207 + 1 H-C-H-Q + + + DoSCL2 Dendrobium_GLEAN_10030280 175 + 1 H-C-H-Q + + + DoSCL3 Dendrobium_GLEAN_10066345 169 + 1 H-C-H-Q + + — DoSCL4 Dendrobium_GLEAN_10066346 169 + 1 H-C-H-Q + + — DoSCL5 Dendrobium_GLEAN_10066347 170 + 1 H-C-H-Q + + — DoSCL6 Dendrobium_GLEAN_10088776 200 — 1 H-C-H-Q + NC + DoSCL7 Dendrobium_GLEAN_10114547 189 + 1 H-C-H-Q + + + DoSCL8 Dendrobium_GLEAN_10136317 199 — 1 H-C-H-Q — NC — DoENODL1 Dendrobium_GLEAN_10008487 133 — 1 — — NC + DoENODL2 Dendrobium_GLEAN_10009350 175 + 1 — — + + DoENODL3 Dendrobium_GLEAN_10011247 187 + 1 — + + + DoENODL4 Dendrobium_GLEAN_10015510 193 + 1 — + + + DoENODL5 Dendrobium_GLEAN_10017023 179 + 1 — + + — DoENODL6 Dendrobium_GLEAN_10028538 204 + 1 — + + — DoENODL7 Dendrobium_GLEAN_10028670 158 + 1 — + + + DoENODL8 Dendrobium_GLEAN_10035898 220 — 1 — + NC + DoENODL9 Dendrobium_GLEAN_10037071 224 + 1 — + + + DoENODL10 Dendrobium_GLEAN_10041716 187 + 1 — + + + DoENODL11 Dendrobium_GLEAN_10045771 358 + 1 — + + + DoENODL12 Dendrobium_GLEAN_10047036 139 — 1 — + NC — DoENODL13 Dendrobium_GLEAN_10059911 220 — 1 — — NC + DoENODL14 Dendrobium_GLEAN_10061798 174 + 1 — + NC + DoENODL15 Dendrobium_GLEAN_10064039 254 + 1 — + + — DoENODL16 Dendrobium_GLEAN_10077812 131 + 1 — — — — DoENODL17 Dendrobium_GLEAN_10077815 187 + 1 — + + — DoENODL18 Dendrobium_GLEAN_10080274 179 + 1 — + + — DoENODL19 Dendrobium_GLEAN_10129392 173 + 1 — + + + AA:氨基酸序列的长度;Length of amino acid sequences; PCLD:(plastocyanin-like domain)PCLD结构域数量;ALR: (Arabinogalactan protein-like region)阿拉伯半乳聚糖样域;GAS:(C-terminal glycosylphosphatidylinositol signal)糖基磷脂酰肌醇锚定信号;+预测到; -未预测到;+ Predicted; -not predicted;NC:由于蛋白序列前端未预测到信号肽而未做阿拉伯半乳聚糖样域的预测; There was no prediction of arabinogalactan protein-like region. Table 1. The putative DoPCs named information
-
为进一步明确DoPCs家族成员序列结构特征,本文采用生物信息学分析方法预测了该家族成员蛋白骨架的N-端SP、ALR和GAS以及N-糖基化位点等。预测分析结果显示:有31条DoPCs骨架含有N-端SP,负责引导该链合成的蛋白质进入分泌通路[3]。采用big-PI Plant Predictor和PSORT在线软件预测结果显示:22条DoPCs含有GAS位点,而糖基磷脂酰肌醇锚定蛋白是一种膜蛋白,它可通过糖基磷脂酰肌醇插入内质网膜和质膜,主要负责携带蛋白定位至质膜上,与膜上的脂筏连接[22-23]。此外,有27条DoPCs含N-糖基化位点,可连接糖链[6]。
已知非邻接重复出现的Pro可以被羟基化作为阿拉伯半乳聚糖糖基化位点,而连续重复出现的Pro被羟基化为阿拉伯糖糖基化位点[5, 16]。当Ala、Ser、Thr、Gly和Pro在核心蛋白中为主要氨基酸组分,且Pro以基序为:[Ala/Ser/Thr/Gly]-Pro-X(0, 10)-[Ala/Ser/Thr/Gly]-Pro的非邻接重复方式出现,即为假定AG糖模块[17-19]。有研究发现,当Pro以基序为Ser-Pro2-4连续重复出现时,为假定的伸展蛋白糖模块;然而,Ser-Pro2-4基序中的Pro不完全羟基化时,可形成非邻接型的Pro模块[20]。在拟南芥的相关研究中把高度相似的非邻接型Ala/Thr/Gly-Pro基序和Ser-Pro基序均作为AG糖模块的代表。Mashifuchi等将[Ala/Ser/Thr/Gly]-Pro3-4基序也作为了假定AG糖模块[6]。本文结合前人的研究成果,将[Ala/Ser/Thr/Gly]-Pro-X(0, 10)-[Ala/Ser/Thr/Gly]-Pro和[Ala/Ser/Thr/Gly]-Pro3-4基序作为假定AG糖模块的预测规则。由于N-端SP作为分泌信号,是阿拉伯半乳聚糖蛋白(Arabinogalactan protein,AGP)的先决条件,因此,本文只对含有SP的31条DoPCs是否存在AG糖模块进行预测。经统计,共有26条DoPCs存在AG糖模块,预测为嵌合的AGPs,包括13条DoENODLs、1条DoUCLs、6条DoPLCLs和6条DoSCLs,其中,10条DoPCs预测包含伸展蛋白糖模块,有8条DoPCs既可以是伸展蛋白又可以是AGPs(表 2)。
Name 糖基模块Number of putative glycomodules [A/S/T]-P ([A/S/T]-P-X(0, 10)-[A/S/T]-P)X [A/S/T]-P-P [A/S/T]-P-P-P DoUCL1 - - - - DoUCL2 1 1 0 0 DoUCL3 0 0 0 0 DoUCL4 0 0 0 0 DoUCL5 0 0 0 0 DoPLCL1 0 2 0 0 DoPLCL2 0 2 0 0 DoPLCL3 2 8 0 1 DoPLCL4 1 3 1 0 DoPLCL5 2 0 0 0 DoPLCL6 2 2 2 0 DoSCL1 3 2 0 0 DoSCL2 0 2 0 1 DoSCL3 1 0 0 0 DoSCL4 1 0 0 0 DoSCL5 1 0 0 0 DoSCL6 - - - - DoSCL7 2 5 0 0 DoSCL8 - - - - DoENODL1 - - - - DoENODL2 0 0 1 0 DoENODL3 1 4 0 0 DoENODL4 0 3 0 0 DoENODL5 1 0 0 0 DoENODL6 0 5 0 1 DoENODL7 0 0 0 1 DoENODL8 - - - - DoENODL9 0 4 0 0 DoENODL10 1 4 0 0 DoENODL11 0 22 1 2 DoENODL12 - - - - DoENODL13 - - - - DoENODL14 - - - - DoENODL15 1 4 0 0 DoENODL16 0 0 0 0 DoENODL17 1 0 0 0 DoENODL18 1 0 0 0 DoENODL19 0 2 0 0 Table 2. Putative glycomodules in the putative DoPCs
根据DoPCs和AtPCs蛋白骨架中是否含有N-端SP、PCLD结构域、ALR和C-端GAS这几个部分,将其分为七类(图 2)[5]。类群Ⅰ的DoPCs成员有16个,其蛋白骨架包含所有以上4个结构域和基序;类群Ⅱ和Ⅲ在结构上与类群Ⅰ存在一定的相似,但分别缺少GAS和ALR,其中,归为类群Ⅱ的DoPCs和有10个,归为类群Ⅲ的DoPc有0个;类群Ⅳ同时缺失ALR和C-端GAS两个结构域,有4个成员被归为该类群;归为类群Ⅴ的6个成员和归为类群Ⅵ的2个成员都不存在N-端SP和ALR结构,但前者具有C-端GAS,而后者只具有PCLD这一个结构域;类群Ⅶ同时缺失ALR和C-端GAS,但存在2个PCLD,归为该类群的DoPc成员有0个。由于类群Ⅰ和Ⅱ中存在N-端SP以及足够参与糖基化反应的AG糖模块,可认为这两类中的基因家族成员是嵌合型的AGPs。类群Ⅲ和Ⅶ不含有铁皮石斛PC家族成员,在拟南芥、水稻和杨树中也有类似的现象,这有可能是由于基因在进化过程中失去功能,发生消亡导致[15]。
-
利用已知的38条AtPCs蛋白序列和预测得到的38条DoPCs蛋白序列全长,来构建系统发育树以分析其进化关系。系统发育树结果(图 3)表明:包含SP、PCLD和GAS的类群Ⅲ、包含SP和PCLD的类群Ⅳ及包含SP和2个PCLD的类群Ⅶ的成员较集中,聚集在一起,但每个亚家族的多数成员较为分散地聚集在一起。DoPLCL1/2、DoUCL1/2、DoUCL3/5、DoSCL3/4/5、DoENODL5/18、DoENODL3/10、DoENODL8/13、DoENODL4/15等8对旁系同源蛋白序列相似性较高,并且处于较近的分支上,表明它们之间很可能有功能冗余的现象。
-
为确定DoPC基因在铁皮石斛种子与菌根菌共生萌发过程中的表达水平,本文利用铁皮石斛体外非共生萌发种子(Do)和共生萌发种子(DoTcg)转录组数据进行DoPC基因的表达分析。结果(图 4)表明:16个DoPCs基因在与菌根真菌共生萌发的铁皮石斛种子中检测到表达,其中,DoUCL2、4、DoSCL6、7和DoENOD 3、7、14、17基因表达量较高,而DoUCL5和DoENODL1、17基因在非共生萌发的种子中未检测到表达。对比DoPCs基因在共生萌发和非共生萌发种子中的表达水平,除去3个在非共生萌发种子中未表达的基因,差异表达基因中大部分基因在共生萌发的种子中明显上调表达,只有DoENODL6基因下调表达。这些差异表达基因可能参与铁皮石斛种子与美孢胶膜菌共生萌发生物学调控。