-
微卫星又称为简单序列重复(SSR), 短串联重复(STR), 是以1~个碱基为重复单位组成的短串联重复DNA序列[1]。微卫星分子标记是基于PCR技术发展起来的一种分子遗传标记技术, 具有重复性好、共显性遗传、多态性位点含量高、实验操作简单、检测方法简便、对DNA质量要求不高等优点[2]。在亲本分析, 基因图谱构建, 确立遗传和进化关系, 遗传多样性分析等研究中得到了广泛的应用[3]。微卫星依据其来源分为两类: 基因组微卫星(GenomicSSR)和表达序列标签微卫星(SSR, EST-SSR) [4]。EST-SSR是基于EST序列开发的SSR, 相对于Genomic SSR引物开发过程简单, 成本低, 在物种间通用性较强[5]。随着基因组的发展, EST序列的数目在公共数据库内迅速增长(http://www.ncbi.nlm.Nih.gov), 为SSR标记提供了一个庞大的资源[2, 6]。
沙棘属(Hippophae)属于胡颓子科(Elaeagnaceae), 是多年生落叶灌木、小乔木或乔木, 风媒传粉, 雌雄异株, 具有固氮作用, 适应性极强, 主要分布于中欧和中亚地区[7]。依据Sun等[7]和Bartish等[8]学者的系统分类, 分为7个种和8个亚种。沙棘是集生态效益、经济效益和社会效益为一体的多用途树种, 因其果实富含Vc和沙棘油, 枝叶含高蛋白, 根系有根瘤等特点备受瞩目[9]。近些年, 随着DNA分子标记技术的不断发展与完善, 针对沙棘遗传多样性、亲缘关系和品种鉴定等的研究得到进展[10], 如利用RFLP、ITS、cpDNA等分子标记对沙棘进行了研究[7-8-11], 但利用SSR分子标记对沙棘的研究较少, 同时目前开发可用的沙棘SSR引物较少, 仅有孙燕琳等[12]利用葡萄SSR引物筛选适用于沙棘的SSR引物, Wang等[13]利用磁珠富集法开发的9对SSR引物和Jain等[14]利用EST开发的11对EST-SSR引物。为了丰富沙棘的SSR分子标记, 本研究通过对向阳沙棘转录组序列进行分析, 开发出大量EST-SSR标记, 为沙棘亲本分析、遗传多样性、遗传育种等研究提供支持。
HTML
-
对沙棘转录组中的EST序列去冗余后共收集17 383条具有SSR位点的序列, 其中包括复合SSR类型序列828条, 因其特殊性不计入SSR类型分析。在非复合的SSR类型中, 单核苷酸重复类型数量最多, 所占比例达到62.77%(10 392);其次是二核苷酸和三核苷酸重复类型, 所占比例分别为21.82%(3 613)和13.77%(2 279)。四核苷酸、五核苷酸、六核苷酸重复类型较少, 分别仅占1.45%(240)、0.09%(15)、0.10%(16)。
在所检测到的3 613个二核苷酸重复EST-SSR中, AT和AG两种类型的重复基元出现的次数较多, 分别为1 814个(50.21%)和1 521(42.10%)(图 1a)。在检测到的2 279个三核苷酸重复中, AAG为优势类型, 共783个(34.36%), ATC和ATA两种类型次之, 分别为400个(17.55%)和395个(17.33%)(图 1b)。
-
利用Primer 3.0为9 291条EST序列设计了适宜的SSR扩增引物, 剩余的8 092条序列没能得到合适的引物。从设计的引物中随机挑选179对二核苷酸、三核苷酸重复的EST-SSR引物进行PCR扩增检测, 发现142个位点能够在预期片段大小的位置扩增出清晰的条带, 扩增效率为79.33%。
选择92个位点的引物进一步结合M13荧光引物扩增16个蒙古沙棘个体, 并在ABI 3 130测序仪上检测各位点扩增产物(图 3), 发现40个位点在这些个体的扩增产物中找到2个以上的等位基因(表 1), 即呈现出多态, 多态位点比率为43.48%。从这40个多态位点中, 挑选出17个扩增效果稳定、且峰图清晰的EST-SSR位点, 其在所分析的天然蒙古沙棘种群中的等位基因个数为2~6个不等, 观测杂合度(HO)为0.083~0.875, 期望杂合度(HE)在0.180~0.750;分析得到该蒙古沙棘种群各位点平均期望观测杂合度为0.488, 平均期望杂合度为0.514。这17个位点的引物序列信息、扩增结果及多态性等见表 1。
引物编号
Primer pairs引物序列(5'-3')
Primer sequence (5' -3')重复基元
Repeat motif退火温度
Annealing temperatures/℃等位基因数量
Number of alleles等位基因大小
Allele size range/bp观测杂合度
(HO)Observed heterozygosity期望杂合度
(HE) Expected heterozygosityHs008 F: ACTCATGCCCATCACCTTTT (AT) 6 55 3 238 ~242 0.467 0.580 R: GCTCGTTGCCACTGTTACAA Hs032 F: GCAGTCCGGACAGTCAGAAA (GTT)7 55 2 268 ~274 0.800 0.498 R: CCAAAGCAAAACCACGCAGA Hs047 F: GTGCAAAAACCAGGAGTGCC (TAG)6 55 2 184 ~188 0.600 0.491 R: TACAACCCTGCTACCCCCAT HS097 F: CAGCCGCCCTCTGACTAAAA (AT)6 55 4 280 ~294 0.083 0.733 R: GCTTCGAGGAAGAATTACAGGGA Hsl00 F: CTTGGCTGCCCATCTCGATT (TA) 8 55 6 259 ~274 0.875 0.672 R: ACGAATAAACCCCAGAACAGT Hsll1 F: ACAACTCAGTCCGTACATATGGT (AG) 9 55 4 163 ~177 0.818 0.649 R: GCGGCTGGAATCATCTTGGA Hsl46 F: ACAAGCGTGTGAGGATTCTT (CTA)5 55 2 142 ~146 0.500 0.492 R: CGATGAGAGGCCGGCATATT Hsl49 F: ACATTCCCCTTTCACAGACCC (TAT)6 55 2 138 ~142 0.636 0.483 R:CCAGTTGGGATTTTCTTGTTTGAGT Hs177 F: TGCGTCTTGATTTGGCACTTC (AC) 8 55 2 271 ~273 0.286 0.500 R: ACTCCAGGGTTCTCAAAGGA Hs192 F: TCGCTTCAAAAGGGAACAACA (AT)7 55 4 251 ~265 0.500 0.469 R: GCACACATAACACCCGCTTC Hsl95 F: TCCTCCTGACTGTCTCGACC (TA)7 55 2 247 ~249 0.200 0.180 R: CCCTAGTGAAGCTCAGTTTTGC Hs227 F: CCTTAGCATCACCAAAGCGC (ACA)6 55 2 160 ~168 0.273 0.236 R: CCTTGTGTGCACATTTCTGCA Hs278 F: CGCAGCAGGTTGACAGACTA (CT) 9 55 4 170 ~176 0.500 0.451 R: TCAAACAACGCACTTTGGGC Hs282 F: TGTCTTGCTACTCCTCCTGC (CA) 8 55 3 269 ~273 0.556 0.593 R: ACAGCGTGTTAGGAAAGTTGC Hs284 F: CCCATCTTGCCTCATGCTGT (AT) 8 55 5 269 ~285 0.667 0.750 R: ACCACAAGTCACGGAAATCCT Hs296 F: TGAACGCTCATGATCAAAACGT (TGA)5 55 3 225 ~234 0.400 0.515 R: CAGCTGGTGGAAGTTGAGGT Hs297 F: TCATGCTCACTTCCGTTGCT (CAC)6 55 2 156 ~162 0.133 0.444 R: AGGATTGAGCGGCGTGTTAA 平均Mean 3 0.488 0.514 Table 1. Information of 17 Hippophae EST-SSR loci in transcriptome sequences and tested with 16 sample