-
杜鹃花是杜鹃花科(Ericaceae)杜鹃属(Rhododendron L.)植物的统称,是世界著名观赏植物,中国十大传统名花、云南省八大名花之一。杜鹃花在全世界有1 000余种,广泛分布于亚洲、北美洲和欧洲。中国是野生杜鹃花资源最丰富的国家之一。自《中国植物志》、Floral of China出版以后,近年来大量新种被陆续描述[1]和归并[2]。据统计,当前我国现存的杜鹃花属植物已经超过600种。除宁夏和新疆等干旱荒漠地带外,中国南北各省均有杜鹃花分布[3],其中,西南横断山脉片区野生杜鹃花资源最密集,是杜鹃花的多度中心和多样化中心。
我国横断山区杜鹃花的繁衍方式属于植物快速的辐射分化[4]与种间频繁的自然杂交[5-8],严重制约了该属植物的科学分类研究与准确鉴定,进而减缓了我国在杜鹃花资源挖掘与利用方面的进程。近年来,我国不同学者尝试用一代测序的方法(如DNA barcoding片段(ITS.rbcL.matK和psbA-trnH)测序法)分别在杜鹃花亚组、组、亚属和整个属水平上做了探索,但是这些片段在物种、亚组、甚至组间的区分能力较弱[9-11]。
近年来,随着新一代测序技术的不断发展,测序成本不断下降,以单核苷酸多态性(SNP)为代表的新型标记逐渐被应用到植物群体遗传学研究中。SNP位点具有数量多、分布密度高等特点,而且SNP位点的开发不需要进行PCR和电泳等实验工作,可以大规模高度自动化地完成。
本研究采用了RAD-seq技术(在二代测序基础上发展起来的一种DNA测序新技术)来开发单核苷酸多态性SNP位点,该技术利用限制性内切酶对基因组进行酶切,产生一定大小的片段,构建测序文库,对酶切后产生的RAD标记进行高通量测序。RAD-seq能够较均匀的覆盖整个基因组,进而可以获得成千上万的SNP位点,以期发现RAD-seq技术在中国杜鹃花复杂类群分类与物种界定方面的优势。
HTML
-
杜鹃花样本:用于RAD-seq的杜鹃花种类及其所属的亚组、组和亚属见表 1。本实验测序的样本共85种,隶属于6个亚属、8个组和22个亚组。
样品编号
SampleID物种名
Spacies所属亚属
Subgenus所属组或亚组
Section/Subsection高质量序列
Cleanreads高质量碱基
Cleanbase/Mb测序深度/倍
Depth覆盖度
Coverage /%比对率
Mappingpercent/%1 皱皮杜鹃 常绿杜鹃亚属 常绿杜鹃组-大理杜鹃亚组 3.06 422.50 6.87 7.92 88.92 2 黄花杜鹃 杜鹃亚属 杜鹃组-三花杜鹃亚组 2.95 408.91 6.37 6.67 89.16 3 高尚杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 3.41 470.15 7.62 8.68 97.20 6 怒江杜鹃 杜鹃亚属 杜鹃组-怒江杜鹃亚组 2.37 323.77 4.25 8.52 91.49 8 皱叶杜鹃 常绿杜鹃亚属 常绿杜鹃组-银叶杜鹃亚组 1.73 236.22 3.59 8.49 89.65 10 绒毛杜鹃 常绿杜鹃亚属 常绿杜鹃组-麻花杜鹃亚组 2.03 282.00 6.07 4.54 71.97 11 滇南杜鹃 马银花亚属 长蕊组 1.63 224.91 4.03 5.72 84.58 12 柳条杜鹃 糙叶杜鹃亚属 帚枝杜鹃组 1.90 260.56 3.88 7.69 91.65 13 隐脉杜鹃 杜鹃亚属 杜鹃组-有鳞大花亚组 1.80 249.42 4.29 5.94 86.43 14 不凡杜鹃 常绿杜鹃亚属 常绿杜鹃组-银叶杜鹃亚组 1.43 196.60 3.78 6.50 86.60 16 团叶杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 3.51 485.10 6.23 10.33 92.51 17 宝兴杜鹃 杜鹃亚属 杜鹃亚属-川西杜鹃亚组 2.67 368.33 4.82 6.07 70.37 18 棕背杜鹃 常绿杜鹃亚属 常绿杜鹃组-大理杜鹃亚组 2.21 304.54 4.38 8.85 88.95 20 粗脉杜鹃 常绿杜鹃亚属 常绿杜鹃组-大理杜鹃亚组 3.09 426.61 5.41 10.43 93.86 22 白毛杜鹃 常绿杜鹃亚属 常绿杜鹃组-大理杜鹃亚组 3.16 437.55 5.22 11.22 92.95 23 羊踯蹰 羊踯躅亚属 五花药组 1.45 198.02 3.90 5.22 87.93 24 峨眉银叶杜鹃 常绿杜鹃亚属 常绿杜鹃组-银叶杜鹃亚组 2.26 312.03 5.04 8.39 93.87 25 锈红杜鹃 常绿杜鹃亚属 常绿杜鹃组-大理杜鹃亚组 2.83 391.97 3.24 6.27 36.78 26 锦锈杜鹃 映山红亚属 映山红组 1.90 260.77 4.27 6.86 91.34 28 稀果杜鹃 常绿杜鹃亚属 常绿杜鹃组-麻花杜鹃亚组 2.63 362.67 5.25 9.21 93.23 32 繁花杜鹃 常绿杜鹃亚属 常绿杜鹃组-银叶杜鹃亚组 1.29 176.32 3.58 6.41 89.77 34 大白杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 2.31 319.98 5.25 8.78 98.90 36 紫花杜鹃 杜鹃亚属 杜鹃组-三花杜鹃亚组 2.74 375.05 4.48 8.97 87.99 37 耳叶杜鹃 常绿杜鹃亚属 常绿杜鹃组-耳叶杜鹃亚组 4.30 595.98 8.40 9.74 95.11 38 美艳橙红杜鹃 常绿杜鹃亚属 常绿杜鹃组-火红杜鹃亚组 4.78 657.59 9.31 9.83 96.22 39 美容杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 3.54 488.29 6.64 9.45 91.66 42 糙叶杜鹃 糙叶杜鹃亚属 糙叶杜鹃组 4.52 624.53 7.30 9.31 90.66 44 长鳞杜鹃 常绿杜鹃亚属 常绿杜鹃组-麻花杜鹃亚组 2.46 339.53 4.34 8.12 72.04 45 百合花杜鹃 杜鹃亚属 杜鹃组-有鳞大花亚组 3.13 428.51 7.29 5.93 85.79 47 基毛杜鹃 杜鹃亚属 杜鹃组-三花杜鹃亚组 1.28 174.94 3.42 5.59 92.45 48 三花杜鹃 杜鹃亚属 杜鹃组-三花杜鹃亚组 2.42 333.56 5.92 6.05 93.51 50 阔柄杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 2.79 384.11 7.03 7.62 96.35 51 岷江杜鹃 常绿杜鹃亚属 常绿杜鹃组-银叶杜鹃亚组 1.58 218.87 4.28 7.13 96.37 52 陇蜀杜鹃 常绿杜鹃亚属 常绿杜鹃组-大理杜鹃亚组 2.25 308.59 4.96 8.23 92.31 53 四川杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 3.57 490.86 6.93 9.50 93.46 56 椿年杜鹃 杜鹃亚属 杜鹃组-有鳞大花亚组 2.55 353.77 6.11 5.74 85.54 57 鳞腺杜鹃 杜鹃亚属 杜鹃组-鳞腺杜鹃亚组 1.20 164.87 3.97 4.55 89.70 58 巴郎杜鹃 常绿杜鹃亚属 常绿杜鹃组-大理杜鹃亚组 1.86 258.13 5.19 6.90 95.38 59 问客杜鹃 杜鹃亚属 杜鹃组-三花杜鹃亚组 4.44 615.93 6.96 8.93 85.49 60 照山白 杜鹃亚属 杜鹃组-照山白亚组 1.19 165.24 3.67 5.01 88.44 61 锈叶杜鹃 杜鹃亚属 杜鹃组-三花杜鹃亚组 2.60 361.13 4.77 8.05 88.90 62 长毛杜鹃 杜鹃亚属 杜鹃组-三花杜鹃亚组 3.75 519.61 5.82 9.90 90.88 63 卧龙杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 1.91 265.56 4.21 7.22 79.40 64 滇隐脉杜鹃 杜鹃亚属 杜鹃组-有鳞大花亚组 5.21 719.36 7.88 9.72 91.48 65 大果杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 2.30 316.30 5.04 8.73 96.48 66 碎米花杜鹃 糙叶杜鹃亚属 糙叶杜鹃组 7.40 1 017.40 14.04 7.66 94.16 67 大喇叭杜鹃 杜鹃亚属 杜鹃组-有鳞大花亚组 2.69 369.45 6.91 5.65 90.32 68 云上杜鹃 杜鹃亚属 杜鹃组-有鳞大花亚组 2.18 301.42 5.26 6.05 94.15 69 桃叶杜鹃 常绿杜鹃亚属 常绿杜鹃组-露珠杜鹃亚组 3.84 528.20 7.61 9.64 95.67 70 薄叶马银花 马银花亚属 马银花组 1.47 202.87 4.12 5.42 88.56 71 红棕杜鹃 杜鹃亚属 杜鹃组-亮鳞杜鹃亚组 4.40 609.12 6.82 9.71 92.83 72 金山杜鹃 常绿杜鹃亚属 常绿杜鹃组-银叶杜鹃亚组 1.25 171.74 3.48 6.80 95.18 73 马缨杜鹃 常绿杜鹃亚属 常绿杜鹃亚组-树形杜鹃亚组 2.31 319.85 4.01 11.13 94.64 78 紫玉盘杜鹃 常绿杜鹃亚属 常绿杜鹃组-镰果杜鹃亚组 1.97 273.04 4.79 7.67 93.37 79 粘毛杜鹃 常绿杜鹃亚属 常绿杜鹃组-粘毛杜鹃亚组 2.28 316.73 4.62 7.80 78.77 80 山育杜鹃 杜鹃亚属 杜鹃组-三花杜鹃亚组 2.89 397.33 4.70 9.58 92.67 81 毛棉杜鹃 马银花亚属 长蕊组 1.71 236.57 4.93 5.10 86.94 84 多鳞杜鹃 杜鹃亚属 杜鹃组-三花杜鹃亚组 2.10 290.23 4.70 6.02 78.95 85 云锦杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 2.49 341.82 4.90 9.42 94.10 86 反边杜鹃 常绿杜鹃亚属 常绿杜鹃组-银叶杜鹃亚组 2.93 404.22 5.55 8.78 83.92 88 越峰杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 3.10 428.02 7.11 7.95 91.21 89 碟花杜鹃 常绿杜鹃亚属 常绿杜鹃组-露珠杜鹃亚组 1.13 155.92 3.39 6.50 96.98 90 金山杜鹃 常绿杜鹃亚属 常绿杜鹃组-银叶杜鹃亚组 1.81 248.51 3.88 8.57 92.54 91 纯红杜鹃 常绿杜鹃亚属 常绿杜鹃组-火红杜鹃亚组 1.83 250.89 3.44 7.52 72.58 92 大钟杜鹃 常绿杜鹃亚属 常绿杜鹃组-银叶杜鹃亚组 2.89 397.34 5.17 9.85 89.14 93 腺果杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 3.59 496.44 6.88 9.74 93.55 94 皱叶杜鹃 常绿杜鹃亚属 常绿杜鹃组-银叶杜鹃亚组 3.34 458.72 5.76 10.07 87.93 95 昆明杜鹃 杜鹃亚属 糙叶杜鹃组 2.29 317.74 5.50 6.59 92.98 96 腋花杜鹃 糙叶杜鹃亚属 腋花杜鹃组 4.84 670.27 11.18 6.60 92.44 97 长蕊杜鹃 马银花亚属 长蕊组 1.15 156.79 3.52 4.85 88.61 98 爆杖花 糙叶杜鹃亚属 糙叶杜鹃组 4.13 566.53 7.21 8.25 89.00 99 喉斑杜鹃 常绿杜鹃亚属 常绿杜鹃组-蜜腺杜鹃亚组 4.30 596.80 9.14 8.61 91.00 100 圆头杜鹃 常绿杜鹃亚属 常绿杜鹃组-杯毛杜鹃亚组 2.09 289.82 4.74 8.18 92.27 102 美容杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 2.40 331.56 4.69 9.18 90.29 103 大王杜鹃 常绿杜鹃亚属 常绿杜鹃组-杯毛杜鹃亚组 3.49 479.40 6.25 9.42 84.73 104 大王杜鹃 常绿杜鹃亚属 常绿杜鹃组-杯毛杜鹃亚组 3.50 485.68 7.46 8.14 86.38 105 长粗毛杜鹃 常绿杜鹃亚属 常绿杜鹃组-粘毛杜鹃亚组 2.26 309.69 4.55 7.80 79.36 106 巨魁杜鹃 常绿杜鹃亚属 常绿杜鹃组-大叶杜鹃亚组 2.11 290.94 4.48 8.44 89.65 107 波叶杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 2.19 298.46 4.14 9.39 90.31 108 棉毛房杜鹃 常绿杜鹃亚属 常绿杜鹃组-星毛杜鹃亚组 2.87 398.01 5.52 10.01 97.07 109 井冈山杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 3.08 427.25 4.90 8.82 71.76 110 喇叭杜鹃 常绿杜鹃亚属 常绿杜鹃组-云锦杜鹃亚组 4.61 637.76 9.71 8.48 89.60 111 凸尖杜鹃 常绿杜鹃亚属 常绿杜鹃组-大叶杜鹃亚组 2.00 278.63 4.21 6.51 68.80 112 海绵杜鹃 常绿杜鹃亚属 常绿杜鹃组-银叶杜鹃亚组 1.78 245.55 1.65 0.99 4.94 113 夺目杜鹃 常绿杜鹃亚属 常绿杜鹃组-杯毛杜鹃亚组 3.74 516.64 7.13 8.23 78.22 Table 1. Basic information of Rhododendron species sequenced in the present study and characteristics of RAD data including clean reads, clean base, depth, coverage percentage as well as mapping percentage to the whole genome of R. delavayi
-
每个个体摘取新鲜叶片0.5 g,用CTAB法[12]分别提取样品的基因组DNA并进行DNA质量检测,对质量合格的DNA进行下一步实验。
-
参考Miller等[13]的文库构建方法,分以下步骤:①限制性内切酶Taq I酶切;②连接P1接头; ③ DNA随机打断片断化;④目的片段回收与末端修复;⑤连接P2接头;⑥ RAD片段富集;⑦上机测序。
-
根据识别标签序列得到每个个体的测序reads,先使用trimmomatic-0.36[14]对测序reads进行过滤,设置具体参数如下,过滤参数为:SLIDINGWINDOW:5:20 LEADING:5 TRAILING:5 MINLEN:50。过滤标准为:两端质量低于5的碱基进行切除,并以5 bp为窗口进行滑动过虑,对平均质量低于20的窗口进行切除。
-
用BWA软件[15]mem模块将过滤后的个体clean reads比对到马缨花杜鹃参考基因组序列上。样本比对率反映的是样本测序数据与参考基因组的相似性,覆盖深度和覆盖度能够直接反映测序数据的均一性与参考序列的同源性。
比对完成后,经过GATK软件[16]进行变异检测,并获得群体变异集文件(VCF格式)。最后对原始基因型数据基本特性进行分析后,对数据进行过滤:过滤参数为缺失率小于或等于0.2、杂合率小于或等于0.2、最小等位基因频率(MAF)大于或等于0.05,最终得到高质量的基因型数据。
-
在获得高质量的标记数据以后,使用ADMIXTURE[17]、GCTA[18]、FastTree[19]软件进行物种的聚类分析。