• 回答数

    3

  • 浏览数

    192

枫糖17苹果派
首页 > 学术期刊 > 棉花基因组学研究论文

3个回答 默认排序
  • 默认排序
  • 按时间排序

angela颖宝贝

已采纳

转自:

基因组(Denovo sequencing),即基因组从头测序,指在不依赖参考基因组的情况下绘制该物种的全基因组序列图谱,从而获取该物种的全部遗传信息。高连续性基因组的获得,对后续功能基因定位,结构变异检测具有重要的意义。结合近几年的文章我们不难发现,基因组研究主要以下面几种方向为出发点开展: 1)大型/多倍体/超复杂物种基因组破译,技术创新改革; 2)0 Gap基因组/单体型基因组构建,序列优化打磨; 3)未知基因组破译联合多组学分析,经济价值挖掘; 4)品种泛基因组构建解析功能变异,覆盖多样表型; 5)科属水平谱系基因组构建与分析,探索进化功能; 6)多种基因组联合多组学比对剖析,解析性状特征。 ... ...

前5种好理解,第6种方向能做什么呢?其实我们想要了解一个物种,往往单一基因组难以完整解析,例如

等等棘手但是却又热门的研究话题。

接下来我将通过百迈客最近三篇动植物上的成功案例带大家看看,如何通过数个材料基因组结合多组学的手段解析性状特征。

合作单位:中科院南海海洋研究所 发表期刊:Science Advances 影响因子:14.131 发表时间:2021.08 研究材料:Denovo:雌性与雄性草海龙(Phyllopteryx taeniolatus);雌性与雄性绿海龙(Syngnathoides biaculeatus) 个体重测序:2只雄性草海龙 RNA-seq:脑、眼、鳃、肝、肠、肌肉、鳍、皮肤和附叶 测序方案

Denovo:雌性、雄性草海龙与雄性绿海龙PacBio平台;雌性绿海龙Nanopore平台,雌性、雄性草海龙与雄性绿海龙进行Hi-C测序。三代测序技术对应测序数据如下表所示: 个体重测序:~30X PacBio

草海龙最终组装大小为~659 Mb(♂)与 ~663Mb(♀), contig N50分别为10.0 Mb与12.1 Mb。绿海龙分别组装~637 Mb(♂)与~648 Mb(♀),contig N50分别为18.0Mb与21.0 Mb。4个基因组BUSCO评估显示范围在94.00- 94.40%。并分别在草海龙和绿海龙中确定了31个和33个发生 扩张的基因家族 。通过19条鳍鱼类全基因组数据集进行 系统发育分析 ,明确草海龙与绿海龙在系统发育地位上属于海龙亚科(Syngnathinae)的姊妹群,并于 27.3 百万年前 左右发生分化。

草海龙的头部、颈部、腹部、背部和尾部区域有叶子状的附属物,可以与周围环境相融合,使草海龙以完美拟态隐匿于海草床中。这些结构是该物种的一种适应性进化产物,主要由骨基质和富含胶原纤维的结缔组织组成。

通过转录组学分析,发现其表达基因(如msx,dlx,fgf)主要从皮肤和鳍等器官募集而来,暗示了相关基因对新器官产生和维持的重要作用。而“附叶”与鳍相比缺乏肢体发育特异性的hox基因。草海龙的附叶在捕食者的袭击中经常受到损伤,为了研究相关机制,作者通过转录组分析研究发现在其附叶中炎症和损伤修复相关基因表现出高表达水平, 说明这些基因可能与其附叶的快速愈合和再生能力相关 。 同时草海龙特异性扩张的MHC I基因也在附叶中显著高表达,能为其提供额外的免疫保护。

通过雄性和雌性叶海龙Illumina reads正反比对雄性和雌性的全基因组序列,来确定叶海龙中假定的性染色体和性别基因座。结果显示 Chr4上的一个~47-kb区域仅在雄性中存在 , 且reads覆盖度为Chr4平均值的一半,该片段经Hi-C互作分析结果支持。

注释及比较分析发现草海龙和绿海龙的性别决定基因均为amhr2的雄性特异性拷贝amhr2y,但两者的基因座不相同。系统发育分析表明,amhr2y起源于它们最近共同祖先的重复事件,而黄鲈amhr2y是从其谱系中的独立重复事件进化而来。研究发现amhr2y比amhr2受到的选择压力更强,其整体结构与amhr2相似。

草海龙与其他海龙科物种一样具有缺乏牙齿的管状吻。 研究表明,大部分富含P/Q的分泌型钙结合磷蛋白(SCPP)基因的缺失可能是导致syngnathids无牙的原因。 为了验证海龙科中因 假基因化丧失功能 这一点,作者使用CRISPR-Cas9技术构建了两个斑马鱼scpp5突变系,发现scpp5-/-突变体斑马鱼牙齿的数量减少且颌骨中存在用于附着牙齿的凹坑。

研究结论 该研究通过雌雄性海龙基因组的破译,结合 重测序分析、转录分析、比较基因组分析 等研究揭示了海龙科物种性别决定基因的产生和演化历程,为海洋鱼类的环境适应性进化研究提供了重要理论依据。

合作单位:浙江大学 发表期刊:Plant Biotechnology Journal 影响因子:9.801 发表时间:2021.08 研究材料:Denovo:Brassica juncea菜用芥菜T84-66、油用芥菜AU213; 个体重测序:12个油菜品种; 遗传进化:183份油用与菜用芥菜; 测序方案: Denovo:菜用芥菜分别146 Gb Illumina(~150X)+ 251 Gb PacBio( 200X)+Hi-C( 200X );油用芥菜147 Gb Illumina(~150X)+205 Gb PacBio( 200X)+Hi-C( 200X ) 个体重测序:~20X Nanopore 遗传进化与GWAS:~10X illumina

研究内容

在着丝粒附近的异染色质状态中具有相对较低的基因表达模式。

系统地鉴定了T84-66 和AU213的A和B亚基因组中的全基因组单核苷酸多态性(SNP)、插入/缺失(InDels)和存在/缺失变异(PAV)。在T84-66和AU213之间的A和B亚基因组中鉴定了24,768个PAV(> 100 bp), 其中3,634个PAV导致6,425个基因的变异。随机选择了几个PAV并使用PCR来确保这些PAV的保真度。其中一些基因组变异位于基因区域内,预计会影响T84-66和AU213作物中涉及生物和非生物胁迫的基因功能。

为了破译芥菜基因组菜用和油用品种之间SVs衍生的功能差异,作者基于Nanopore重测序技术,系统比较了菜用和油用芥菜群体基因组结构变异(structural variation,SV) ,挖掘到包括1, 354个高可信度的插入、缺失、重复、倒位、易位等变异。其中两个重要的基因位点TGA1和HSP20在ChrA06和ChrB08,可能与B.juncea基因组的菜用与油用品种之间对生物和生物应力的反应的自然变异有关。 这些变异研究为菜用芥和油用芥两个典型分化群体的演化提供了基因组变异基础。

使用T84-66作为参考基因组,对183份油用与菜用芥菜进行进化关系分析,并通过SGS-GWAS(scored genomic SNPs based GWAS)基因定位,在A02和A09中发现了两个参与控制芥菜硫苷(GSL)积累变异的关键遗传位,并首次发现A09中的MYB28与B. jucnea中GSL的积累有关。经过进一步研究并同过ONT验证发现,MYB28基因的拷贝数变异(copy number variations,CNVs)是导致芥菜种群中硫苷积累差异的原因,该基因的拷贝数变异在低硫苷芥菜群体中普遍存在。

研究小结 该研究将为多倍基因组进化研究和精确基因组选择研究提供重要研究信息,对芥菜风味品质和油脂质量的分子遗传改良具有重要科学和应用价值。

合作单位:华中农业大学 发表期刊:Molecular Biology And Evolution 影响因子:16.241 发表时间:2021.05 研究材料:基因组、Hi-C:圆叶棉G. rotundifolium(K2)、亚洲棉G. arboreum(A2)、雷蒙德氏棉G. raimondii(D2)新鲜叶片

测序方案 denovo:illumina K2、A2和D5分别108×, 118×, 132×;Nanopore K2、A2和D5分别124×, 131×, 167× Hi-C挂载:6碱基酶HindⅢ;K2、A2和D5分辨率分别为20kb、20kb、10kb Hi-C互作:4碱基酶DpnⅡ;分辨率20 Kb, 50 Kb, 100 Kb

研究内容

利用Nanopore测序技术组装了圆叶棉( K2 )基因组,组装大小为2.44Gb(contigN50 = 5.33 Mb);提升了亚洲棉( A2 )和雷蒙德氏棉( D5 )的基因组,组装大小分别为1.62 Gb (contigN50 = 11.69 Mb)和0.75 Gb(contigN50 =17.04 Mb )。Hi-C挂载率均超过99%,BUSCO结果分别为92.5%, 93.9%,及95.4%。

重复序列注释表明,相对于D5,K2和A2中棉种 特异的反转录转座子扩增是造成这三个基因组大小三倍变化的原因,特别是Gypsy和DIRS类型。全长转座子插入时间分析表明K2基因组中转座子插入最为古老,A2基因组有更多新的转座子。

比较基因组分析表明,A2和K2基因组在Chr01与Chr02染色体间存在一个大的易位;K2和D5基因组在Chr13与Chr05染色体间存在一个大的易位。三个棉种在57-71百万年前存在一次共同的全基因组复制事件,并在5.1-5.4百万年前发生物种分化,基因共线性分析表明每个基因组大约有15%特异的基因家族。

通过HiC染色质互作数据揭示三个棉种染色体大小的规律,A2与K2比D5多了约7000个基因,三个基因组中17%的共线性同源基因表现为A/B区室的染色质状态改变,这与活跃的转座子扩增相关。

K2与A2及与D5相比更多的倾向于A向B的转化。K2和A2中有更多的基因处于A compartment,D5中有更多的基因处于B compartment。

大约60%的拓扑结构域(TAD)在三个基因组中发生了重新组织,K2基因组中有更多特异的TAD。基于边界TE覆盖度,边界TE表达以及TE插入时间分析,发现K2不保守的TAD边界存在特异的和较新的转座子(物种分化后爆发的TE)插入。这些结果表明最近在K2和A2基因组中表达的TEs的扩增可能有助于在三个物种分化后形成谱系特异性TAD边界。基于这些结果,作者提出了三个棉种分化过程中,基因组扩张-转座子扩增介导的A/B区室转换和TAD重组的进化模型。

研究小结

本次研究首次公布了棉属中二倍体圆叶棉基因组,并对亚洲棉和雷蒙德氏棉基因组进行了升级,解析了转座子活动驱动的基因组大小进化特征,从转座子扩增和染色质空间结构角度为棉花物种进化提供新的见解,为植物中转座子活动介导的转录调控进化研究提供参考。

80 评论

蓝缀天堂鸟

动植物基因组De novo测序分析也叫从头测序分析,指不依赖于任何参考序列信息就可对某动植物进行测序分析,使用最新的生物信息学方法进行序列拼接获得某物种的基因组序列图谱,并进行基因组结构注释、功能注释、比较基因组学分析等一系列的后续分析。三代测序技术(以PacBio和Nanopore为代表)具有读长长的特点,自2015年开始在动植物基因组De novo中初露锋芒,已延用至今。该类型测序分析结果可以广泛应用于农林鱼牧医药及海洋等各个方面的研究。图1 不同测序技术读长,准确性及基因组连续性评估三代测序技术原理PacBio测序原理采用边合成边测序的方式,以其中一条DNA链为模板,通过DNA聚合酶合成另外一条链,进一步将荧光信号转变为碱基信号。同时PacBio已升级了CCS测序模式以获得长读长的高保真(HiFi)15 kb reads,由此提升基因组组装的准确性。图2 三代PacBio测序原理Nanopore测序原理当单链DNA分子穿过纳米孔时,相对于每个核苷酸,都会获得不同的电流信号。记录每个孔的离子电流变化,并基于马尔可夫模型或递归神经网络的方法将其转换为碱基序列。除此之外,Ultra-long reads (ULRs) 是ONT平台的另一重要特征,并具有促进大型基因组组装的潜力。信息分析内容De novo研究 研究内容基因组组装 多软件组装、组装结果评估基因预测与注释 编码基因预测;重复序列注释和转座元件分类;非编码RNA注释;假基因注释等Hi-C辅助基因组组装 有效数据评估;Contig聚类、排序及定向分析;挂载结果评估   生物学问题解析   比较基因组学研究基因家族聚类;系统发育树的构建;基因家族扩张与收缩分析;物种分化时间推算;LTR形成时间估算;全基因组复制事件;选择压力分析特定生物学问题剖析 结合组学研究方法,深入对某物种生物学问题进行解析草莓基因家族聚类分析薏苡全基因组复制事件分析开心果系统进化树与基因家族收缩扩张分析陆地棉亚基因组共线性分析技术服务流程样品寄送建库测序数据分析出具报告售后答疑产品优势公司成立于2009年,深耕基因组测序领域11年之久,长久以来致力于成为精准的基因组组装专家;拥有世界在最主流的三代测序平台(PacBio测序全平台和Nanopore测序全平台),具有丰厚的双平台组装及上万种物种基因组组装经验。Hi-C染色质构象捕获技术文库有效数据比例高,挂载效率高达99%,多倍体物种研究经验丰富,与三代基因组组装相结合,获得染色体水平基因组的同事进一步提升基因组组装质量。拥有自主研发的领先的基因组测序和分析技术,目前已经获得23项发明专利,超过150多项核心软件著作权。项目经验示例合作文章案例案例1以更新的亚洲棉A基因组为基础的243份二倍体棉的重要农艺性状的研究RESEQUENCING OF 243 DIPLOID COTTON ACCESSIONS BASED ON AN UPDATED A GENOME IDENTIFIES THE GENETIC BASIS OF KEY AGRONOMIC TRAITS期刊:Nature Genetics影响因子:27.125发表单位:中国农业科学院棉花研究所、北京百迈客生物科技有限公司等发表年份:2018年5月研究背景:棉花是研究植物多倍化的有价值的资源。亚洲棉(Gossypium arboreum)和草棉(Gossypium herbaceum)的祖先是现代栽培异源四倍体棉花A亚基因组的供体。 本研究中,利用了三代PacBio和Hi-C技术,重新组装了高质量的亚洲棉基因组,分析了243份二倍体棉花种质的群体结构和基因组分化趋势,同时确定了一些有助于棉花皮棉产量遗传改良的候选基因位点。研究结果:1、亚洲棉三代基因组组装:利用三代测序和Hi-C相结合的方法进行亚洲棉基因组组装。共计获得了142.54 Gb ,组装1.71 Gb亚洲棉基因组,Contig N50=1.1 Mb,最长的Contig为12.37 Mb。利用Hi-C技术将组装的1573 Mb的数据定位到13条染色体上,与已经发表的基因组相比,当Hi-C数据比对到更新的基因组后,对角线外的不一致性明显减少(图1 a-b)图1 HI-C数据在两版亚洲棉基因组上的比对2、二倍体棉花群体遗传进化分析:对230份亚洲棉和13份草棉重测序,进行基因组比对、系统发育树、群体结构分析、PCA、LD和选择性清除分析得出亚洲棉和草棉(A)与雷蒙德氏棉同时进行了分化;亚洲棉起源于中国南部,随后被引入长江和黄河地区,大多数具有驯化相关特性的种质都经历了地理隔离(图2)。图2 二倍体棉群体进化和群体结构分析3、亚洲棉的全基因组关联分析(GWAS):对来自不同环境下的11个重要性状进行全基因组关联分析,鉴定了亚洲棉11个重要农艺性状的98个显著关联位点,GaKASIII的非同义替换(半胱氨酸/精氨酸替换)使得棉籽中的脂肪酸组成(C16:0和C16:1)发生了变化;发现棉花枯萎病抗性与GaGSTF9基因的表达激活相关。选择了亚洲棉种质中的158份有绒毛和57份无绒毛材料进行GWAS关联分析,发现与毛状体和纤维发育有关信息(图3)。图3 二倍体棉群体进化和群体结构分析研究结论:利用三代测序+Hi-C技术完成了亚洲棉基因组的重新组装,将基因组组装指标从72 Kb提升到1.1 Mb,为亚洲棉后续的群体遗传学等相关研究奠定了基础;通过群体遗传进化等相关分析,发现亚洲棉和草棉(A型)与雷蒙德氏棉(D型)同时进行了分化,并证明了亚洲棉起源于中国南部,随后被引入长江和黄河地区;整合GWAS与QTL等分析方法,对亚洲棉脂肪酸含量,抗病性及棉绒生长发育相关基因进行定位,并进行相关功能验证,促进了亚洲棉复杂农艺性状的改良。案例2、二倍体、野生和栽培四倍体花生比较基因组分析揭示亚基因组不对称进化和改良COMPARISON OF ARACHIS MONTICOLA WITH DIPLOID AND CULTIVATED TETRAPLOID GENOMES REVEALS ASYMMETRIC SUBGENOME EVOLUTION AND IMPROVEMENT OF PEANUT期刊:Advanced Science影响因子:15.804发表单位:河南农业大学、北京百迈客生物科技有限公司等发表年份:2019年11月研究背景:花生作为我国重要的经济作物,是提供重要的蛋白和油料的基础。花生属一共包括30个二倍体品种,1个异源四倍体野生花生(A. monticola)和1个栽培花生(A. hypogaea)。作为栽培花生农艺性状改良的重要野生资源供体,野生四倍体花生一直是国内外学者的研究热点。研究中对花生属唯一的野生异源四倍体花生Arachis monticola基因组进行了研究,

96 评论

我是怖怖

2014年6月,在线出版的《自然-遗传》杂志全面报道了中国科学家在解析亚洲棉基因组方面取得的最新进展。 中国科学家解析了全长1700兆碱基对的亚洲棉基因组,其中包含41330个蛋白编码基因,基因组大部分(68.5%)由重复序列组成,是到目前为止已测序的双子叶植物中重复序列比例最高的物种。通过与之前(Wang et al., 2012)由同一团队完成的雷蒙德氏棉基因组(D基因组)的比较,发现A和D基因组在距今约5百万年(2-13百万年)之前从同一祖先分化而来,二者的基因数目和基因序列都极为相近,染色体水平上也保留了高度的共线性,但由于A基因组发生过多次大规模的反转座子插入事件,导致其基因组膨胀至超过D基因组的两倍。上述研究结果将对人类认识棉花基因组的复杂性和棉属物种进化的多样性产生深远的影响。 通过转录组分析和大规模基因比较,研究团队首次在不同的棉花基因组中发现乙烯信号分子发挥了截然相反的作用。D基因组过多的乙烯合成抑制了棉纤维的发育,而A基因组乙烯的不足导致棉纤维不能充分伸长。抗病基因家族研究显示,相对于其近缘种可可,这些基因在对黄萎病有免疫力的D基因组中发生了显著扩张,在A基因组中却发生了显著收缩。此外,大量抗病基因只在D基因组中受黄萎病菌诱导迅速表达,导致A基因组不能在早期有效响应黄萎病菌侵染,几乎完全丧失抗病性。以上研究对于提高棉花产量和纤维品质,增强抗病性都有重要意义。

206 评论

相关问答

  • 人类基因组计划研究进展论文

    人类基因组计划明确的内容

    女王大人过司考 2人参与回答 2023-12-11
  • 功能基因组学研究的技术平台论文

    常用的有基因敲除技术和基因过量表达技术,这是用反向遗传学手段研究基因功能的有效手段。也有用正向遗传学手段的,即从表型出发克隆基因。新的技术有很多,但都没有很好的

    mono默默 4人参与回答 2023-12-11
  • 基因组学研究技术及应用论文

    李宝键教授在“展望21世纪的生命科学”一文中谈到基因组研究计划研究重要性时,引用《Scinence》上“第三次技术命革”中的一句话:“下一个传大时代将是基因组革

    英子888888 2人参与回答 2023-12-10
  • 小鼠基因组研究论文

    对于普通的转基因,表达的区域将取决于启动子。如果选择全身表达的启动子,如Rosa26, CAG等,将得到全身表达的转基因小鼠;如果选择一些组织特异性表达的基因的

    dp73239085 2人参与回答 2023-12-08
  • 血液基因组dna提取研究论文

    基因组DNA含有细胞中全部的遗传信息。从全血中提取DNA是遗传性疾病、胎儿产前无创伤诊断、肿瘤和传染性疾病等的早期确诊的重要手段和技术,DNA提取的质量和产量直

    jiangyue514悦兔 2人参与回答 2023-12-11