科技引领未来
说起基因芯片,大家并不陌生,即通过与一组已知序列的核酸探针杂交,检测遗传变异的方法。
随着近十年NGS技术飞速发展,诞生了数百种经济物种的高质量参考基因组,同时获得了海量的重测序数据,基于这些数据结果,各个物种相继产生了高密度SNP芯片。
近几年,功能基因组研究发展迅猛,Hi-C、ATAC-seq、CUT&Tag/ChIP-seq等技术相继在经济物种功能基因组研究中被广泛应用,多个物种基因组启动子、增强子、染色质开放区域等调控元件及活性区域被大规模鉴定,基因组功能注释越来越精细;结合高水平比较基因组、进化等研究,大量能够影响基因表达、蛋白活性的重要功能位点被鉴定。在上述研究成果的基础上,功能位点基因芯片应运而生。
1 理解功能位点基因芯片
功能位点基因芯片是指芯片设计所包含的位点全部是能够影响转录水平或蛋白活性的功能突变;相比普通的标记位点基因芯片,功能位点基因芯片在位点选择上更科学,直接影响生命调控过程,位点携带的功能信息含量更高。
▲HiBLUP(天权)育种大数据计算平台
标记位点基因芯片,其标记位点效应取决于与之连锁的功能突变,由于连锁紧密程度在不同世代、不同群体中都会不同,导致了标记位点效应不稳定,难以实现数据联合分析,不利于基因组育种效率提升。
功能位点基因芯片,携带的是功能突变,能够有效摆脱连锁不平衡的限制,突变位点效应在不同群体中相对稳定,这对于多世代、多群体数据整合分析非常有利,能够有效提高关键基因挖掘和基因组育种效率。
相比标记位点基因芯片,功能位点基因芯片更接近“理想基因芯片”,理想基因芯片是指芯片位点正好为所研究表型全部QTN位点的芯片。
然而,育种目标性状往往较为复杂,且受微效多基因效应影响,获取所研究表型的全部QTN来设计一款理想基因芯片是很难的。但QTN一定是功能突变,这一点是确定的。
因此,相比标记位点基因芯片,功能位点基因芯片理论上包含更多QTN位点,更接近理想基因芯片。另外,相比全基因组测序,功能位点基因芯片包含的QTN数量会少一些,但其无效的噪音位点也大大减少,而且在存储和计算成本方面有很大的优势。
理想基因芯片、功能位点基因芯片、标记位点基因芯片、全基因组测序之间的关系如下(假设所研究表型受1000个QTN控制):
△基因芯片关系图
2 功能位点基因芯片设计路线图
3 功能位点基因芯片设计步骤及说明
01 基因组组装
主要针对没有参考基因组的物种。依据要求设计测序方案,以二倍体核型物种为例,如仅进行一致性基因组组装,即筛选同源染色体中的一份拷贝作为代表组装到染色体水平,至少需要联合PacBio HiFi+Hi-C+WGS技术;如需进行单体型基因组组装,除了一致性基因组组装数据外,还需引入父本和母本的高深度WGS数据。
02 基因组遗传变异检测
如果所研究物种没有高质量遗传变异数据库,或者已有遗传变异信息不能有效囊括某些特有品种时,则需从头鉴定基因组遗传变异。具体方法:通过高质量群体基因组重测序数据鉴定所研究物种/品种的SNV、Indel及SV。鉴于二代测序数据检测SV存在敏感性低的问题,可挑选代表性个体进行三代PacBio HiFi重测序,提高群体SV的检测效率。
03 功能基因组注释
1)表观基因组:结合特定组织或者不同部位组织多个发育阶段的表观基因组测序包括ATAC-seq和ChIP-seq/CUT&Tag,全面准确鉴定基因组调控元件和转录因子结合基序。
2)基因组进化保守元件:基于保守的概念,在多个物种基因组集合中检测不同保守阈值(完全保守、极为保守、显著保守)的基因组序列。
04 芯片候选功能位点筛选
注释全基因组遗传变异并赋予特征标签,如基因间区、内含子、同义突变、错义突变、无义突变、移码突变、群体最小等位基因频率分位数、调控元件、进化保守、候选功能突变。联合所有基因组特征权重,逐一计算全基因组遗传变异特征总得分。
依据遗传连锁信息,计算基因组单倍型组,并从每个单倍型块中挑选特征总得分最高的遗传变异作为该单倍型的标签遗传变异和芯片候选变异位点。
05 全基因组捕获探针设计及评测
综合考虑探针序列长度、GC含量及特异性,设计全基因组探针序列库,并通过深度学习模型预测所有探针捕获效率。
06 确定芯片功能位点及捕获探针序列
全面考虑芯片位点特征分值、基因组代表性、芯片探针捕获效率、芯片探针密度,芯片大小等信息设计该物种第一版本功能基因芯片。
07 育种评估及芯片位点迭代优化
结合第一版本功能基因芯片群体实测结果,包括实际探针捕获特异性和效率、位点完整性、多态信息含量及基因组评估准确性等信息,迭代优化芯片位点和探针序列。
4 设计实例:猪80K功能位点基因芯片
△猪80K功能位点基因芯片功能位点在不同类型元件中的分布图
芯片特点:
01 功能位点:选取的是对基因表达水平或蛋白活性具有重要影响的功能突变,而不仅仅是分子标记,芯片位点设计更科学。
02 分型准确:位点分型采用的是精准捕获测序技术,每个靶位点测序深度最低为10X,芯片位点分型更准确。
03 升级灵活:能够根据猪群遗传特点及猪基因组研究最新成果随时优化位点, 芯片位点升级更灵活。
04 信息丰富:不仅提供80K的指定功能位点信息,而且额外提供附近约300K的遗传变异信息,信息更丰富。
05 育种高效:结合位点智能加权基因组育种新算法KAML,育种值估计更准确,结合HiBLUP育种信息平台,能够实现高效育种;结合rMVP进行全基因组关联分析研究,因果突变鉴定更高效。
走进武汉影子基因
武汉影子基因科技有限公司成立于2021年,与华中农业大学战略合作,技术实力雄厚,公司致力于表观遗传研究、基因组育种技术研发与推广应用。
影子基因Yingzi Gene,表观遗传和基因组育种技术的引领者,提供基因组功能研究和育种产业化应用整体解决方案,包括多种表观遗传研究服务,功能位点基因芯片设计、制备与检测,基因组育种大数据分析与育种软件开发等服务。
公司80%的员工拥有硕士及以上学历,拥有T7高通量测序仪、核酸自动提取工作站、高性能计算集群等平台和设备。