姜曲海猪是由大花脸猪和淮猪经过多种形式的杂交和长期选育而逐渐形成的,兼有两者的特征。早在1818年,金榜撰写的《海曲拾遗》一书中就有“(本地猪)非若淮北苦脸猪”的记载,说明那时已形成了一个与淮猪不同的新类型,即现代姜曲海猪。姜曲海猪具有性情温驯、适应性强、性成熟早、繁殖力较高、肉质细嫩、肉味鲜美等特点,但也有生长速度慢、瘦肉率低的弱点。2021年第三次全国畜禽遗传资源普查显示江苏省仅有1 521头姜曲海猪,其中种公猪15头,基础母猪343头。姜曲海猪的濒危等级为濒临灭绝,保种群体较小易造成近交系数升高从而导致性能衰退,因此品种鉴定、亲缘关系鉴定和家系构建对姜曲海猪的保护具有重要意义。
单核苷酸多态性(Single Nucleotide Polymorphism, SNP)主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。SNP数量多,分布广泛,适于快速、规模化筛查,易于基因分型,已成为畜禽品种鉴定、亲缘关系鉴定和家系构建的重要工具。目前主流的商用猪SNP芯片为基于Illumina平台的固相芯片,如Neogen公司研发的GGP 50K和江西农业大学研发的中芯一号等,且芯片位点多来源于杜洛克猪参考基因组,无法准确对地方猪进行品种鉴定、亲缘关系鉴定和家系构建。基于靶向捕获测序技术(Genotype by Target Sequencing,GBTS)的液相芯片具有平台广适性、标记灵活性、检测高效性、信息可加性、支撑便携性和应用广谱性等优势,逐渐成为SNP芯片的革命性技术。
1 材料与方法
1.1 重测序数据信息
62头姜曲海猪来源于江苏姜曲海猪种业有限公司,使用Illumina测序平台进行高通量测序,测序读长为PE150,测序深度10×-20×。世界范围内40个品种共计707头猪的重测序数据来源于NCBI(National Center for Biotechnology Information, https://www.ncbi.nlm.nih.gov/),平均测序深度在10×以上(表1)。
1.2 猪全基因组SNP的检测
针对62头姜曲海猪和40个品种707头猪的重测序数据使用FastQC去除接头污染的Reads、低质量的Reads和含N比例大于5%的Reads后得到高质量的Clean Reads。Clean Reads通过BWA软件比对到参考基因组(Sscrofa11.1)上,利用GATK软件进行突变检测,并根据以下标准进行过滤:1)基于深度的变异置信度(QD)<2.0;2)使用Fisher's精确检验的p‑value(FS)>60.0;3)RMS映射质量(MQ)<40.0;4)Alt vs.Ref read MQs的Wilcoxon秩和检验的Z‑score (MQRankSum)<-12.5;5)Alt与Ref读取位置偏差(ReadPosRankSum)的Wilcoxon秩和检验的Z‑score<‑8.0;6)对称比值比检验(SOR)估计的链偏倚>3.0;7)检出率(call rates)<0.9;8)次等位基因频率(Minor Allele Frequencies,MAF)<0.01。根据此标准过滤后,剔除插入缺失位点,获得高质量突变位点集。
1.3 姜曲海猪液相芯片的研发
针对高质量突变位点集利用Plink(V1.90)软件计算每个群体的等位基因型频率,计算姜曲海猪与其他每个猪种的最小等位基因型频率(Minor Allele Frequencies,MAF)差值,以MAF差值的绝对值大于0.7的位点作为姜曲海猪品种鉴定位点;按照基因组均匀分布的原则,在芯片上补充背景SNP位点。以全基因组每20K划分为一个窗口,将品种鉴定位点作为VIP位点,以去除品种鉴定位点后的高质量突变位点集作为候选位点集进行芯片选点。每个窗口选点的原则为:若窗口内有VIP位点则只保留VIP位点,若窗口内无VIP位点则选择该窗口内MAF值最高的位点并按照MAF<0.05、哈迪-温伯格平衡(Hardy-Weinberg Equilibrium, HWE)<10e-6的标准进行质量控制,以此类推。将选择位点提交北京康普森农业科技有限公司探针设计系统进行打分,根据选择的SNP位点的位置及两侧序列信息,通过北京康普森农业科技有限公司采用靶向捕获测序技术设计并合成探针,从而制得姜曲海猪50K SNP液相芯片。为验证姜曲海猪液相芯片的准确性,使用该芯片对36个样本进行检测,其中包括33个不同样本及3个样本的平行重复样本,通过统计样本检出率、位点检出率、重复样本分型一致率等指标对芯片进行评价。
1.4 姜曲海猪液相芯片的应用
使用姜曲海猪液相芯片对以下群体进行检测:1)7个猪种151个个体(表2);2)13头姜曲海公猪和90头姜曲海母猪。检测结果根据以下标准进行质控:1)性染色体上的位点;2)SNP call rate<0.9;3)个体call rate<0.9;4)MAF<0.01;5)HWE<10e-6。利用GCTA(V1.94)软件进行主成分分析(Principal Component Analysis,PCA)。利用Plink(V1.90)和GCTA(V1.94)软件分别构建状态同源(identity by state,IBS)距离矩阵和G矩阵,分析姜曲海猪保种群的亲缘关系,同时利用MegaX(V10.0)软件分析姜曲海猪保种群中种公猪的家系结构。
2 结果与分析
2.1 姜曲海猪液相芯片的位点分布
通过BWA-GATK检测流程获得的高质量突变位点集包含17 419 845个SNPs,选择位点经过探针设计系统打分后,最终11 169个品种鉴定位点和38 845个背景位点组成了液相芯片位点。液相芯片的位点在染色体上均匀分布,1号染色体上的位点最多(图1)。
图1 姜曲海猪液相芯片的位点分布
2.2 姜曲海猪液相芯片的评价
36个样本的平均数据量为2.20 G,平均Q30为91.35%,平均最佳比对率为97.78%。测序深度大于5×、10×、20×时样本平均检出率分别为98.96%、98.48%、97.35;位点平均检出率分别为97.70%、96.79、94.59%。3个平行重复样本JQH1608、JQH2002、JQH9010的分型一致的位点数分别为49 486、49 476、49 469,分型一致率分别为98.94%、98.92%、98.91%。上述指标表明姜曲海猪液相芯片在检出率和分型一致率方面表现较好,可以用于大量样本的检测。
2.3 姜曲海猪液相芯片在品种鉴定中的应用
图2显示了7个猪群体的PCA分析结果。从图2可以看出,姜曲海猪聚在同一类,二花脸猪和枫泾猪聚在同一类,杜洛克猪、大白猪和长白猪聚在同一类,苏姜猪靠近西方猪。
图2 7个猪群体的主成分分析
2.4 姜曲海猪液相芯片在亲缘鉴定中的应用
姜曲海猪保种群体的IBS遗传距离在0.129 2~0.449 0之间,平均值为0.329 4±0.039 2,13头保种公猪的IBS遗传距离在0.167 9~0.404 4之间,平均值为0.332 8±0.043 1,IBS遗传距离矩阵的结果如图3所示,多数姜曲海猪个体间的IBS遗传距离较远(紫色),部分个体间的IBS遗传距离较近(绿色)。
图3 遗传距离分析可视化结果图
姜曲海猪保种群体基因组关系矩阵的结果如图4所示,多数姜曲海猪个体间的亲缘关系呈中等程度(绿色),部分个体间的亲缘关系较近(紫色)。
图4 亲缘关系分析可视化结果图
2.5 姜曲海猪液相芯片在家系构建中的应用
姜曲海公猪NJ系统进化树显示13头公猪被分为6个家系(图5)。根据母猪与不同家系公猪的亲缘关系远近程度,将整个群体内的所有个体分为6个含有公猪的家系(图6)。此外,还发现有6头母猪和13头公猪亲缘关系都比较远,故将其单独列为另外一个不含公猪的家系。
图5 姜曲海公猪NJ系统进化树分析可视化结果图
图6 姜曲海猪群体NJ系统进化树分析可视化结果图
3 讨论与结论
本研究研发的液相芯片主要用于姜曲海猪品种鉴定、亲缘关系鉴定和家系构,因此芯片的位点主要以姜曲海猪品种鉴定位点为主,具有较强的品种特异性。在后续研究中可以基于全基因组关联分析(genome-wide association study, GWAS)、群体选择信号、基因的功能注释和各类文献、专利及报道等研究成果增加重要经济功能位点,同时调整芯片密度,制成可用于品种保护和遗传资源利用的经济实用型芯片。
PCA分析结果表明姜曲海猪液相芯片可以有效区别姜曲海猪和其他猪种,进一步说明芯片具有较强的品种特异性。二花脸猪和枫泾猪都是中国地方猪,杜洛克猪、大白猪和长白猪都是欧洲猪,因此可以分别聚在同一类。苏姜猪是以姜曲海猪、枫泾猪和杜洛克猪为亲本,通过继代选育而成的国家新品种猪,含有62.5%的杜洛克血统,因此靠近西方猪。
IBS距离矩阵和G矩阵可以评估亲缘关系。本研究中IBS遗传距离分析结果和基于G矩阵的亲缘关系系数分析结果较为一致,均表明姜曲海猪保种群中部分个体亲缘关系较近。青峪猪保种群的IBS遗传距离平均值为0.260 4±0.025 2,保种公猪的IBS遗传距离平均值为0.263 3±0.023 7。马身猪保种群的IBS遗传距离平均值为0.284 2±0.046 5,保种公猪的IBS遗传距离平均值为0.285 2±0.050 1。本研究中姜曲海猪保种公猪的IBS遗传距离平均值大于保种群的IBS遗传距离平均值,与上述研究结果一致。保种公猪的IBS遗传距离平均值较高说明保种公猪间的亲缘关系较远,可以有效地控制保种群近交系数的增长。
多个地方猪品种已基于基因组SNP进行了家系构建,推动了地方猪遗传资源的保护。本研究中姜曲海猪保种群被划分为6个含有公猪的家系和1个不含公猪的家系。为降低群体近交增量,可以选择不同家系的公母猪进行配种,同一家系的公母猪不建议进行配种,若需配种应选择亲缘关系较远的公母猪进行配种。不含公猪的家系中的母猪可与任何一头公猪进行配种。
本研究基于41个猪品种769个个体的重测序数据和靶向捕获测序技术研发了一款姜曲海猪50K SNP液相芯片,该芯片包含50 014个SNP位点,位点分布均匀,样本检出率、位点检出率和分型一致率较高,可以应用于姜曲海猪的品种鉴定、亲缘关系鉴定和家系构建,有助于推动姜曲海猪的保护。