利用人工智能(AI)的力量并将其成功融入日常生活可能是一个难题。人工智能的潜力是惊人的。Appleby和Basran阐明了1,2人工智能及其子领域机器学习(ML)对未来兽医学的价值;他们大胆地指出:“使用人工智能的兽医将取代不使用人工智能的兽医。”

去年,我们讨论了将基于网络的人工智能纳入生物安全工具包的必要性。3具体来说,我们阐述了将人工智能应用于我们的常见数据流(如诊断结果和动物移动)以预测传染病暴发的潜力。这些信息将在疫情暴发前让我们采取生物安全措施,从而预防疫情暴发,而不是对疫情暴发后才响应。要实现ML在猪病管理方面的潜力,其局限性在于数据的可用性和数据质量。在此,我们总结了由我们的多学科团队撰写的一篇题为《利用机器学习预测猪群感染》的文章。
我们考虑了六种具有不同特征组合的ML模型,以确定概括性最好和性能最佳的模型。具体来说,我们在两个系统中都考虑了逻辑回归、支持向量机、决策树、梯度提升和随机森林;在系统B中,我们还考虑了一个神经网络模型(自动编码器MLP)来处理分布偏移。主要贡献有5点:
1.生产数据和外部因素(尤其是天气)有助于建立感染模型。
a.在系统A中,附近猪场的距离、仔猪总存栏数、每头配种母猪每年的断奶猪数(PWMFY)、怀孕率和后备母猪平均存栏数(每个期内后备母猪总天数)。
b.在系统B中,试验率、风向和风速、母猪妊娠饲料、进猪和生物安全数据是重要的预测因素。
c.生物安全数据对PRRS、肺炎支原体(MHP)和PEDV很重要:员工出入点方案对PRRS和PEDV预测很有价值,而尸体处理方案对PEDV和MHP预测很有价值。
2.每天预测阳性样品,并在猪场层面确定感染PRRSV、PEDV、MHP、IAV-S的概率(阳性/阴性结果)。
3.在使用60天历史窗口期时,对阳性样本预测进行提前预警(7天和30天)。
4.在两个独立的生产系统中使用的模型,能够适用于不同的数据粒度情况。
a.系统A数据稀少,粒度较低,用于推断全球感染趋势。系统B的粒度较高,用于建立PEDV、PRRSV、MHP和IAV感染的探测模型。
b.猪只移动数据有助于根据测试分数的提高进行推广。系统B的猪只移动数据量有限,因此疾病模型的性能可能会随着猪只移动数据的增加而提高。先前的研究证实了猪只移动数据对预测PEDV和PRRSV的价值。
5.成功解决数据可用性和分布偏移问题的方法贯穿始终。
a.对于以时间序列收集的数据而言,分布偏移可能是一个难以克服的问题。
模型性能的评判标准是平衡准确性,是衡量模型将病例正确分类为阳性和阴性的程度。利用系统A数据创建的全球疾病模型可对任何阳性或阴性病例进行分类,其平衡准确率为85%。利用系统B数据创建的疾病特定模型可预测PEDV、PRRSV、MHP和IAV感染,其平衡准确率在58-74%之间。
总之,这项工作从整体上考虑了生产系统,包括两个系统中的母猪场、保育场/育肥场。此外,还对数据可用性水平不同的两个不同的农场生产系统进行了分析和比较,结果表明机器学习能够预测这两种情况下的阳性样本。

去年,我们讨论了将基于网络的人工智能纳入生物安全工具包的必要性。3具体来说,我们阐述了将人工智能应用于我们的常见数据流(如诊断结果和动物移动)以预测传染病暴发的潜力。这些信息将在疫情暴发前让我们采取生物安全措施,从而预防疫情暴发,而不是对疫情暴发后才响应。要实现ML在猪病管理方面的潜力,其局限性在于数据的可用性和数据质量。在此,我们总结了由我们的多学科团队撰写的一篇题为《利用机器学习预测猪群感染》的文章。
我们考虑了六种具有不同特征组合的ML模型,以确定概括性最好和性能最佳的模型。具体来说,我们在两个系统中都考虑了逻辑回归、支持向量机、决策树、梯度提升和随机森林;在系统B中,我们还考虑了一个神经网络模型(自动编码器MLP)来处理分布偏移。主要贡献有5点:
1.生产数据和外部因素(尤其是天气)有助于建立感染模型。
a.在系统A中,附近猪场的距离、仔猪总存栏数、每头配种母猪每年的断奶猪数(PWMFY)、怀孕率和后备母猪平均存栏数(每个期内后备母猪总天数)。
b.在系统B中,试验率、风向和风速、母猪妊娠饲料、进猪和生物安全数据是重要的预测因素。
c.生物安全数据对PRRS、肺炎支原体(MHP)和PEDV很重要:员工出入点方案对PRRS和PEDV预测很有价值,而尸体处理方案对PEDV和MHP预测很有价值。
2.每天预测阳性样品,并在猪场层面确定感染PRRSV、PEDV、MHP、IAV-S的概率(阳性/阴性结果)。
3.在使用60天历史窗口期时,对阳性样本预测进行提前预警(7天和30天)。
4.在两个独立的生产系统中使用的模型,能够适用于不同的数据粒度情况。
a.系统A数据稀少,粒度较低,用于推断全球感染趋势。系统B的粒度较高,用于建立PEDV、PRRSV、MHP和IAV感染的探测模型。
b.猪只移动数据有助于根据测试分数的提高进行推广。系统B的猪只移动数据量有限,因此疾病模型的性能可能会随着猪只移动数据的增加而提高。先前的研究证实了猪只移动数据对预测PEDV和PRRSV的价值。
5.成功解决数据可用性和分布偏移问题的方法贯穿始终。
a.对于以时间序列收集的数据而言,分布偏移可能是一个难以克服的问题。
模型性能的评判标准是平衡准确性,是衡量模型将病例正确分类为阳性和阴性的程度。利用系统A数据创建的全球疾病模型可对任何阳性或阴性病例进行分类,其平衡准确率为85%。利用系统B数据创建的疾病特定模型可预测PEDV、PRRSV、MHP和IAV感染,其平衡准确率在58-74%之间。
总之,这项工作从整体上考虑了生产系统,包括两个系统中的母猪场、保育场/育肥场。此外,还对数据可用性水平不同的两个不同的农场生产系统进行了分析和比较,结果表明机器学习能够预测这两种情况下的阳性样本。