对着手机咳嗽一声，就能检测新冠了？还是剑桥大学出品（组图）

2022-09-12 来源：新智元原文链接评论5条

新冠病毒的出现，真算是打开了潘多拉的魔盒。

如今不断新出现的变种，打乱了整个地球人的生活。新冠之前那种不戴口罩的生活，也许再也回不去了。

最近，科学家们有了一个新发现，或许未来可以让我们告别捅嗓子眼儿的日子。

对着手机咳嗽一声，就能检测新冠了？还是剑桥大学出品（组图） - 1

在西班牙巴塞罗那举行的欧洲呼吸学会国际会议上，一项研究显示，AI可通过手机应用程序收集到的声音，判断用户有没有感染新冠肺炎。

根据News Medical的报告，本研究中使用的AI模型比快速抗原检测更便宜、更快、更易于使用，非常适用于PCR检测昂贵的低收入国家。

此外，这个AI还有一个更厉害的地方——准确率更高。比起快速抗原测试，它的准确率能达到89%。

准确率达89%

研究团队使用了来自英国剑桥大学「新冠肺炎声音库」APP的数据，该应用程序包含来自4352名健康和非健康参与者的893个音频样本。研究结果表明，简单的语音记录和AI算法可以精确确定哪些人感染新冠肺炎。

对着手机咳嗽一声，就能检测新冠了？还是剑桥大学出品（组图） - 2

小编以为发现宝藏APP了，满心期待地下载之后发现，这款评分2.8的应用，目前只是用来收集数据的。

高情商：你为科学的发展出了一份力。

低情商：这软件暂时卵用没有。

对着手机咳嗽一声，就能检测新冠了？还是剑桥大学出品（组图） - 3

荷兰马斯特里赫特大学数据科学研究所研究员Wafaa Aljbawi女士在大会上表示，AI模型在89%的情况下是准确的，而横向流动测试的准确度就因品牌而异了，而且，横向流动测试在检测无症状人群时，准确性要低得多。

这些有希望的结果表明，简单的录音和微调的 AI 算法可能会在确定哪些患者感染 COVID-19方面实现高精度。此类测试可以免费提供，并且易于解释。此外，它们支持远程虚拟测试，并且周转时间不到一分钟。例如，它们可以用于大型集会的入口点，从而能够快速筛查人群。”

Wafaa Aljbawi，研究员，数据科学研究所，马斯特里赫特大学

这个结果太令人兴奋了。这意味着：通过基本语音记录和定制AI算法，我们就可以以很高的精度识别COVID-19感染患者。又免费，又好用。小编兴奋地搓手：这是不是意味着，三天一捅的日子可以结束了？

对着手机咳嗽一声，就能检测新冠了？还是剑桥大学出品（组图） - 4

这个方法的原理是：感染COVID-19后，人的上呼吸道和声带会受到影响，从而改变声音。

为了验证这个方法的可行性，来自同一数据科学研究所的Visara Urovi博士和马斯特里赫特大学医学中心的肺病学家Sami Simons博士也进行了测试。

他们使用了来自剑桥大学的众包COVID-19Sounds 应用程序的信息，包括来自4,352名健康和不健康受试者的893个音频样本，这其中，有308人的COVID-19测试结果是阳性的。

对着手机咳嗽一声，就能检测新冠了？还是剑桥大学出品（组图） - 5

测试时，用户将APP下载到手机后，就要开始记录呼吸音。这个过程中，要先咳嗽3次，再用嘴深呼吸3到5次，然后在屏幕上读一个简短的句子3次。

研究人员采用了一种称为梅尔谱图分析的语音分析方法，该技术可以识别不同的语音特征，例如响度、功率和随时间的变化。

「通过这种方式，我们可以分解被试声音的许多属性，」Aljbawi 女士说。「为了区分COVID-19患者和未患病者的声音，我们建立了不同的人工智能模型，并评估了哪一个模型最适合对COVID-19病例进行分类。」

他们发现，一种被称为长短期记忆（LSTM）的模型显著优于其他模型。LSTM基于神经网络，它会模仿人脑的运作方式，识别出数据中的潜在关系。因为适用于序列，所以它很适合对随时间收集的信号进行建模，比如从语音中收集的信号，因为它能够将数据存储在内存中。

其总体准确率为 89%，正确识别阳性病例的能力（真阳性率或「敏感性」）为 89%，正确识别阴性病例的能力（真阴性率或「特异性」）为 83%。

对着手机咳嗽一声，就能检测新冠了？还是剑桥大学出品（组图） - 6
新冠患者和健康的人的咳嗽序列图

这些结果表明，与横向流动测试等最先进的测试相比，LSTM模型诊断 COVID-19 的准确性有了显着提高。

比较结果可以用一句话总结：LSTM模型对于阳性的识别率更高，但是也更容易把阴性误诊为阳性。

具体来说，横向流动测试的灵敏度仅为 56%，但特异性更高，为 99.5%，因此横向流动测试会更频繁地将阳性误测为阴性。使用LSTM模型可能会错过100个病例中的11个，而侧向流测试则会错过100个病例中的44个。

横向流动测试的高特异性，意味着只有1/10的阴性会被误诊为阳性，而LSTM测试的误诊率更高，会把100名阴性中的17个误诊为阳性。但是，由于该测试实际上是免费的，如果LSTM显示是阳性，可以再让人们进行PCR测试。所以后者的影响并不大。

目前，研究人员还在进一步验证他们的结果。他们使用了大量数据。自实验开始以来，他们已经收集了来自36,116个人的53,449个音频样本，可用于增强和验证模型的准确性。另外，他们还在进行其他研究，来确定还有哪些语音的因素会影响 AI 模型。

相关论文

2021年6月，研究人员开始探索使用AI模型用作COVID-19的自动筛选工具时，可以在多大程度上被信任。在这篇被INTERSPEECH 2021接收的论文中，他们试着将不确定性估计与深度学习模型结合，从声音中检测COVID-19。

对着手机咳嗽一声，就能检测新冠了？还是剑桥大学出品（组图） - 7

论文地址：https://arxiv.org/pdf/2104.02005.pdf

在论文中，研究人员分析了330名阳性和919名阴性被试的子集。

他们提出了一个集成学习框架，该框架在训练阶段解决了数据不平衡的常见问题，并在推理期间提供了预测不确定性，具体化为模型集成产生的预测的方差。主干模型是一个名为 VGGish 1的预训练卷积网络，经过修改以接收三种声音的频谱图作为输入。

对着手机咳嗽一声，就能检测新冠了？还是剑桥大学出品（组图） - 8

在这项工作中，10个深度学习模型被训练并聚合成一个集成模型，产生0.74的 AUC，灵敏度为0.68，特异性为0.69，优于每个模型。一方面，验证了深度学习对基于音频的COVID-19检测的手工制作特征的优越性。另一方面，展示了 SVM的集成进一步提高了单个SVM模型的性能，因为样本被更有效地利用。

对着手机咳嗽一声，就能检测新冠了？还是剑桥大学出品（组图） - 9