中大分析文字报告发现新冠症状会随病毒变异及疫苗接种情况改变 并证实人工智能大型语言模型有助传染病研究
2019冠状病毒病(下称新冠)影响全球,香港中文大学(中大)医学院利用文字配对演算法,分析多份截至2022年8月25日新冠患者病例症状数据的文字报告(free-text symptom narratives),揭示新冠症状会随病毒变异和患者疫苗接种情况改变。该分析更识别出发烧、鼻塞、肺炎和呼吸急促这一组症状,有预测未接种疫苗及有病徵的年长患者死亡风险的作用。相关研究已在医学期刊《医学病毒学杂志》上发表。
由於人工智能(AI)大型语言模型的应用愈见普及,研究团队进行了另一项研究,探索时下非常流行的AI大型语言模型ChatGPT转化新冠症状文字报告为结构性数据的可能性,以发掘其於传染病流行病学研究的潜力。结果显示,ChatGPT能识别常见症状,敏感度高於85%。详细结果已在另一医学期刊《临床微生物学和感染》上发表。
两项研究有助理解新冠症状
在上述第一项研究中,研究团队利用文字配对演算法,对超过7.6万宗新冠病例的症状文字报告进行分析。结果显示,70.9%的病例出现病徵,并识别出102种症状。研究人员揭示原始型和Delta变异株在未接种疫苗的有病徵个案中出现的症状相似,但Omicron BA.2亚变异株则出现与原始病毒不同的症状,其中有七种在BA.2病人中更为普遍,包括疲倦、发烧、胸痛、流鼻水、咳痰、恶心或呕吐,以及喉咙痛。研究亦显示,在接种两剂或以上疫苗的有病徵个案中,感染BA. 2较感染Delta更易引起发烧。分析还识别出发烧、鼻塞、肺炎和呼吸急促这一组症状,有预测未接种疫苗及有病徵的年长患者死亡风险的作用。这些发现有助安老院舍制订照顾长者健康的策略。
通过分析文字报告,研究人员勾勒出广泛的新冠症状谱系。然而,从相关报告提取可分析的数据极具挑战性,且过程耗时,研究人员因而探索AI大型语言模型在医学研究中的应用。在上述第二项研究中,ChatGPT经研究团队进行提示工程后,从文字报告识别所有新冠症状的特异性达94.7%至100%,其识别常见症状的敏感度亦达85.3%至100%,显示其能准确地处理文字报告内的数据。
证实AI大型语言模型能有效解读复杂的医学报告
中大医学院赛马会公共衞生及基层医疗学院副研究员卫藴姸小姐表示:「通过采用文字配对演算法,我们描述了新冠症状随病毒变异及疫苗接种情况的演变。值得注意的是,研究识别了一组能预测未接种疫苗及有病徵的年长患者死亡风险的症状,有助安老院舍作针对性的干预和资源分配。这些研究证实了AI大型语言模型作为医学研究工具的作用,能将复杂的症状描述转化为结构性数据。这些研究发现为AI工具提供发展方向,有助未来流行病的早期检测、监测和应对。」
中大医学院赛马会公共衞生及基层医疗学院副教授郭健安教授补充:「以ChatGPT为例的AI大型语言模型,能为传染病流行病学分析带来重大的改变。这些模型擅长合成实时数据,能快速了解疾病进展并及早找出新的威胁。它们能将文字叙述转换为结构性数据,加快决策过程,并优化资源分配。这些AI模型能为不同受众提供清晰易明的资讯,促进公共衞生层面的沟通。最重要的是,这些模型能紧随传染病的演变不断学习和适应,它们在处理大规模及多样化的数据时,其灵活性为在流行病应对中制定更有效的数据驱动策略开创先例,在不断演变的环境中,为传染病研究和应对作出重要贡献。」
研究团队的其他成员包括来自中大医学院赛马会公共衞生及基层医疗学院的院长黄仰山教授、公共衞生学教授兼医疗体系及政策研究所总监杨永强教授、博士后研究员梁立群博士和高级研究助理Edward McNeil先生;来自墨尔本皇家理工大学(越南分校)的邓国雄博士;以及来自英国莱斯特大学和英国莱斯特皇家医院的陈伟志教授。