中大分析文字報告發現新冠症狀會隨病毒變異及疫苗接種情況改變 並證實人工智能大型語言模型有助傳染病研究
2019冠狀病毒病(下稱新冠)影響全球,香港中文大學(中大)醫學院利用文字配對演算法,分析多份截至2022年8月25日新冠患者病例症狀數據的文字報告(free-text symptom narratives),揭示新冠症狀會隨病毒變異和患者疫苗接種情況改變。該分析更識別出發燒、鼻塞、肺炎和呼吸急促這一組症狀,有預測未接種疫苗及有病徵的年長患者死亡風險的作用。相關研究已在醫學期刊《醫學病毒學雜誌》上發表。
由於人工智能(AI)大型語言模型的應用愈見普及,研究團隊進行了另一項研究,探索時下非常流行的AI大型語言模型ChatGPT轉化新冠症狀文字報告為結構性數據的可能性,以發掘其於傳染病流行病學研究的潛力。結果顯示,ChatGPT能識別常見症狀,敏感度高於85%。詳細結果已在另一醫學期刊《臨床微生物學和感染》上發表。
兩項研究有助理解新冠症狀
在上述第一項研究中,研究團隊利用文字配對演算法,對超過7.6萬宗新冠病例的症狀文字報告進行分析。結果顯示,70.9%的病例出現病徵,並識別出102種症狀。研究人員揭示原始型和Delta變異株在未接種疫苗的有病徵個案中出現的症狀相似,但Omicron BA.2亞變異株則出現與原始病毒不同的症狀,其中有七種在BA.2病人中更為普遍,包括疲倦、發燒、胸痛、流鼻水、咳痰、噁心或嘔吐,以及喉嚨痛。研究亦顯示,在接種兩劑或以上疫苗的有病徵個案中,感染BA. 2較感染Delta更易引起發燒。分析還識別出發燒、鼻塞、肺炎和呼吸急促這一組症狀,有預測未接種疫苗及有病徵的年長患者死亡風險的作用。這些發現有助安老院舍制訂照顧長者健康的策略。
通過分析文字報告,研究人員勾勒出廣泛的新冠症狀譜系。然而,從相關報告提取可分析的數據極具挑戰性,且過程耗時,研究人員因而探索AI大型語言模型在醫學研究中的應用。在上述第二項研究中,ChatGPT經研究團隊進行提示工程後,從文字報告識別所有新冠症狀的特異性達94.7%至100%,其識別常見症狀的敏感度亦達85.3%至100%,顯示其能準確地處理文字報告內的數據。
證實AI大型語言模型能有效解讀複雜的醫學報告
中大醫學院賽馬會公共衞生及基層醫療學院副研究員衛藴姸小姐表示:「通過採用文字配對演算法,我們描述了新冠症狀隨病毒變異及疫苗接種情況的演變。值得注意的是,研究識別了一組能預測未接種疫苗及有病徵的年長患者死亡風險的症狀,有助安老院舍作針對性的干預和資源分配。這些研究證實了AI大型語言模型作為醫學研究工具的作用,能將複雜的症狀描述轉化為結構性數據。這些研究發現為AI工具提供發展方向,有助未來流行病的早期檢測、監測和應對。」
中大醫學院賽馬會公共衞生及基層醫療學院副教授郭健安教授補充:「以ChatGPT為例的AI大型語言模型,能為傳染病流行病學分析帶來重大的改變。這些模型擅長合成實時數據,能快速了解疾病進展並及早找出新的威脅。它們能將文字敘述轉換為結構性數據,加快決策過程,並優化資源分配。這些AI模型能為不同受眾提供清晰易明的資訊,促進公共衞生層面的溝通。最重要的是,這些模型能緊隨傳染病的演變不斷學習和適應,它們在處理大規模及多樣化的數據時,其靈活性為在流行病應對中制定更有效的數據驅動策略開創先例,在不斷演變的環境中,為傳染病研究和應對作出重要貢獻。」
研究團隊的其他成員包括來自中大醫學院賽馬會公共衞生及基層醫療學院的院長黃仰山教授、公共衞生學教授兼醫療體系及政策研究所總監楊永強教授、博士後研究員梁立群博士和高級研究助理Edward McNeil先生;來自墨爾本皇家理工大學(越南分校)的鄧國雄博士;以及來自英國萊斯特大學和英國萊斯特皇家醫院的陳偉志教授。