Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the advanced-cron-manager domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /www/wwwroot/www.help4uu.com/wp-includes/functions.php on line 6121
GPT-4眼科评估能力惊艳,但专家警告需审慎应用 | 科技云

GPT-4眼科评估能力惊艳,但专家警告需审慎应用

GPT-4眼科评估能力惊艳,但专家警告需审慎应用
GPT-4眼科评估能力惊艳,但专家警告需审慎应用

剑桥大学临床医学院的最新研究发现,OpenAIGPT-4模型在眼科评估中的表现几乎可与该领域的专家相媲美。这一突破性成果在金融时报首次报道后,引起了医疗和科技界的广泛关注。

在这项发表在PLOS数字健康杂志上的研究中,研究人员对GPT-4及其前身GPT-3.5、谷歌的PaLM 2以及梅塔美洲驼进行了眼科知识测试。测试内容涵盖了从光敏感到病变等各个方面的87道选择题,难度与眼科教科书中的题目相当。五名眼科专家、三名实习眼科医生和两名非专业初级医生也接受了相同的模拟考试。值得注意的是,这些题目对于LLM模型而言是全新的,因为它们之前并未接触过相关内容。

在测试中,GPT-4展现了令人印象深刻的表现,答对了60道问题,得分高于实习医生和初级医生。尽管这一成绩略逊于眼科专家的平均得分66.4,但已足以显示其在眼科评估领域的巨大潜力。相比之下,PaLM 2、GPT-3.5和梅塔美洲驼的得分分别为49分、42分和28分,均低于初级医生的平均水平。

然而,尽管这些结果展示了LLM在医疗领域的潜在应用,研究人员也警告称,必须谨慎对待这些模型的输出结果。他们指出,测试中的问题数量有限,特别是在某些类别中,这可能导致实际结果有所偏差。此外,LLM模型存在“幻觉”现象,即生成不相关或错误的事实,这在医疗领域尤为危险。如果模型错误地诊断出白内障或癌症等严重疾病,将可能对患者造成严重后果。

研究人员强调,虽然LLM模型在眼科评估中展现了令人鼓舞的初步成果,但在实际应用中仍需谨慎对待。未来,应进一步探索如何提高模型的准确性和可靠性,以确保其能够安全、有效地服务于医疗领域。

此项研究为LLM模型在医疗领域的应用提供了新的视角,也提醒我们在追求技术进步的同时,必须关注其潜在的风险和局限性。随着LLM技术的不断发展,我们期待未来能够看到更多关于其如何在医疗领域造福社会的报道。

文章来源于互联网:科技云-GPT-4眼科评估能力惊艳,但专家警告需审慎应用

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注