Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the advanced-cron-manager domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /www/wwwroot/www.help4uu.com/wp-includes/functions.php on line 6121
GPT-4眼科评估能力惊艳，但专家警告需审慎应用 | 科技云

GPT-4眼科评估能力惊艳，但专家警告需审慎应用

布鲁克 • 2024年 4月 21日 am8:25 • AI • 阅读 135

GPT-4眼科评估能力惊艳，但专家警告需审慎应用

GPT-4眼科评估能力惊艳，但专家警告需审慎应用

剑桥大学临床医学院的最新研究发现，OpenAI的GPT-4模型在眼科评估中的表现几乎可与该领域的专家相媲美。这一突破性成果在金融时报首次报道后，引起了医疗和科技界的广泛关注。

在这项发表在PLOS数字健康杂志上的研究中，研究人员对GPT-4及其前身GPT-3.5、谷歌的PaLM 2以及梅塔美洲驼进行了眼科知识测试。测试内容涵盖了从光敏感到病变等各个方面的87道选择题，难度与眼科教科书中的题目相当。五名眼科专家、三名实习眼科医生和两名非专业初级医生也接受了相同的模拟考试。值得注意的是，这些题目对于LLM模型而言是全新的，因为它们之前并未接触过相关内容。

在测试中，GPT-4展现了令人印象深刻的表现，答对了60道问题，得分高于实习医生和初级医生。尽管这一成绩略逊于眼科专家的平均得分66.4，但已足以显示其在眼科评估领域的巨大潜力。相比之下，PaLM 2、GPT-3.5和梅塔美洲驼的得分分别为49分、42分和28分，均低于初级医生的平均水平。

然而，尽管这些结果展示了LLM在医疗领域的潜在应用，研究人员也警告称，必须谨慎对待这些模型的输出结果。他们指出，测试中的问题数量有限，特别是在某些类别中，这可能导致实际结果有所偏差。此外，LLM模型存在“幻觉”现象，即生成不相关或错误的事实，这在医疗领域尤为危险。如果模型错误地诊断出白内障或癌症等严重疾病，将可能对患者造成严重后果。

研究人员强调，虽然LLM模型在眼科评估中展现了令人鼓舞的初步成果，但在实际应用中仍需谨慎对待。未来，应进一步探索如何提高模型的准确性和可靠性，以确保其能够安全、有效地服务于医疗领域。

此项研究为LLM模型在医疗领域的应用提供了新的视角，也提醒我们在追求技术进步的同时，必须关注其潜在的风险和局限性。随着LLM技术的不断发展，我们期待未来能够看到更多关于其如何在医疗领域造福社会的报道。

文章来源于互联网:科技云-GPT-4眼科评估能力惊艳，但专家警告需审慎应用

gpt gpt-4 openai 互联网安全科技谷歌

赞 (0)

0 0

苹果iPhone 16全系真机曝光：回归经典竖向摄像头设计，硬件创新备受期待

上一篇 2024年 4月 21日 am7:25

华硕Chromebook Flip CM5在美国亚马逊直降230美元，仅需299.99美元

下一篇 2024年 4月 21日 am9:25

AI

谷歌发布新型视频生成模型Veo，挑战OpenAI的Sora

在人工智能领域，视频生成技术一直是研究的热点。近日，谷歌2024 I/O开发者大会上宣布推出一款名为Veo的新型视频生成模型，剑指OpenAI三个月前推出的Sora，展示了其在视频…

香克斯
2024年 5月 15日
0
AI

Character.AI使用攻略：小白也能轻松上手

Character.AI，作为一款可定制化的AI聊天工具，近年来备受瞩目。它不仅能让你与虚拟角色进行深度对话，还能帮助你创建自己心仪的角色，与之互动。对于初次接触Character…

路飞
2024年 6月 23日
0
AI

Anthropic 发布全新 AI 模型 Claude 3.5 Sonnet，强化与 OpenAI 的竞争

在人工智能领域，一场激烈的竞赛正在上演。本周四，由 OpenAI 前研发高管创立的 Anthropic 公司，正式发布了其最新的大型语言模型 Claude 3.5 Sonnet，这…

娜美
2024年 6月 21日
0
AI

OpenAI与新闻集团达成多年协议，将利用优质新闻内容训练ChatGPT

OpenAI近日宣布与新闻集团达成一项多年合作协议，该集团包括华尔街日报、市场观察、太阳报等十几个知名出版品牌。根据协议，OpenAI将能够访问新闻集团出版物的当前和存档内容，以进…

弗兰克
2024年 5月 23日
0
AI

传闻X平台秘密研发xAI Grok新功能，增强Premium用户体验

独立应用程序研究者Nima Owji近日透露，X社交平台正紧锣密鼓地开发一系列基于其xAI Grok模型的创新功能，旨在为其Premium订阅用户提供更加丰富和个性化的使用体验。这…

香克斯
2024年 7月 8日
0
AI

三星电子再加码人工智能已同首尔大学建立联合研发中心

近日消息，据外媒报道，在新设北美AI中心管理在北美的人工智能研发实验室，整合在加拿大多伦多和加州山景城的研发设施，并聘请苹果前高管Murat Akbacak出任总监后，三星电子在人…

乔巴
2024年 6月 18日
0
AI

阿里巴巴开源Qwen1.5-110B模型，性能比肩Meta-Llama3-70B

近日，阿里巴巴宣布开源了其Qwen1.5系列中的首个千亿参数模型——Qwen1.5-110B。这一举措不仅彰显了阿里巴巴在人工智能领域的创新实力，也标志着中国企业在大型语言模型领域…

乌索普
2024年 4月 28日
0
AI

欧盟成立人工智能办公室加强AI监管推动可信技术发展

在科技飞速发展的今天，人工智能（AI）的监管问题日益受到全球关注。当地时间5月29日，欧盟宣布正式成立人工智能办公室，旨在加强对AI技术的监管，支持可信AI的发展和使用，并防范潜在…

布鲁克
2024年 5月 30日
0
AI

ChatGPT因生成错误信息违反数据保护法规，遭奥地利隐私权组织NOYB投诉

维也纳总部的隐私权倡导组织NOYB（None of Your Business）周一宣布，将针对聊天机器人ChatGPT在奥地利提起投诉，指控这款由OpenAI开发的人工智能工具会…

小科
2024年 4月 29日
0
AI

Anthropic 在欧洲推出多语言生成式 AI 助手 Claude

人工智能领域的创新者 Anthropic 公司近日宣布，其先进的生成式 AI 助手 Claude 将于当地时间周二正式在欧洲上线。这款备受期待的产品已经在欧洲的金融和酒店等行业展现…

罗宾
2024年 5月 15日
0

发表回复