医疗AI上周速览:顶级研究论文/模型🏅(2024年9月21日至9月27日)
社区文章 发布于2024年9月28日

🏅 本周医疗AI论文
o1 在医学中的初步研究:我们离AI医生更近了吗?
本论文介绍了 o1,这是一个大型语言模型(LLM),在37个医学数据集上进行了评估,与GPT-4和GPT-3.5相比,在临床理解、推理和多语言能力方面表现出卓越的性能。
主要结果包括:
- 比GPT-4高出6.2%
- 在概念识别任务上比GPT-3.5高出26.6%
尽管取得了进步,但幻觉和多语言性能不一致等挑战依然存在。这项研究标志着迈向AI驱动的临床决策的重要一步。
论文链接:https://arxiv.org/abs/2409.15277
医疗大语言模型及其他模型
- DREAMS:医疗大语言模型Python框架
- Uni-Med:统一医疗通才大语言模型
- O1 in Medicine:AI医生潜力
- Genome Language Model:机遇与挑战
框架与方法
- 肿瘤学运营数字孪生
- 加强医疗AI的护栏
- InterMind:大语言模型驱动的抑郁症评估
- 会话式健康代理:大语言模型框架
医疗大语言模型与基准
- CHBench:中文大语言模型健康评估
- 用于精神疾病评估的大语言模型
- MEDICONFUSION:探测医疗大语言模型可靠性
- PALLM:评估姑息治疗大语言模型
- 蛋白质语言模型:规模化的必要性?
医疗大语言模型应用
- 用于精神健康严重程度预测的大语言模型
- 针对放射学报告对大语言模型进行微调
- 大语言模型在患者教育中的应用:腰背疼痛
- 通过检索上下文增强医疗大语言模型
- 临床大语言模型的持续预训练
医疗AI伦理
- 医学影像AI中的置信区间
- 生成式AI临床应用准备度
评论与其他
- 近距离放射治疗中的AI综述
- 电子健康记录信息检索:嵌入模型
- 医疗保健中的大语言模型:综合综述
- 大语言模型:从通用到医疗应用调查
其他标题(其余基准)
- 用于精神疾病评估的大语言模型
- 医疗保健中的大语言模型:综合综述
- 蛋白质语言模型:规模化的必要性?
- 加强医疗AI的护栏
查看完整帖子:https://x.com/OpenlifesciAI/status/1840020394880667937
感谢您一直以来对本系列的支持与喜爱!关注@aaditya 🤗,获取医疗大语言模型、数据集和顶级研究论文的每周更新。
如果您知道任何被遗漏的有趣论文,请随时留言。如果您有任何关于医疗AI的见解或突破,希望在下周的版面中分享,请通过 Twitter/X 联系我们:OpenlifesciAI