医疗AI上周速览:顶级研究论文/模型🏅(2024年9月21日至9月27日)

社区文章 发布于2024年9月28日

image/jpeg

🏅 本周医疗AI论文

o1 在医学中的初步研究:我们离AI医生更近了吗?

本论文介绍了 o1,这是一个大型语言模型(LLM),在37个医学数据集上进行了评估,与GPT-4和GPT-3.5相比,在临床理解、推理和多语言能力方面表现出卓越的性能。

主要结果包括:

  • 比GPT-4高出6.2%
  • 在概念识别任务上比GPT-3.5高出26.6%

尽管取得了进步,但幻觉和多语言性能不一致等挑战依然存在。这项研究标志着迈向AI驱动的临床决策的重要一步。

论文链接:https://arxiv.org/abs/2409.15277

image/png


医疗大语言模型及其他模型

  • DREAMS:医疗大语言模型Python框架
  • Uni-Med:统一医疗通才大语言模型
  • O1 in Medicine:AI医生潜力
  • Genome Language Model:机遇与挑战

框架与方法

  • 肿瘤学运营数字孪生
  • 加强医疗AI的护栏
  • InterMind:大语言模型驱动的抑郁症评估
  • 会话式健康代理:大语言模型框架

医疗大语言模型与基准

  • CHBench:中文大语言模型健康评估
  • 用于精神疾病评估的大语言模型
  • MEDICONFUSION:探测医疗大语言模型可靠性
  • PALLM:评估姑息治疗大语言模型
  • 蛋白质语言模型:规模化的必要性?

医疗大语言模型应用

  • 用于精神健康严重程度预测的大语言模型
  • 针对放射学报告对大语言模型进行微调
  • 大语言模型在患者教育中的应用:腰背疼痛
  • 通过检索上下文增强医疗大语言模型
  • 临床大语言模型的持续预训练

医疗AI伦理

  • 医学影像AI中的置信区间
  • 生成式AI临床应用准备度

评论与其他

  • 近距离放射治疗中的AI综述
  • 电子健康记录信息检索:嵌入模型
  • 医疗保健中的大语言模型:综合综述
  • 大语言模型:从通用到医疗应用调查

其他标题(其余基准)

  • 用于精神疾病评估的大语言模型
  • 医疗保健中的大语言模型:综合综述
  • 蛋白质语言模型:规模化的必要性?
  • 加强医疗AI的护栏

查看完整帖子:https://x.com/OpenlifesciAI/status/1840020394880667937

感谢您一直以来对本系列的支持与喜爱!关注@aaditya 🤗,获取医疗大语言模型、数据集和顶级研究论文的每周更新。

如果您知道任何被遗漏的有趣论文,请随时留言。如果您有任何关于医疗AI的见解或突破,希望在下周的版面中分享,请通过 Twitter/X 联系我们:OpenlifesciAI

社区

注册登录 发表评论