關注全球時事|洞察國際風雲
2025-03-18 17:24 星期二

上海人工智能实验室发布 新版中文医疗大模型权威评测平台

时间:2025-12-03 10:36 来源:快讯社

  近日,上海市人工智能实验室发布中文医疗大模型权威评测平台MedBench 4.0,这是国内首个面向垂直大模型、专用大模型、应用场景的医疗大模型评测与验证体系。业内人士介绍,MedBench 4.0为衡量医学AI产品性能与可靠性提供了科学标尺,保障了医疗人工智能产品质量的提升与行业良性竞争。

  据悉,中文医疗大模型权威评测平台MedBench首发于2023年年中,目前更新至第四版。上海人工智能实验室医疗和评测中心负责人徐捷介绍,本次升级包含大语言模型、多模态大模型及智能体三大技术范式,深度对齐国家《卫生健康行业人工智能应用场景参考指引》,覆盖60个全自主构建评测集,共70万余专业评测题。

  记者从上海市人工智能实验室了解到,针对大语言模型评测,平台围绕医学知识问答、语言理解、生成、复杂推理及安全伦理等维度构建了评测集,并创新引入科学指标体系,以缓解模型信息遗漏或幻觉生成等问题对评测结果的影响;针对多模态大模型评测,瞄准医疗影像、检测报告等临床核心场景,平台可覆盖目标检测、图像分类、多模态报告质控、序列影像理解、病程动态追踪等10项细分任务,填补了中文医疗多模态评测领域的技术缺口;针对智能体评测,平台则重点解决智能体执行断层的问题,推动医疗智能体从“能对话”向“能执行、能协作”演进。

  对于医疗大模型评测的意义,徐捷告诉记者,评测首先可以验证医疗大模型的合规性,其次是验证其专业性,比如会不会误诊、漏诊或者开错药,最终帮助市场更好地训练出优质的医疗大模型。

  记者注意到,目前,不少通用大模型如深度求索、千问等都可以分析体检报告和检查报告。那么,医疗大模型的价值何在呢?

  对此,徐捷介绍称,主流通用大模型可以满足日常健康咨询。评测显示,国内头部通用大模型的医学能力已经超过国外同类产品。但对于需要给出专业判断的医疗场景,例如要做哪些检查、如何解读报告、应开什么药或者中医方剂等,大模型还需整合大量医学数据、专家医案和临床经验等语料。医疗大模型能高效处理海量信息,提供循证参考,有助于提升医生诊疗水平、补足基层医疗短板,进而实现医学普惠。

  除推出权威评测平台,上海人工智能实验室还联合专业医疗机构和相关企业,推出了儿童眼病智能筛查与精准干预系统、胃肠多模态辅助诊疗大模型等医疗人工智能应用。(记者 叶健 )


外交部:将本着科学原则研究日方关于恢复水产品输华请求
外交部:坚决反对美国向中国台湾地区出售武器
测试视频
综合看点 查看更多>>
美伊谈判月底继续 围绕对伊核查各执一词
“崔贤”号新型多用途驱逐舰正式进入朝鲜海军服役
英国首相斯塔默宣布辞职
英媒:四面楚歌 斯塔默着手制定下台时间表
美伊远程签署谅解备忘录,60天谈判窗口期开启
纵横天下 查看更多>>
鲁比奥:美伊技术性谈判将于月底恢复
巴方称伊美谅解备忘录谈判未涉及弹道导弹议题
东盟秘书长:东盟和中国应深化合作应对全球挑战
瑞典时隔40多年再建反应堆 北欧核电迎复苏潮
乌克兰首都基辅遭空袭 多次传出爆炸声
哥伦比亚官方确认德拉埃斯普列亚当选新任总统
第九届进博会肯尼亚座谈会在内罗毕举行
议会否决组阁方案 罗马尼亚新总理人选仍待定
“小国”黎巴嫩何以牵动美伊谈判
卢浮宫馆长称该博物馆已“不堪重负”
中国式现代化成就图片展在莫斯科举行
伊朗强调可自由使用被解冻资产
俄罗斯纪念卫国战争爆发85周年
伊朗代表团暂停伊美谈判 抗议特朗普威胁言论
以媒:在美施压下以色列将与叙利亚恢复谈判
“超算+智算”助中国超算性能时隔九年再登全球第一
中国海军83舰编队抵达俄罗斯进行友好访问
夏季达沃斯为什么是大连
中国政府发布关于全球治理的白皮书
习近平同缅甸总统敏昂莱举行会谈
“六张网”夯实中国式现代化战略底座
王毅谈第十六次金砖国家安全事务高级代表会议成果
第四届中国国际供应链促进博览会开幕
中国大市场利好全球南方国家
我国成功发射卫星互联网低轨22组卫星
江西文旅推介会在香港举办
解放军驻香港部队举办“七一”军营开放活动
香港教育局公布《中小学数字教育发展蓝图》
以文化根脉涵养多元气象——访澳门特区政府社会文化司司长柯岚
厚植情谊 携手共创更美好未来——第十八届海峡论坛综述
风沙渐远 生机绵长——“三北”工程攻坚一线观察
三江源:护万里清流 守中华水塔
落实《新城市议程》 中国推动城市可持续发展实践成果发布
“蓝色本草”能给百姓带来什么
北京城市副中心十年发展成效观察
第四届发展中国家与国际法论坛在京举行
最高法发布4件依法惩治渎职犯罪典型案例
国务院举行宪法宣誓仪式 李强总理监誓
最高法发布典型案例惩治利用无人机非法狩猎
国家版权局等四部门启动 “剑网2026”专项行动
“三农”记者的三夏日记丨藏在麦田里的新“种子”
河润良田千畴绿 初夏乡野尽风光
现代化农机装备驰骋“北大仓”
贺兰山下枸杞红 头茬采摘迎丰收
千亩蓝莓铺就增收“甜蜜路”
国家卫生健康委关于修改和废止部分部门规章的决定(附解读)
发现甲状腺结节该怎么办?中医教您整体调理,改善结节状况
从中年“一身病”到74岁无“三高”,他坚持了这3件事!
国家卫生健康委就介绍“食品安全与营养健康 ”有关情况举行新闻发布会(文字实录)
国务院关于推行常住地提供基本公共服务的实施意见
前沿科技 查看更多>>
链博会观察:AI如何嵌入供应链全链路?
中国超算“灵晟”登顶全球超算500强新榜单
在智造一线,看机器人“结”新硕果
深圳机器人“八大金刚”迎来“双击时刻”
人工智能全面赋能电商大促
健康生活 查看更多>>
人形机器人加速开启作业模式
31个省份将差异化推进人工智能发展
“人工智能+”迈向规模化落地
新型量子传感器可探测引力波和暗物质
高铁为何“日出而作,日落而息”
实用技术 查看更多>>
0.8毫米丝绳撑起50公斤 揭秘机器人“硬核手劲”密码
链博会首设人工智能专区 应用加速落地
加强算力网与新型电网、新一代通信网规划建设的协同联动
全国一体化算力网加快建设
多部门推动新能源重卡应用 利好动力电池与氢能产业链
科普博览 查看更多>>
五部门部署开展工业5G独立专网试点
未来五年,这十大新兴技术值得关注
我国科研团队揭示“引力子模”的起源
3D打印机成热门新家电
中国正加紧筹建世界人工智能合作组织
第十七届夏季达沃斯论坛“文化之夜”精彩绽放
探秘生灵奇缘 感受文明之光
山西忻州:民俗新潮交融 古城欢度端午
2026年公祭中华人文始祖伏羲大典在甘肃天水举行
临泉面塑:百年技艺的传承与新生
武汉理工大学:扎根行业沃土 培育定义未来的“系统工程师”
2026年广东高考分数线公布
新疆2026年高考分数线公布
内蒙古2026年高考分数线公布
6月23日起2026年高考成绩陆续可查 高校支招:志愿填报如何平衡城市、学校与专业的关系
世界杯|星光熠熠 奇迹不断——小组赛第二轮综述
世界杯C罗连续六届世界杯进球 葡萄牙大胜乌兹别克斯坦
世界杯阿根廷两连胜提前出线 梅西登顶历史射手榜
2026年世界体操联合会艺术体操世界挑战杯(北京站)集体项目5球决赛:中国队夺冠
世界杯丨小组赛:乌拉圭队战平佛得角队
文旅新探丨坡上有新风
福州长乐国际机场成为福建省首座4F级机场
端午节假期国内出游1.24亿人次
俄远东举行“中国日”活动 图片展聚焦中国式现代化
陕西汉中:龙舟竞渡迎端午