集团新闻

JBO竞博史红、李新立、殷鹏:医学大数据管理与应用助力大数据建立临床科研“新模式”

发布日期:2023-07-15  来源:

  JBO竞博3月9日,由苏州工业园区心血管健康研究院主办、第一三共(中国)投资有限公司支持的心血管医师科研能力提升计划第二期“医学大数据管理与应用”在线召开,分别就《国际开源医学免费数据库介绍及应用》以及《基于医防融合多源大数据的胸痛中心评估》主题发表了精彩演讲,分享了宝贵的观点和经验,为临床医生进行科研研究尤其是数据库的构建和应用提供了新思路。

  当下,大数据正在驱动整个医学的发展,临床研究与大数据的结合也更加紧密。海量化的数据正呈现爆发式、几何式的增长,数据分析和管理效率也在大大提高。“高容量、多样化、快速化、价值密度低”就是大数据的显著特征。

  大数据在全球的应用发展已经有相当长一段时间。谷歌流感预测早在2008年即已推出,原理是采用流感趋势系统监测全美的网络搜索,寻找与流感相关的词语,比如“咳嗽”和“发烧”等,并利用这些搜索结果来提前9周预测可能与流感相关的就医量,而非疾控中心需要在流感爆发一两周之后才可以做到。2009年在H1N1爆发几周前,谷歌工程师们也成功预测了H1N1在全美范围的传播,甚至具体到特定的地区和州,而且判断非常及时,令公共卫生官员们和计算机科学家们倍感震惊。

  目前比较著名的医学数据库有PCORnet、NHANES、MINIC重症医学数据库等。医学大数据研究发展至今也取得了很多成果。例如,美国研究者在分析了田纳西州医院所有患者的数据后发现,在疗程5天的阿奇霉素治疗中,心血管(CV)死亡风险小幅增加。上海交通大学Bio-X研究院联合美国IBM沃森研究院、哈佛大学等医药大数据前沿机构的研究人员,共同构建了基于医药大数据的药物互相作用搜索引擎,利用化合物-蛋白互作组(Chemica- Protein interactome. CPI)的海量数据在超级计算机上模拟药物相互作用,通过改进了的大数据挖掘算法,比较用户提交分子的指纹图谱来预测潜在药物相互作用,从而及时预测用药风险。李新立教授团队也应用大数据发表了数篇心血管领域的研究成果。

  大数据时代下的医学科研工作主要包括三个方面:①临床医学资源发掘、收集、整理和利用(标准化、科学化);②大样本、多中心的临床研究(病因、诊断、治疗及药物开发);③依托临床信息的生物医学资源的整理、利用及硏究(基因、蛋白及代谢)。这些工作都是复杂而且高难度的,以NHANES数据库为例,海量数据的拆分和合并,常规统计软件运行难度大,需要高级统计软件,如R、SAS,这对临床医生都是挑战。

  当然,面对挑战的同时也有很多机遇:数据库质量高,国际认可度高;数据量大,更具统计学效应和说服力;公共数据可溯源,不存在造假;时间及金钱投入成本低;发现问题可以指导进一步医学研究。李新立教授强调,虽然大数据发展中还存在很多障碍和挑战,但挑战都是可以克服的,他的团队在这方面已经积累了一定的经验也取得了一些成果,希望和同道们一起努力应用好大数据,为中国的医学发展贡献力量。

  中国心血管疾病患病率及死亡率仍处于上升阶段,预计到2030年有2260万心肌梗死患者。胸痛中心是通过多学科合作,为胸痛患者提供快速而准确的诊断、危险评估和恰当的治疗手段,从而提高胸痛的早期诊断和治疗能力,减少误诊和漏诊,避免治疗不足或过度治疗,以降低胸痛患者的死亡率、改善临床预后。

  为了实现医防融合大数据资源治理,建立协同管理的交换机制;进一步客观、全面地评估胸痛中心认证体系的示范效应,优化认证标准,建立胸痛中心建设效果考核指标体系;最终总结、凝练、升华胸痛中心建设评价的管理学问题,提出数据驱动的心血管疾病防治的全景式框架,国家自然科学基金与苏州工业园区心血管研究院联合开展了基于医防融合多源大数据的胸痛中心评估。

  研究方法有关键的四步。第一步,确定研究范围,确定基础数据和分析范围。第二步,医防融合数据治理与交换机制研究,规范多源数据交互标准,开展数据治理,制定数据匹配、交换和共享方案。第三步,胸痛中心建设评价体系研究,梳理关键评估问题,访谈关键相关方,识别公众的知识JBO竞博、态度、行为和就诊需求。建立大数据驱动的胸痛中心需求评价、过程评价、结果评价和成本效益评价和影响评价指标。第四步,全景式数据驱动心血管疾病管理决策研究,梳理痛点和难点,提出决策范式转变和政策建议。

  研究数据有三个来源。病案首页数据:来源于2016-2020年医院质量监测系统,每年采集约9千万份全国二级和三级公立医院病案首页。死因监测数据:来源于2016--2020年全国人口死亡信息登记管理系统中的全部死亡个案。中国胸痛中心数据:来源于中国胸痛中心认证管理平台及中国胸痛中心数据填报平台。然后利用身份证号作为唯一的标识,对数据进行精准的对接匹配融合,比较胸痛中心和非胸痛中心之间各个指标的差异。在三个数据库初步的融合中也遇到了一些困难,比如字段的不统一,在质量控制上就需要统一的梳理,另外对于患者的隐私保护也是关键。后续希望得到全国范围内的海量数据,同时在数据填入的标准上做好把控统一,未来可以展开更多合作,做出更多的医学研究成果。

  史红主任总结道,医学研究已进入大数据时代,作为临床医生更要了解和学习大数据,让医学大数据在自己的临床和科研工作中发挥巨大的价值。也希望国内的同行能关注并参与这一非常有价值和意义的数据库建设工作。

相关新闻