集团新闻

临床数据获得之——常见的临床数据库JBO竞博

发布日期:2023-08-10  来源:

  JBO竞博话接上回,说到临床研究,那么最头疼的就是数据的获取、处理和分析了。众所周知,想要获得患者的临床数据资料无非是2种途径,一个通过医生在医院的病例系统里面调查,另一个即是通过公开的国内外数据库去下载。今天我们主要来说说公开的临床数据库有哪些?各自有什么样的特点。

  NHANES是一项基于人群的横断面调查,旨在收集美国成人和儿童的健康和营养状况的信息,该调查的独特之处在于它结合了访谈和体检。该数据库包括Demog Data(人口统计学数据)、Dietary Data(饮食数据)、 Examination Data(检查数据)、Laboratory Data(实验室数据)、Questionnaire Data(问卷数据)、Limited Access Data(有限访问数据)。调查结果将用于确定主要疾病的患病率和疾病的风险因素,也是衡量身高、体重和血压等国家标准的基础。NHANES 数据库拥有庞大的数据资源,并且完全开放免费下载,而且这个数据库每两年更新一次,会加入大把新数据,完全不担心样本量不够。

  CHNS由美国北卡罗来纳大学人口中心与中国预防科学医学院联合进行的大规模的社会健康调查。调查的内容涉及诸多方面,包括健康学、营养学、社会学、人口学JBO竞博、经济学、公共政策等多个学科,数据内容包括社区调查、家庭户调查、个人调查、健康调查、营养和体质测验、食品市场调查及健康和计划生育调查。与NHANES不同的是,CHNS缺乏临床检查及检验相关的结果。

  NCDB 是经国家认证的,由美国外科医师学会和美国癌症学会联合组建的,它是一个基于医院登记数据的临床肿瘤学数据库,来源于超过1500多个癌症委员会认证的机构。NCDB数据库可用于分析和跟踪恶性肿瘤患者的治疗过程和结局。数据库代表了全美超过70%的新诊断癌症病例和超过三千四百万个历史记录。

  SEER是美国癌症统计的权威来源。SEER数据库可提供癌症统计信息,以减轻美国人口中的癌症负担。

  包含常见肿瘤(肺癌、前列腺癌等)医学图像(MRI、CT等)及相应临床信息(治疗方案细节、基因、病理等)的大规模公用数据库。

  MIMIC重症系列主要包括MIMIC-II,MIMIC-III,MIMIC-IV, eICU,PIC(儿科),HIRID数据库等。其中,使用较多的是MIMIC-III数据库。该数据库可以免费申请使用,内有贝斯以色列女执事医疗中心在2001年和2012年之间重症监护室超过四万病人的相关数据。数据库包含信息如人口统计学特征、床边生命体征的测量,实验室测试结果,各种操作、药物、影像报告和死亡指标。

  运动对健康的影响,城市建筑环境对健康的影响,可以结合肥胖、糖尿病、心血管疾病等与运动有关的慢性病进行研究。

  如何获取数据:向 IPEN 团队(邮箱 )提交预备发表文章的研究计划申请即可。

  这是运动和心血管健康联盟(OPACH)之下的一个子研究,需要操作一下才能打开主页。这个研究用可穿戴设备检测老年妇女的运动和心血管健康。

  该数据库收集了 50 万英国人的基因数据和其他流行病学特征,包含了各种重大疾病,如各种癌症、心血管疾病、中风、痴呆、糖尿病、关节炎、骨质疏松、眼部疾病、抑郁等在内的基因数据。

  优点:包含了 50 万人基因数据、多种表型的大型数据库,已经很多人利用该数据库产出孟德尔随机研究的高质量文章。

  缺点:需要交几千英镑甚至更多的申请费(视申请数据的种类而定),一般来说发表一篇中等水平的论文可能需要2300英镑左右的费用,具体视需要获取的数据量来定。

  好了,说了不少的数据库,其实数据库的使用流程基本大同小异。数据库首先分为免费数据库JBO竞博、部分免费数据库和付费数据库。在清楚了这些以后,一般是先去数据库官网注册,部分数据库需要提交研究方案申请后才能获得数据。后续就是数据的处理和分析。

  在下个专栏中,我们将选取1-2个基于上述数据库发表的几篇论文来看看,并分析一下选题思路和文章的成文方法,并思考如何借鉴学习。

相关新闻