40余年磨一剑 北京积水潭医院骨与软组织肿瘤数据库的建立及发展
骨与软组织肿瘤属于肿瘤学的范畴。当前针对肿瘤的研究,不管是基础还是临床,都强调循证医学的重要性,循证医学的根本是完整可靠的数据记录,而数据记录的集合就是数据库。
就临床而言,肿瘤学数据库可分为两种。一种是以流行病学研究为主要目的肿瘤登记数据库,另一种以临床、科研为目的,研究疾病本身特点及治疗疗效的专业单(或)多病种数据库。
目前各医院尽管都有自己的病历管理系统,但当前的医院病历系统很难涵盖临床和科研需要的全部参数,另外也不能随时更新以满足多中心临床研究为目的的参数。这种专业单(或)多病种数据库,针对的是某一(类)特定疾病,涉及患者的一般资料、诊断治疗、随访记录和预后情况等,涵盖疾病的发病、治疗、转归等过程。骨与软组织肿瘤相对是少见疾病,但在以骨科闻名全国的北京积水潭医院拥有全国乃至世界上最大的病例数量,其病例的广度和深度是综合医院难以比拟的。
北京积水潭医院骨肿瘤科成立于20世纪70年代,目前是中国最大的骨肿瘤中心之一,拥有自己的骨与软组织肿瘤数据库。该数据库包括40多年(自1973年至今)的数据。截止目前数据库26000余例。
▲骨肿瘤科数据库截图(www.sarcoma-jst.net)
北京积水潭医院骨与软组织肿瘤数据库发展历史和特点
(一)北京积水潭医院骨与软组织肿瘤数据库发展历史
我国缺乏条件进行大样本的骨与软组织肿瘤流行病学调查,目前使用的大量数据都是参考欧美等国的数据。北京积水潭医院骨肿瘤科自1977年建立以来,一直致力于对临床数据的积累,建立专业数据库系统。希望在骨与软组织肿瘤诊治领域拿出中国人自己的数据。随着计算机技术、网络技术、数据库技术的发展,在不同时期进行了大量数据库研发工作,在不断开发升级过程中,积累了大量经验。20世纪90年代前期,借鉴国内外发表文章中的数据,结合在临床工作中,总结提炼骨与软组织肿瘤相关参数约70个,制作了表格式手写病历,并填写纸质表格进行登记、存档。期间登记约2000例患者信息。但是由于无法进行编目、索引,无法进行有效查询,这些只是一些“死”数据。20世纪90年代中后期,随着计算机技术发展, 医院中出现386计算机及微软DOS操作系统。为了让积累的数据“活”起来, 选择当时流行的dBase数据库系统, 建立第一代单机版骨与软组织数据库。dBASE是第一个在微型计算机上被广泛使用的关系型数据库管理系统,但当时程序设计人员水平普遍不高,在设计中根本没有使用其关系型数据库特点,实际建立的是二维数据表。对于同一患者多次入院治疗,同一患者多种疾病,同一疾病多部位,同一患者多次手术等如何体现无法解决。在数据输入过程中,大量字段需要手工输入,容易出现错误。也没有良好的数据检索程序支持。在此阶段将约3000例病例数字化。进入21世纪,DOS操作系统逐渐消亡,WindowsXP系统成为主流。dBASE没能成功转换到Microsoft Windows平台并逐渐被Paradox、Clipper、FoxPro等替代。从2002年,我科重新开发骨与软组织肿瘤数据库。此时互联网技术刚刚兴起,网络人口普及率<2.5%, 因此数据库仍定位为单机版。为延续原dBase数据库系统,采用Visual FoxPro 6.0数据库系统,此系统仍然是关系型数据库,兼容dBase数据库,可进行图形界面的可视化编程。此次开发人员为非专业人员,由本科室内熟悉数据库开发的医生担任。开发过程中将每一患者记录的参数增加到150余个,丰富了数据库内容。输入模式进行改变,减少数据输入过程中直接填写内容,将大部分内容改为通过下拉菜单选择输入,减少人为错误。将所有参数分为7个数据表,建立简单逻辑关系,分别输入,部分解决了同一患者多次入院治疗问题,但由于程序设计水平问题,难以实现多表间复杂逻辑关系,同一患者多种疾病,同一疾病多部位,同一患者多次手术等问题仍无法解决。而软件中查询功能也较薄弱。2003年完成开发后,进行病历数字化。至2009年,纸质登记表内容录入数据库,完成约6000例。2010年互联网技术迅速发展,互联网人口普及率达到28.9%。为使数据可以实时更新,随时随地输入查询。将数据库上网, 开发WEB模式数据库。此次开发由专业互联网数据库服务商单独承担, 服务器端采用MySQL关系型数据库及JavaServer Pages(JSP) 动态网页技术。开发过程基本延续原有数据库结构, 字段进一步增加到200项,进一步优化了输入方式,丰富了查询手段,实现了多表间交叉查询,使用不同权限的登录密码完成对数据库管理。但是由于开发的专业人员对疾病诊疗过程完全不了解及设计经费不足等原因,依然没有实现多数据表之间复杂逻辑关系,同一患者多种疾病,同一疾病多部位,同一患者多次手术的存储问题仍无法解决。此版数据库可通过互联网,需要密码登录后才可以使用,没有提供公众访问的页面。使用此数据库,到2012年,完成14500余例病历数字化。2012年为向公众提供真实、免费的骨与软组织肿瘤流行病学信息,北京积水潭医院骨肿瘤科建立了一个免费的在线原发骨肿瘤数据库网站(http:/www.sarcoma-jstorg) ,此网站构建于WordPress的门户网站,使用Php语言和MySQL数据库。由于后台使用不同数据服务器, 需要定期将数据库内数据导出,再导入WordPress数据库,不能达到实时更新效果。2013年开始,针对以往数据库开发中得到困难,再次升级数据库。此次由熟悉程序设计的本科室医生与专业互联网数据库服务商共同开发,服务器端采用Microsoft SQLServer 2008R 2数据库服务器及ASPNET技术。本次开发调整了数据表结构,重新制定了各个数据表之间的逻辑关系,完全解决了同一患者多种疾病,同一疾病多部位,同一患者多次手术的记录问题。在设计过程中采用模块化方式,便于后期数据库修改维护。这一版数据库完成同时,除提供科室内人员登录使用,还开通了针对公众的免费网站(http//www.sarcoma-jstnet) ,提供不包括患者信息的流行病学资料查询。至2015年,共完成17000余病历的数字化工作。
▲我院采用肿瘤数据库大数据发表的大宗病例分析文章
(二)北京积水潭医院骨与软组织肿瘤数据库特点
1.安全可靠性:数据库位于云主机上,每个主机数据保留4份,实时存储于集群中的若干台服务器上,即使同时损坏3份数据,也不影响主机的正常使用,系统可靠性达99.95%以上。为保证数据安全,还定时进行了人工数据备份。数据库设计采用底层数据库、网络应用服务器、用户客户端三层结构,杜绝用户直接访问底层数据服务器。用户分为不同级别,通过密码登录,只能完成本级别功能。
2.稳定性:采用浏览器和服务器结构(B/S)。用户表示层、业务逻辑层、数据访问层分离,当改变其中某一层次时,不会影响其它两层的工作。
3.可扩展性:本系统采用模块化原则,分为数据库输入、查询、维护模块。信息存储也按照模块方式进行,分为:医疗机构、科室、患者信息三级模块;患者信息内包括:住院信息、诊断信息、疾病部位、手术信息、化疗信息、随访信息等模块。最终到每一个字段都成为单独模块。通过不同模块组合完成业务逻辑。在必要条件下也可由单独模块完成业务逻辑。
4.易维护性:系统功能模块相互独立,修改单一模块不会影响其它部分功能。需要根据用户需求改变的复杂的数据处理位于中间业务逻辑层,对其修改不会影响底层数据访问层及表现层。降低了维护成本和维护时间。
5.先进性:参数字段选择,采用业界成熟的浏览器和服务器结构(B/S),三层体系结构,面向对象的设计方法。采用Microsoft SQLServer 2008R 2关系型数据库, 实现多表之间复杂逻辑关系, 完美解决了对于同一患者多次入院治疗,同一患者多种疾病,同一疾病多部位,同一患者多次手术信息存储问题。采用结构化查询语言(structured query language, SQL) 进行存取数据以及查询、更新和管理关系数据库。字段内容容量及查询方法多样都优于国外同类数据库。
6.标准化:数据以标准化字段形式体现,目前每位患者包括约200个字段。字段内容90%以上为标准化, 通过单(多) 项选择进行输入, 保证数据标准、正确。字段设计参考SEER等标准肿瘤数据库, 其中诊断项目参照WHO 2013最新骨与软组织肿瘤分类和icdl 0分别编码, 以保证将来与国外相关数据库交流的可行性。从患者入院、化疗、手术、出院、随访等各个环节,建立了完整标准的数据收集机制,保证数据实时更新及数据完整性。
7.易用:检索方式多样,界面清晰。输入界面交互性好,以选择为主,减少手工输入内容,操作方便,可以被大部分中等以上文化程度的人理解和使用。
8.实时查询:采用浏览器和服务器结构(B/S),数据库中内容输入或修改后可以实时查询。
9.独立/共享:此系统虽然是单中心开发,但在研发起始就规划为可以提供多中心使用。其数据存储及检索应用都可以满足多中心同时独立使用或数据共享使用。
▲国际著名肉瘤专家Dr.Gerald Rosen对北京积水潭医院骨与软组织肿瘤诊治水平和数据库的评价“Very impressed”
发展方向
北京积水潭医院骨与软组织肿瘤数据库的建立是一个起点,它标准化了数据库模型、规范了数据收集流程、促进了数据管理,实现了数据共享、发布了共享信息。“一花独放不是春,百花齐放春满园”,在使用数据库、享受数据库提供的便利同时,北京积水潭医院给全国骨与软组织肿瘤专业医生免费提供了此数据库架构,任何医生都可以通过数据库架构获得自己的数据库,使每一名医生挖掘到数据的财富。把骨与软组织肿瘤数据库发展成为大数据应用平台,提供真实的、专业的、权威的、先进的、可靠的、实用的、有指导意义的数据。
骨与软组织肿瘤数据库对于专业发展的意义
骨与软组织肿瘤数据库的建立,需要建立者对疾病的整个诊治和随访过程有详细深入的认识。因此,数据库的设计需要包罗临床所需要的几乎全部参数。在使用过程中,需要对患者的数据记录记载详实。另外,复查系统的完善,不仅提示患者应按时间来定期复查,也使得医生对于患者的整个诊治过程有更全面的理解。以上三点均从侧面促进了疾病诊治水平的提高。现在的数据库已不是孤立的数据库,由基础数据生成的流行病学数据可以供专业的和非专业的人士免费查询,其数据还可以与影像学数据和组织库数据进行连接,以保证更深层次的需求。完善的数据库对于医学科学研究的发展有着重要的意义,面对数据库,在科研选题和立项上不仅为研究者提供了更多想法,而且为科学研究直接提供数据支持,这些数据可以直接为第三方检验提供支持,杜绝医学造假。相信骨与软组织肿瘤数据库的建立,最终会从临床和科研两个方面促进本专业的健康发展,最终体现自身良好的社会效益和经济效益。希望所有有志于骨与软组织肿瘤事业的医疗人员和科研人员加入到专业数据库的建设中来,为我国骨与软组织肿瘤事业的进一步发展而努力。
编辑丨靳晓方 于淼