- 2013-04-15 11:30
- 作者:袁永福
- 来源:中国数字医疗网
XML文档格式
开放文档格式有很多种,比如HTML、纯文本等等,RTF也勉强算一种,而DOC、ODT等文档格式由于是比较封闭的二进制格式,因此不能算是开放文档格式。在诸多开放文档格式中,谁也比不上XML。其理由有以下:
第一,XML的群众基础好。
XML已经成为最为常用的国际标准,所有的开发平台和技术都能很好的支持XML技术。中国社会信息化中几乎所有领域已经开始普及XML技术。不懂XML,都不好意思说自己是程序猿。XML成为电子病历系统跨业务领域的数据交流的首选技术了。
大家都知道电脑主板上的总线是很重要的,总线虽然未必完全符合CPU/GPU/内存/硬盘等各个专业领域的业务需求,但已经成为计算机系统的基础架构,各模块必须支持。而XML完全有能力成为各个信息化领域的总线,内部未必完全采用,但对外必须支持。
第二,XML得到各个IT巨头的支持。
IT巨头,特别是数据库巨头都投入巨大的精力在进行XML技术的研究,逐渐的将XML技术融合在关系型数据库中。站在这些巨人的肩膀上,使得快速处理海量XML文件成为可能。
反过来,若电子病历文件不是以XML格式存储,这些巨头们不大可能针对电子病历这个“小”领域而定制开发适合电子病历文档格式的数据存储和分析技术。脱离XML技术,电子病历行业也就无法利用巨头们在基础技术研究中获得的成果了。
第三,XML能很好的支持电子病历系统业务需求。
在笔者具体的实践中,采用DOM技术实现了全功能的电子病历文档,尚未遇到不能满足电子病历系统业务需求的情况,预计未来也会很少遇到。而DOM技术的抽象概念和XML技术的抽象概念是高度一致的,因此也就非常容易的实现了电子病历文档以XML格式进行存储。
另外XML技术的向上向下兼容性支持也是其他文件格式所少见的,而且各种特定格式的XML文件之间的转换也是低成本和高效率的。
第四,XML文档很适合文件的长期存储。
病历文档是需要长期存储几十年上百年的。在长期的存储过程中,存储介质不能避免的出现损坏,都有数据存储时间极限。
比如传统机械硬盘盘面上的数据只能存30年,之后由于机械故障及磁场衰减而出现数据丢失。
光盘数据存储的时间更短,毕竟光盘在物理上不是晶体,只是一种非常粘稠的液体,分子结构不稳定,稍微遇热就容易变形,而且材料很容易被空气中的氧气所侵蚀氧化,因此常用的光盘数据只能保存几年而已。高端光盘能保存十几年,但成本比较高。
大批量数据备份可采用磁带存储数据。理想情况下磁带能也只能保存几十年的数据,而且实际上磁带容易遭受空气中氧气、水分和霉菌的侵蚀破坏,因此存储时间也打折扣。
人类曾经制造过号称能保存数据长达亿年的光盘,那就是太空探索飞船旅行者号携带的镀金铜质光盘。由于金和铜都是晶体,分子结构非常稳定,基本上可以说是能永久保存数据,而且这个光盘一直保存在星际空间这种高度真空环境中,没有氧气、水和霉菌的污染,而且不受外界磁场的影响,因此非常稳定。不过这种光盘成本高,无法普及。
由于当前普及的数据存储技术不能满足病历数据长期存储的需要,这些数据存储介质历经时间的沧桑,必然出现一些损坏,从而导致数据丢失。此时若采用专用的格式,特别是二进制格式,少数几个字节的损坏就会导致整个文档的不可还原的损坏而丢弃。
而XML文件是自我描述的,存在不小的冗余,当文件数据发生部分损坏时,还是存在很大的可能性进行修复,其内容片段仍然可以读取的。因此当电子病历文档以XML的格式存储,虽然经过很长的时间,部分数据丢失,但其中的信息还是能幸存下很多的。
更进一步的,XML文件在存储文本数据时可以采用实体模式,这样能增加文本数据的修复概率。
例如对于文本“袁永福的电子病历”,若采用UNICODE编码,其16进制编码为“81 88 38 6C 8F 79 84 76 35 75 50 5B C5 75 86 53”,若某些字节数据损坏,比如第一个字节丢失,其可辨认的16进制编码为“88 38 6C 8F 79 84 76 35 75 50 5B C5 75 86 53”,则以UNICDE格式读取的文本就成为“㢈转葹㕶偵앛虵”,这就是不可识别的乱码了。
如果采用XML实体模式存储这几个文字,则保存为“袁永福的电子病历”,若某些字节数据损坏,例如变成
“&#x??1;永福的电子病历”,则这段受损的数据仍然可以准确的辨认出文本“永福的电子病历”,这样就能实现数据的最大程度的恢复。
综上所述,电子病历文档XML化是一个趋势。趋势是一个很霸道的东西,体现了众生的意志,某个具体的公司和利益集团无论多么的强大,也无法阻挡趋势,反而会被趋势所践踏。
电子病历的用户,包括医生、医院院长、卫生系统的官员等等不擅长IT技术,未必能理解这个趋势,但作为电子病历系统的软件开发商,必须认识到这个趋势,并顺应这个趋势,好好学习和利用XML技术。 共5页: 上一页 [1]2 [3][4][5]下一页 [查看全文]