您所在的位置:首页 > 资讯中心 > 业内要闻 >  “最IN解决方案SHOW” ——星瑞格大数据平台
“最IN解决方案SHOW” ——星瑞格大数据平台
  • 2017-11-24 11:03
  • 作者:佚名
  • 来源:HC3i中国数字医疗网

· 企业名称

福建星瑞格软件有限公司

· 企业简介

福建星瑞格软件有限公司(以下简称星瑞格软件)是福建省电子信息集团控股的国有控股企业,公司成立于2015年底,注册资金1.5亿,是专业从事国产数据库、数据库安全、大数据等业务的国有控股高新技术企业。

星瑞格软件始终坚持以自主可控、安全可靠为核心,以推动网络空间信息安全技术国产化为使命,专注从事安全自主可控的国产数据库软件与信息安全软件产品的设计、研发、销售与推广,对于大数据的支持当然不落人后,星瑞格重量级产品SinoDB 就是一个关系型大数据库管理系统,可以作为大数据运营平台,展现高可用、高性能的突出表现。

大数据产业未来固然可期,但是在实际发展路径上,各地政府、大型企业纷纷上马数据中心项目,建置大数据平台以发展大数据产业,此种过热的推进方法也让很多专家表示担忧。作为一个新兴的产业,其发展必然需要一个完整、健康、稳定的生态体系作为支撑,  特别是支撑海量数据的数据库平台的选型,星瑞格数据库SinoDB,已有多年的实战经验,不仅是世界级的产品,也在各大企业持续运行中, 加上近几年增强大数据支持的发展,  足以作为大数据应用的数据库平台。

2017最IN数字医疗解决方案排行榜投票进行中

· 申报项目名称

星瑞格大数据平台

· 申报项目详情概述

大数据类型:

传统数据库处理的数据都是结构化数据,数据库的演进慢慢的从支持结构化数据、大对象、物件到支持非结构化数据,乃至于混合型,基本上大数据要分析的数据类型主要有四大类:

· 交易数据(TRANSACTION DATA)

时间跨度更大、更海量的结构化交易数据,这样大数据平台就可以对更广泛的交易数据类型进行分析,不仅仅包括POS系统或电子商务购物数据,还包括用户行为交易数据,例如Web服务器记录的互联网点击流数据日志。

· 人为数据(HUMAN-GENERATED DATA)

非结构数据广泛存在于电子邮件、文档、图片、音频、视频,以及通过社交媒体产生的数据流。这些数据为使用文本分析功能进行分析提供了丰富的数据源泉。

· 移动数据(MOBILE DATA)

能够上网的智能手机和平板越来越普遍。这些移动设备上的应用程序都能够追踪和沟通无数事件,从应用程序内的交易数据(如搜索商品的记录事件)到个人信息资料或状态、地理位置报告事件(如地点变更即报告一个新的地理编码)。

· 嵌入式设备和传感器数据(EMBEDDED MACHINE AND SENSOR DATA)

这包括设备创建或生成的数据,例如智能电表、智能温度控制器、工厂机器、连接互联网的家用电器或嵌入式设备。这些设备可以配置为与互联网络中的其他节点通信,还可以自动向云端数据库服务器传输数据,这样就可以对数据进行分析。嵌入式设备和传感器数据是来自新兴的物联网(IoT)所产生的主要例子。来自物联网的数据可以用于构建分析模型,连续监测预测性行为(如当传感器值表示有问题时进行识别),提供控制的指令或警告(如警示技术人员在真正出问题之前检查设备)。

大数据平台数据库需具备以下要求和目的:

· 能应用高级的分析演算法和模型提供分析

· 以大数据平台为引擎,比如支持Hadoop或其他高性能分析系统

· 能够适用于多种数据源的结构化和非结构化数据

· 随着用于分析模型的数据的增加,能够实现扩展

· 能够和其他技术集成

SinoDB

· SQL与NoSQL 

在互联网快速发展的时代,客户、网页、行动装置以及传感器之间传递的信息往往不是固定结构的数据,数据结构经常发生改变,在这样的环境下成就NOSQL的流行,因为NOSQL缩短了开发时间和在非常高负载情况下降低了查询响应时间,SinoDB具备传统关系型数据库引擎可以处理结构化数据,也内置支持非结构化类型数据处理引擎,提供处理JSON类型数据与Mongo API,REST API等应用程序开发API,方便开发者对非结构化类型数据开发的便利性,JavaScript Object Notation(JSON)是用于在数据库和应用程序之间的数据交换的通用格式,它是用于编码,或串行化,结构化对象作为文本一个非常简单的交换格式。

· TimeSeries

时间序列(TimeSeries)是星瑞格数据库解决海量数据处理的一项重要技术。该技术采用特殊数据存储方式,极大提高了时间相关数据的处理能力,相对于关系型数据库它的存储空间减半,查询速度提高。高效存储和处理大量数据的能力对于SinoDB时序解决方案来说至关重要。比如,如果没有时序解决方案,就无法对一些能源和公用事业单位的数据库系统中的几万亿行数据进行高性能處理。所有的时間序列功能都是为了提高大数据系统的性能和可管理性。在各种传感器或嵌入设备对数据的采集纪录时,都会相关于时间,用户在纪录这类数据时可以采用一个时间序列列中设定固定时间间隔的数据,并通过使用时间序列函数(TimeSeries Function)实现对这些数据的实时查询、更新、删除等操作。这类型的时间序列函数优越的查询性能远超过关系型数据库。SinoDB数据库内置时间序列数据处理引擎,在性能上有很好的表现,应用程序开发上也相当便捷。

· SWA

SinoDB数据库是业界领先的联机事务处理OLTP数据库,其先进的动态可伸缩体系结构DSA(Dynamic Scaleble Architecture) 随着数据量以及用户访问的不断增加可以提供非常灵活的扩展能力,充分、合理地利用系统资源来提高数据处理处理能力;其业界领先的数据库集群技术,不仅提供HDR、RSS等数据库高可用及远程容灾能力,还提供SDS数据库高可用及负载均衡能力,充分满足OLTP系统不间断业务运行的能力;其灵活的网格计算能力(flexible Grid) 更提供了SinoDB数据库云计算能力,可以进一步提高其数据处理能力;SinoDB不仅能够处理OLTP应用,也可以高效处理数据仓库以及OLTP/Warehousing混合负载,提供强大的数据仓库处理能力。

在数据查询处理部分,SinoDB数据库提供的Multi-Index Scan及Skip Scan技术提高数据查询性能;可以采用星型模型(Star Schema)及雪花型模型(Snowflake)连接优化技术,优化星型及雪花型模型数据仓库查询的效率;也可以用SinoDB数据库提供的 Implicit PDQ 及Light Scans 技术,提高数据仓库查询的效率;为进一步提高数据仓库查询的性能,推出了专门针对数据仓库应用的数据仓库加速器SWA(Sinoregal Warehouse Aaccelerator),它将需要分析的数据集市数据经过压缩、频度分区技术全部保存在内存中,  消除了磁盘I/O;数据在内存中按照“列”方式存储,减少了数据扫描量,提高了OLAP查询的性能;新版本的CPU处理器有更多的核(core)和更大的处理器内置缓存,于是更加大并行度,减少进程间的同步,使用更好的算法以充分利用处理器内置缓存,将查询性能提升到一个新的高度。数据仓库加速器提供了优异的性能,而不需要做“在传统数据仓库上需要做的优化工作”。它被设计来在秒级上处理海量数据,非常适合于大数据平台发展。

SWA运作原理:当数据集市部署到SWA后,我们需要装载数据到数据集市中。SinoDB数据库提供相应的存储过程来自动进行数据装载工作。当数据装载到SWA时,SWA会自动对数据进行压缩、并按照频度分区方法对压缩数据进行分区并存储在内存中。当用户向数据库发出查询请求时,数据库优化器评估用户查询请求,如果满足条件,该查询请求将被重新路由到SWA中来加速数据查询,并将查询结果返回给SinoDB数据库,并最终返回给应用程序。

· 经济效益与社会效益

大数据时代给医疗健康产业也带来深远的影响。大数据可以实现个性化的医疗, 为个人提供个性化的医疗服务。过去看病,医生只能对患者当下的身体情况做出判断。通过大数据的帮助,现在的诊疗可以对一个患者积累的历史数据进行分析,并结合遗传变异分析、对特定疾病和对特殊药物的反应等关系分析,让患者获得更佳的医疗品质。大数据的应用使健康数据的采集、分析和处理等新的行业出现,健康管理、疾病管理、远程医疗等这些行业都可以利用大数据分析提供更好的医疗服务。在健康产业的传统商业模式中,医疗健康企业只是出售药品、服务和设备,但是利用大数据平台分析,医疗健康产业可以通过开放数据,开展个性化医疗服务。此外,大数据的运用对医疗健康产品开发与定价、生产制造、市场营销、等环节可以进行全面改造升级,会更加精准,更加个性化,可以推动运营模式的巨大创新。而当医疗数据积累到足够大之后,这些数据的应用场景就极具想象力,包括疫情监测、疾病防控、临床研究、医疗诊断决策、医疗资源调度、远程医疗等方方面面。例如,疾病预测于可以对全国 34个省区、331个地市、2870个区县、19个城市的流感、艾滋病、肺癌、肺结核、肝炎、高血压、宫颈癌、糖尿病、性病等疾病进行未来趋势的预测。

· 项目创新情况简述

未来,数据一定是互联互通才有价值,目前的私有云大数据解决方案是一个过渡阶段,未来大数据需要的是更大型,更专业的平台。星瑞格大数据平台才可以实现整个大数据的生态体系。从现在的技术看来,大数据平台越来越具备实时的能力;在线的业务数据库越来越具备分布式计算的能力。当这些能力整合,统一的时候,在线/离线的界限又将变得不再清晰,整个数据技术体系又会回到当初的数据库/数据仓库一体化的平台,这是星瑞格大数据平台的优势,SWA更能体现高性能的弹性水平扩展。数据作为生产资料,大数据时代的血液,好比汽车的汽油,没有汽油,再精美高端的汽车也无法运转。而数据的来源往往是多方面的,未来一个企业所用到的数据往往不仅仅是自身的数据,甚至是多个渠道交换、整合、购买过来的数据,数据一定是流动的,数据只有整合关联,才能发挥更大的价值;

数据集成、数据开发、调度系统、数据管理、运维视屏、数据质量、任务监控这些都是大数据平台必须具备特性。星瑞格大数据平台作为数据流的中心,从源系统层、数据交换层、大数据平台(数据中心)、到后端数据应用层、业务访问层及用户访问层。星瑞格大数据平台价构图如下图:

转载请注明出处:HC3i中国数字医疗
【责任编辑:程泱溥 TEL:(010)68476606】

标签:最IN医疗解决方案  医疗解决方案  解决方案  智能医疗大数据  排行榜  江湖令  
  • 分享到: