柏睿数据可以说是国内分析型数据库的代表吗?

历经6年,威讯柏睿数据科技(北京)有限公司这家以基础大数据库建设与数据库技术服务为主的创业系企业终于闯出了一条新路."它处于一个技术变革时代,也处于一个国内真正重视基础技术研发的时代."投资人梁雪青这样诠释. 作为柏睿数据掌舵人的刘睿民,在这场"变革"中既充当了工匠,又充当了先锋. 21世纪初的中国,大数据库及分析技术迅速崛起,在很多领域已经布局运用."国内很多客户用比国外贵几倍的价格购买数据库,但真正需要根据国内特性修改数据时,很多要求都无法实现,到目前为止都是这样.国产数据库领域缺少有力的竞争者."刘睿民明白,要想不被"卡脖子",必须要找到一个"支点",2014年,他带着柏睿数据横空出世.

案例|柏睿数据库RapidsDB在某国家级健康医疗大数据中心之落地实践

在数字化转型大潮下,打通政府、医疗机构、制药公司、医保机构、商保公司之间的数据孤岛,盘活数据实现价值变现,不仅对地方政府的公共卫生把控工作有着现实意义,也一直是业界长期以来探索的重点领域。

某医疗大数据中心是通过国家卫健委试点评估,并由部委、省、市共建签约的国家级健康医疗大数据中心,围绕健康医疗大数据领域开展数据汇聚、治理、开放、应用,业务覆盖 “健康医疗大数据”、“智慧健康医疗”、“健康医疗产业园”等板块,开展医疗大数据基础设施、平台和应用的建设运营,提供公共卫生、保险创新、精准医疗、互联网医院、医药研发、健康管理、医学教育等多种数据服务。

为了保证政府对于省、市的卫生政策能够安全、顺利的实施,该医疗大数据平台建设构建了“一湖三台”的核心技术体系架构,即健康医疗大数据湖、数据中台、业务中台和开放平台,汇集人口学、生理学、生物学、环境学等方面数据,建立标准化、全方位、多维度个人生命体征和健康信息库;制定分类、分级、分域健康医疗大数据开放应用政策规范,实现跨部门、跨层级、跨区域、跨领域的数据共享共用新格局;率先实现政府数据与社会、行业、企业及互联网数据的开放融合,有效支撑健康医疗大数据汇聚、治理、存储、开放、应用等。

在技术支撑平台上,当前医疗大数据平台使用了Hadoop和MySQL作为数据存储,以Hive作为离线数据查询、ClickHouse作为实时数据查询作为应用分析的支撑技术引擎。

在实际应用过程中,这套系统组合【MySQL+Hadoop+Hive+ClickHouse】在支撑目前20亿行数据、1TB数据存储、数据治理和数据探查等业务需求,但在复杂数据分析的性能和灵活性方面遇到了瓶颈。

业务发起的灵活查询的需求以及即席交互查询越来越多,而且探索查询的SQL也越来越复杂,这对数据库底层的技术要求特别高。医疗数据中心在可预见的未来将会按需创建更多的数据主题库,这些后添加的数据库和主题数量将会逐渐使ClickHouse实时查询变得越来越慢,但其通过建立宽表优化系统查询性能的机制也明显不利于医疗大数据未来所面对的场景。

另外,考虑到随着中心业务的不断发展、数据源的不断增多,在未来1年内,数据量将达到数百亿行数据、40-50TB的量级,现有大数据平台的技术肯定不足以支撑未来的业务发展。医疗大数据中心需要尝试一个更为理想的解决方案。

在探索新的解决方案时,医疗数据中心在考量了扩展能力、查询性能以及高可用性等方面后,邀请了柏睿数据的分布式全内存数据库RapidsDB进行现场测试。

因为内存数据处理是当前解决性能问题的热门方向,而采取分布式和内存计算来解决并优化数据库的分析性能正是RapidsDB的主打方向。

医疗数据中心历时一个月做了性能和高可用性的严格测试和验证,并在部署、集群、资源占用、内存利用率、存储模型、性能、兼容、OLAP特性、异构数据支持、大数据支持等方面比对评测了国内外同类数据库产品。测试结果如下:

  1. 用例1-7为数据探查用例脚本,用例8-11为医疗治理脚本。

  2. 由于Oracle执行时间与其他产品差异过大,柱状图中未体现Oracle,在下表中将加入Oracle在场景下耗时。由此也可看出,在海量数据处理的场景下需要分布式架构来提升性能,传统Oracle的集群架构难以满足大数据量的处理和分析。

在相同评测环境中,RapidsDB在查询性能方面远优于同类国内外MPP产品,RapidsDB作为完全自研安全可控的国产数据库,使用基于内存计算的动态优化手段,整体响应时间最少。而产品所支持的MPP线性扩展更是满足了医疗数据中心未来随着业务增长的平台可扩展性问题。

柏睿数据RapidsDB数据库于2021年7月开展环境部署、产品安装以及PoC测试工作。在历时1个月的验证和压力测试后,进行了4个月业务和系统试运行,并最终在2021年12月,RapidsDB在生产环境正式上线运行。

投产之后,RapidsDB性能表现优异,强助力医疗大数据发展,获得用户高度评价。

  引导高校、企业等科研创新主体破除一切制约科技创新的思想障碍和制度藩篱,最大限度解放和激发科技作为第一生产力所蕴藏的巨大潜能,把科技自主权、发展主动权牢牢掌握在自己手中,抢占科技竞争和未来发展制高点。

  为激发科技创新活力,第二十三届中国北京国际科技产业博览会于17日-20日于北京国际展览馆召开。作为中国新型数据库产业的代表企业,柏睿数据携新产品——数据存算一体机亮相本次科博会,并于18日下午举行新产品发布会。产品以我国突破性自主数据库软件与国际头部硬件配置为优化组合,实现海量数据存储,实时精准计算相融合,为我国数字化信息系统建设提供了安全高效的大数据“神器”。

  发布会现场大咖云集深度剖析数字产业发展

  在现场,工业和信息化部网络安全产业发展中心主任李新社表示,没有网络安全就没有国家安全,网络安全是保障信息产业长期健康发展的核心和灵魂,是信息社会的基础性和战略性产业。推动网络安全产业的创新发展,一是要增强创新力,就核心软硬件的创新大力发展核心技术,形成我国自主的软件基础,加强关键信息基础设施的安全保障,加快突破卡脖子技术研发;二是要强化标准研制,并不断推动中国方案走出去,在国际上技术标准方面要有中国主导的标准,紧抓国际国内双循环,让安全可靠的产品为信息化建设保驾护航;三是加快发展信息化产业,打造一批有自主知识产权、有龙头骨干企业、有一流研发平台和团队的本土信息化产业集群。

  北京市经信局信息化与软件服务业处处长尤靖表示,数字经济是我国在疫情防控常态化和构建国内国际双循环格局下的重大战略布局。北京在数字经济和信息领域提出了深层次的思考和规划大数据硬核重器突破核心技术扛鼎数据智能新基建,发布了《关于加快培育壮大新业态、新模式,促进北京经济高质量发展的若干意见》,以促进北京经济平稳增长和高质量发展为目标,提出了加快推进新型基础设施建设,培育壮大新业态、新模式等多项措施,打造北京经济新增长点。北京发挥软件和信息服务业的产业优势,,聚焦核心关键技术,夯实新基建的产业支撑底座,北京的企业在技术软件领域的持续创新,对培育中国技术、中国体系、中国方案发挥了战略性的支撑和引领作用。

  大数据硬核重器突破核心技术扛鼎数据智能新基建

  从北斗导航到港珠澳大桥,从现代医疗到水下蛟龙号潜艇,科技的发展引领着时代进步,国之重器上天入海,改变着宏观与微观业态。信息爆炸,数据成为核心战略资源。大数据、物联网、智能制造的崛起,拉动数据高速处理、保障数据资产安全的需求日益提高。国家也时刻关注着数据信息领域的核心技术和关键产品的攻关突破。

  发布会现场,柏睿数据存算一体机凭借超强的性能表现与亮眼的外观获得了与会嘉宾的驻足围观。柏睿数据董事长刘睿民与共同对产品进行了讲解。

  据了解,柏睿数据存算一体机”将数据存储与计算分析完美融合,海量数据存储,实时精准计算,实现四大质的飞越/提升:

  快:30倍性能提升,2倍执行效率提升!即存即算0延时!

  好:内存空间节省60%,高兼容、低成本、开箱即用易部署

  多:多源异构查询,100T+全内存实时计算。

  省:省事省心省成本!可视操控易运维,提供安全可控一站式服务。

  相关测试鉴定,经过软硬件优化的柏睿数据存算一体在相同环境下计算速度是国外商业数据库的50倍以上。这也说明,中国数据库基础软件的发展正迎头赶上。大数据硬核重器的出现,扛鼎新型基础设施建设,赋能数字中国新发展。

  产业合作拥抱全球大生态、大市场

  本次发布会除了邀请大数据领域的相关专家,企业的众多合作伙伴也到场支持。为加强产业链集聚,促进大数据生态建设,柏睿数据与中国通信服务现场签署了战略合作协议,双方将在产品研发、技术支持、项目建设、市场推广等方面展开全方位合作。

  中国通信服务股份有限公司云产品中心总经理戴礼华表示,柏睿数据与中国通服云产品中心联合,将进一步融合云与数据库,实现多个数据源的统一连接,为客户带来更丰富的产品线,对于计算存储进行有效整合,提供高性能的同时也注重大容量存储,形成软硬一体化的产品体系。未来我们同柏睿数据一道,基于双方的资源优势共同拓展市场,为政企客户提供产品和服务。

  合作是全球科技发展的大趋势,越是面临封锁打压,越不能搞自我封闭、自我隔绝,而是要怀着更加开放包容、互惠共享的合作理念,与国内国际的企业进行良好的合作沟通,促成更多科技创新成果,促使我国成为全球科技开放合作的广阔舞台。

我要回帖

更多关于 dryad数据库 的文章

 

随机推荐