查詢效率提升近200倍!AntDB數(shù)據(jù)庫助力省級(jí)醫(yī)保信息平臺(tái)建設(shè)
本文介紹了在西北某省醫(yī)保信息平臺(tái)架構(gòu)演進(jìn)升級(jí)過程中,AntDB對(duì)于新建平臺(tái)數(shù)據(jù)分析能力、數(shù)據(jù)同步能力、數(shù)據(jù)運(yùn)維管理能力的提升。本次AntDB數(shù)據(jù)庫多引擎能力的上線,解決了該醫(yī)保系統(tǒng)數(shù)據(jù)同步不準(zhǔn)確、數(shù)據(jù)查詢結(jié)果不準(zhǔn)確、復(fù)雜數(shù)據(jù)查詢慢等問題。數(shù)據(jù)庫的高可用架構(gòu)可以保證業(yè)務(wù)的連續(xù)性及數(shù)據(jù)安全性,保證用戶數(shù)據(jù)的安全可靠。
一、醫(yī)療行業(yè)信息化平臺(tái)建設(shè)需求
省醫(yī)保局的醫(yī)保信息系統(tǒng)數(shù)據(jù)平臺(tái)以醫(yī)保數(shù)據(jù)為核心,以地區(qū)資源整合為主線,以提供醫(yī)保數(shù)字服務(wù)為導(dǎo)向,實(shí)現(xiàn)全量數(shù)據(jù)互通匯聚,實(shí)現(xiàn)企業(yè)級(jí)數(shù)據(jù)管理和集成共享,構(gòu)建醫(yī)保大數(shù)據(jù)中心,實(shí)現(xiàn)對(duì)各類數(shù)據(jù)資源的統(tǒng)一管理、管控、共享,為醫(yī)保運(yùn)營(yíng)監(jiān)管和業(yè)務(wù)發(fā)展提供支撐。加快推動(dòng)醫(yī)保信息化、標(biāo)準(zhǔn)化、便利化建設(shè),推進(jìn)醫(yī)保服務(wù)事項(xiàng)“網(wǎng)上辦”改革,高頻醫(yī)保服務(wù)事項(xiàng)實(shí)現(xiàn)跨省通辦。
二、數(shù)據(jù)統(tǒng)一管理面臨的挑戰(zhàn)
打通“數(shù)據(jù)流轉(zhuǎn)”路徑是數(shù)據(jù)管理的重要工作之一。某市醫(yī)保業(yè)務(wù)平臺(tái)現(xiàn)有的信息系統(tǒng)架構(gòu),采用的是直連底層生產(chǎn)數(shù)據(jù)庫查詢的方式,存儲(chǔ)了大量的原始業(yè)務(wù)數(shù)據(jù),需要進(jìn)一步的數(shù)據(jù)聚合和關(guān)聯(lián),并建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)以實(shí)現(xiàn)互聯(lián)互通。同時(shí),其經(jīng)辦系統(tǒng)和監(jiān)督系統(tǒng)對(duì)性能有較高要求,現(xiàn)有數(shù)據(jù)庫無法滿足大批量的數(shù)據(jù)查詢要求,亟待升級(jí)改造。
客戶的主要痛點(diǎn)訴求,如下:
1. 提升業(yè)務(wù)響應(yīng)速度:面對(duì)大數(shù)據(jù)量查詢、寬表數(shù)據(jù)查詢等場(chǎng)景,需解決現(xiàn)有架構(gòu)數(shù)據(jù)查詢緩慢的問題,提升整體業(yè)務(wù)系統(tǒng)響應(yīng)速度;
2. 增加數(shù)據(jù)分析能力:面對(duì)多表關(guān)聯(lián)、聚合分析等復(fù)雜查詢時(shí),需從架構(gòu)層面進(jìn)行規(guī)劃升級(jí),增加統(tǒng)一架構(gòu)下的數(shù)據(jù)分析能力;
3. 數(shù)據(jù)一致性保障:面對(duì)多系統(tǒng)多終端的并發(fā)查詢,需解決同時(shí)讀寫數(shù)據(jù)查詢結(jié)果不一致的問題,保障事務(wù)提交的準(zhǔn)確性。
三、為什么選擇亞信安慧AntDB
基于上述需求,客戶分別從數(shù)據(jù)采集能力、數(shù)據(jù)存儲(chǔ)管理能力、數(shù)據(jù)分析與挖掘能力等方面進(jìn)行了相關(guān)技術(shù)及架構(gòu)的調(diào)研,最終在數(shù)據(jù)庫方向,選擇了采用亞信安慧AntDB數(shù)據(jù)庫的多引擎、超融合解決方案。
客戶的數(shù)據(jù)平臺(tái)建設(shè)方案,是通過在業(yè)務(wù)系統(tǒng)和生產(chǎn)數(shù)據(jù)庫中間搭建數(shù)據(jù)中臺(tái),進(jìn)行數(shù)據(jù)治理和數(shù)據(jù)開發(fā)等工作,實(shí)現(xiàn)數(shù)據(jù)管理、標(biāo)準(zhǔn)、服務(wù)一體化,如下圖。數(shù)據(jù)中臺(tái)主要由MPP數(shù)據(jù)庫和離線數(shù)倉構(gòu)成,其中MPP(Massively Parallel Processing 大規(guī)模并行處理))數(shù)據(jù)庫由AntDB團(tuán)隊(duì)承建,并負(fù)責(zé)與原有庫進(jìn)行數(shù)據(jù)與業(yè)務(wù)對(duì)接。
圖1:醫(yī)療行業(yè)信息系統(tǒng)數(shù)據(jù)平臺(tái)架構(gòu)圖
亞信安慧承建的MPP數(shù)據(jù)庫主要包括匯聚庫和應(yīng)用庫,匯聚庫負(fù)責(zé)從生產(chǎn)中心同步數(shù)據(jù)進(jìn)行預(yù)處理,隨后離線數(shù)倉對(duì)生產(chǎn)數(shù)據(jù)進(jìn)行抽取及加工,加上增量明細(xì)軌跡數(shù)據(jù),在離線數(shù)倉按層級(jí)加工出T+1數(shù)據(jù)。然后會(huì)將在離線數(shù)倉數(shù)據(jù)應(yīng)用層加工完成的寬表應(yīng)用類數(shù)據(jù),同步到應(yīng)用庫,供上層應(yīng)用系統(tǒng)查詢使用。
亞信安慧AntDB數(shù)據(jù)庫的多引擎產(chǎn)品,能夠滿足客戶多種業(yè)務(wù)類型的數(shù)據(jù)處理、分析、查詢等需求,提供數(shù)據(jù)中臺(tái)中MPP數(shù)據(jù)庫組件的功能。AntDB提供的不僅僅是軟件產(chǎn)品,更是一整套完善的數(shù)據(jù)管理體系,包含各類生態(tài)工具,方便企業(yè)用戶快捷、高效地管理企業(yè)數(shù)據(jù)資產(chǎn)。
圖2:AntDB可根據(jù)客戶需求提供模塊化能力
通過該數(shù)據(jù)平臺(tái)的建設(shè),可以幫助客戶有效提高信息系統(tǒng)的準(zhǔn)確性和分析效率,保證經(jīng)辦類系統(tǒng)的查詢效率,滿足監(jiān)察系統(tǒng)的統(tǒng)計(jì)需求。MPP數(shù)據(jù)庫對(duì)于數(shù)據(jù)中臺(tái)的價(jià)值,主要體現(xiàn)在三個(gè)方面: 1. 具備較高的數(shù)據(jù)入庫效率和數(shù)據(jù)分析處理能力; 2. 具備配套數(shù)據(jù)同步工具,支持MPP數(shù)據(jù)庫數(shù)據(jù)和生產(chǎn)庫之間的數(shù)據(jù)同步; 3. 具備較高的寬表數(shù)據(jù)查詢分析性能。
四、AntDB“可插拔式引擎”助力架構(gòu)升級(jí)
該數(shù)據(jù)平臺(tái)建設(shè)項(xiàng)目中,匯聚庫選用了AntDB-T(交易型),同步工具選用自研產(chǎn)品AntDB-MTK遷移工具,應(yīng)用庫選用AntDB-A(分析型),運(yùn)維管理工具使用自研AntDB-CC運(yùn)維平臺(tái),整體邏輯架構(gòu)圖如下:
圖3:項(xiàng)目建設(shè)邏輯架構(gòu)示意圖(AntDB部分)
亞信安慧AntDB數(shù)據(jù)庫產(chǎn)品具備以下特性:
1.原生分布式、高效數(shù)據(jù)處理:匯聚庫對(duì)于數(shù)據(jù)庫產(chǎn)品的水平擴(kuò)展能力和數(shù)據(jù)處理能力,有較高要求。AntDB-T分布式關(guān)系數(shù)據(jù)庫內(nèi)置分布式并行執(zhí)行引擎,在多個(gè)數(shù)據(jù)節(jié)點(diǎn)之間組網(wǎng)傳輸數(shù)據(jù),利用多節(jié)點(diǎn)并發(fā)處理數(shù)據(jù),可以使聚集、排序、關(guān)聯(lián)等操作獲得倍數(shù)級(jí)的性能提升。
2.數(shù)據(jù)同步及校驗(yàn)工具:匯聚庫實(shí)時(shí)從生產(chǎn)中心提取千萬級(jí)數(shù)據(jù),需要同步數(shù)據(jù)同源端保持一致性。AntDB MTK數(shù)據(jù)遷移工具包解決了該項(xiàng)目中數(shù)據(jù)不能及時(shí)、完整同步的問題,實(shí)現(xiàn)了數(shù)倉數(shù)據(jù)與生產(chǎn)系統(tǒng)數(shù)據(jù)的一致性保障。
3.超強(qiáng)數(shù)據(jù)分析能力:應(yīng)用庫采用的亞信安慧AntDB-A是MPP架構(gòu)的OLAP數(shù)據(jù)庫,具備高性能和實(shí)時(shí)分析能力,海量數(shù)據(jù)下返回查詢結(jié)果僅需亞秒級(jí)響應(yīng)時(shí)間,可滿足報(bào)表分析、自定義查詢、數(shù)據(jù)湖查詢加速等場(chǎng)景。
4.智能運(yùn)維管控:分布式架構(gòu)節(jié)點(diǎn)數(shù)眾多,需要運(yùn)維平臺(tái)對(duì)數(shù)據(jù)庫集群進(jìn)行統(tǒng)一管理。AntDB CC數(shù)據(jù)庫智能運(yùn)維管理平臺(tái)可提供智能化的運(yùn)維管控和數(shù)據(jù)庫的集群管理,自動(dòng)監(jiān)控包括常規(guī)數(shù)據(jù)庫服務(wù)器、數(shù)據(jù)庫關(guān)鍵指標(biāo)等數(shù)據(jù),并進(jìn)行預(yù)設(shè)告警通知,提升了數(shù)據(jù)庫的可維護(hù)性。
五、項(xiàng)目應(yīng)用效果
項(xiàng)目應(yīng)用場(chǎng)景為典型的分析型場(chǎng)景,應(yīng)用庫共6T左右的數(shù)據(jù)量。針對(duì)大批量寬表數(shù)據(jù)分析場(chǎng)景,AntDB-A相較于傳統(tǒng)行存數(shù)據(jù)庫,SQL性能提升200倍,對(duì)比國(guó)外同類型產(chǎn)品,關(guān)鍵SQL處理效率最大提升12倍。
圖4:AntDB產(chǎn)品相比原有產(chǎn)品關(guān)鍵SQL處理效率提升
項(xiàng)目上線后,AntDB-A基于自身超高的數(shù)據(jù)壓縮技術(shù)和數(shù)據(jù)分析能力,數(shù)據(jù)存儲(chǔ)空間降低87.5%,為用戶節(jié)省大量存儲(chǔ)成本;數(shù)據(jù)分析查詢效率提升接近200倍,數(shù)據(jù)庫查詢響應(yīng)時(shí)間提升到毫秒級(jí)。AntDB MTK解決了之前數(shù)據(jù)同步不準(zhǔn)確的問題,保證了不同平臺(tái)之間數(shù)據(jù)同步的準(zhǔn)確性。AntDB CC智能運(yùn)維平臺(tái)降低了分布式數(shù)據(jù)庫多節(jié)點(diǎn)運(yùn)維的復(fù)雜度,為用戶節(jié)省近70%運(yùn)維成本。
(責(zé)任編輯:華康)