數(shù)棧運維案例:云上RAC部署、運維及實踐案例
數(shù)棧是云原生—站式數(shù)據(jù)中臺PaaS,我們在github和gitee上有一個有趣的開源項目:FlinkX,F(xiàn)linkX是一個基于Flink的批流統(tǒng)一的數(shù)據(jù)同步工具,既可以采集靜態(tài)的數(shù)據(jù),也可以采集實時變化的數(shù)據(jù),是全域、異構、批流一體的數(shù)據(jù)同步引擎。大家喜歡的話請給我們點個star!star!star!
github開源項目:https://github.com/DTStack/flinkx
gitee開源項目:https://gitee.com/dtstack_dev_0/flinkx
數(shù)據(jù)庫產(chǎn)品越來越多,各家云廠商也都推出基于開源MySQL、Postgre等的關系型數(shù)據(jù)庫產(chǎn)品,多副本、高可用、讀寫分離、分庫分表等功能更是集成在各類產(chǎn)品中,降低了機房建設和運維成本,助力更多的客戶上云。
唯獨鮮見Oracle的云產(chǎn)品輸出,除非是Oracle Cloud。
對于當前業(yè)務系統(tǒng)基于Oracle系統(tǒng)開發(fā),且改造難度較大,如OA、ERP等系統(tǒng);或?qū)?shù)據(jù)庫要求較高,必須使用Oracle數(shù)據(jù)庫的場景,如訂單流水、金融交付系統(tǒng),袋鼠云可以提供阿里、華為、騰訊公有云,阿里、Zstack專有云上完善的云上Oracle RAC實施部署、運維方案,協(xié)助客戶無縫上云。
云上單機還是集群,Oracle的部署都遵循官方的指導文檔,沒有差別。
但是在基礎配置上面,云環(huán)境將網(wǎng)絡、服務器、磁盤等以產(chǎn)品化輸出,有其特殊性:
云交換機:建議云環(huán)境中所有的業(yè)務系統(tǒng)運行在專有網(wǎng)絡VPC中,創(chuàng)建不同網(wǎng)段交換機,供給RAC集群、業(yè)務系統(tǒng)使用;同一個VPC網(wǎng)絡默認互通
云服務器:云環(huán)境有地域/可用區(qū)一說,同一地域不同可用區(qū)類似于同城不同機房,集群計算節(jié)點需要在同一個可用區(qū)中,購買在同地域不同可用區(qū)或不同地域的機器可用于部署業(yè)務/數(shù)據(jù)庫災備環(huán)境
云盤:同樣需要根據(jù)規(guī)劃購買與RAC計算節(jié)點同地域同可用區(qū)的云盤,并掛載到計算節(jié)點上;
不同云環(huán)境對一臺云服務器上掛載磁盤個數(shù)的有不同限制,在集群規(guī)劃階段需要考慮預估數(shù)據(jù)量大小以及云盤大小。
云服務器規(guī)格可以升配或減配,對于集群計算節(jié)點,可以逐一進行,降低對業(yè)務的影響。
一、云上RAC規(guī)劃一覽

1、標準壓力測試
Swingbench可以構建真實OLTP事務場景,比如訂單類業(yè)務、新建客戶、訂購、下單等流程操作,通過大批量增刪改查操作,測試不同并發(fā)場景下數(shù)據(jù)庫性能趨勢和穩(wěn)定性,同時結合其他監(jiān)控工具,觀察服務器內(nèi)存、負載、磁盤等的性能趨勢和穩(wěn)定性;根據(jù)壓測結果及早發(fā)現(xiàn)和優(yōu)化問題,評估數(shù)據(jù)庫的最佳使用方式。
依據(jù)袋鼠云的集群運維經(jīng)驗,短時間、低并發(fā)的壓測無法驗證集群的穩(wěn)定性,所以在云上集群部署之后,會進行長時間(4小時以上)、高并發(fā)的持續(xù)壓測;
同時對壓測出來的集群性能問題進行分析,優(yōu)化集群參數(shù)配置,并主動提供云服務器、存儲資源優(yōu)化建議,以期交付一個穩(wěn)定、高性能的數(shù)據(jù)庫環(huán)境。
阿里云2節(jié)點12.2.0.1RAC壓測舉例:

2、業(yè)務回放測試
DBReplay的測試方法,抓取生產(chǎn)環(huán)境某一時間段業(yè)務負載,單次capture可以多次replay,更接近于正式的生產(chǎn)負載,更直觀有效。主要用于數(shù)據(jù)庫升級、遷移,應用程序部署等的預演,量化評估出變更實施后對現(xiàn)有的性能的影響程度。
對于平常壓力較大的業(yè)務系統(tǒng),在遷移割接之前有必要進行此類測試。

三、案例分享
1、某日企客戶
(1)需求分析
業(yè)務整體上云,需要部署云上Oracle RAC 12C/11G各1套
滿足高可用、容災等需求
(2)架構規(guī)劃
規(guī)劃20G*3云盤做OCR/Voting組、60G*2云盤做REDODG1/2組、200G*1云盤做ARCHDG組、規(guī)劃500G*1云盤做DATADG組、100G*1云盤做MGMTDG組
規(guī)劃云服務32C64G*2作為計算節(jié)點
建議客戶采用業(yè)務分離的模式訪問數(shù)據(jù)庫

2. 某國企招聘網(wǎng)站
(1) 需求分析
需要同時滿足1w人在線訪問,并發(fā)事務2000以上
自行搭建云上Oracle單機數(shù)據(jù)庫,預計很快到達瓶頸
需要高可用、容災的架構保障業(yè)務的持續(xù)運行
(2) 架構規(guī)劃
新購高規(guī)格云ECS作為計算節(jié)點,保證充足的計算資源
原單機數(shù)據(jù)庫割接后作為DG備庫運行
配置合理備份策略,上傳備份集到OSS對象存儲,異地保存

3、某省級專有云交管平臺
匯總?cè)〗还軘?shù)據(jù),并提供查詢、分析平臺。
(1)需求分析
自建機房,部署在Windows服務器單機Oracle11.2.0.1
18T數(shù)據(jù),并在逐步上漲中
業(yè)務調(diào)試需要和部里對接、調(diào)整,實際沒有測試的可能
可維護時間短
(2)架構規(guī)劃
專有云環(huán)境部署,2節(jié)點RAC集群,并搭建容災備庫
通過ADG實時同步機房數(shù)據(jù),進行DBRelay壓測
繼續(xù)使用備份一體機備份生產(chǎn)數(shù)據(jù)