Bati yon solisyon toleran defo ki baze sou achitekti Oracle RAC ak AccelStor Shared-Nothing

Yon kantite konsiderab aplikasyon Enterprise ak sistèm Virtualization gen mekanis pwòp yo pou bati solisyon ki toleran defo. Espesyalman, Oracle RAC (Oracle Real Application Cluster) se yon gwoup de oswa plis serveurs baz done Oracle k ap travay ansanm pou balanse chaj epi bay tolerans fay nan nivo sèvè/aplikasyon an. Pou travay nan mòd sa a, ou bezwen yon depo pataje, ki se nòmalman yon sistèm depo.

Kòm nou te deja diskite nan youn nan nou yo atik, sistèm nan depo tèt li, malgre prezans nan konpozan kopi (ki gen ladan contrôleur), toujou gen pwen nan echèk - sitou nan fòm lan nan yon seri done sèl. Se poutèt sa, pou konstwi yon solisyon Oracle ak plis kondisyon fyab, konplo "N serveurs - yon sèl sistèm depo" bezwen konplike.

Bati yon solisyon toleran defo ki baze sou achitekti Oracle RAC ak AccelStor Shared-Nothing

Premyèman, nan kou, nou bezwen deside ki risk nou ap eseye asire kont. Nan atik sa a, nou p ap konsidere pwoteksyon kont menas tankou "yon meteyorit rive." Kidonk, bati yon solisyon rekiperasyon katastwòf ki gaye géographiqueman ap rete yon sijè pou youn nan atik sa yo. Isit la nou pral gade nan sa yo rele Cross-Rack solisyon rekiperasyon dezas, lè pwoteksyon bati nan nivo kabinè sèvè. Kabinè yo tèt yo ka lokalize nan menm chanm oswa nan diferan, men anjeneral nan menm bilding lan.

Kabinè sa yo dwe genyen tout seri ekipman ak lojisyèl ki nesesè ki pral pèmèt operasyon baz done Oracle kèlkeswa eta "vwazen an". Nan lòt mo, lè l sèvi avèk solisyon rekiperasyon dezas Cross-Rack, nou elimine risk ki genyen nan echèk:

  • Sèvè aplikasyon Oracle
  • Sistèm depo
  • Chanje sistèm yo
  • Echèk konplè nan tout ekipman nan kabinè a:
    • Refize pouvwa
    • Echèk sistèm refwadisman
    • Faktè ekstèn (moun, lanati, elatriye)

Duplication de serveurs Oracle implique anpil fonksyònman prensip Oracle RAC Et aplike atravè yon aplikasyon. Duplication de chanje fasilite yo tou pa yon pwoblèm. Men, ak repetisyon nan sistèm nan depo, tout bagay se pa tèlman senp.

Opsyon ki pi senp la se replikasyon done ki soti nan sistèm depo prensipal la nan yon sèl backup. Synchrone oswa asynchrone, tou depann de kapasite yo nan sistèm nan depo. Avèk replikasyon asynchrone, kesyon an imedyatman rive pou asire konsistans done an relasyon ak Oracle. Men, menm si gen entegrasyon lojisyèl ak aplikasyon an, nan nenpòt ka, nan evènman an nan yon echèk sou sistèm depo prensipal la, entèvansyon manyèl pa administratè yo pral oblije chanje gwoup la nan depo backup.

Yon opsyon ki pi konplèks se lojisyèl ak/oswa pyès ki nan konpitè depo "virtualizers" ki pral elimine pwoblèm konsistans ak entèvansyon manyèl. Men, konpleksite nan deplwaman ak administrasyon ki vin apre, osi byen ke pri a trè endesan nan solisyon sa yo, fè pè anpil.

Solisyon etalaj AccelStor NeoSapphire™ All Flash pafè pou senaryo tankou rekiperasyon dezas Cross-Rack. H710 lè l sèvi avèk Shared-Nothing achitekti. Modèl sa a se yon sistèm depo de-nœud ki itilize teknoloji propriétaire FlexiRemap® pou travay ak kondui flash. Gras a FlexiRemap® NeoSapphire™ H710 kapab bay pèfòmans jiska 600K IOPS@4K ekriti o aza ak 1M+ IOPS@4K lekti owaza, ki pa ka reyalize lè w ap itilize sistèm depo klasik ki baze sou RAID.

Men, karakteristik prensipal NeoSapphire™ H710 se ekzekisyon de nœuds nan fòm ka separe, chak nan yo ki gen pwòp kopi done yo. Se senkronizasyon nan nœuds te pote soti nan koòdone ekstèn InfiniBand la. Mèsi a achitekti sa a, li posib pou distribye nœuds nan diferan kote nan yon distans jiska 100m, kidonk bay yon solisyon rekiperasyon dezas Cross-Rack. Tou de nœuds opere nèt synchrone. Soti nan bò lame a, H710 a sanble ak yon sistèm depo òdinè doub-kontwolè. Se poutèt sa, pa gen okenn bezwen fè nenpòt opsyon adisyonèl lojisyèl oswa pyès ki nan konpitè oswa anviwònman patikilyèman konplèks.

Si nou konpare tout solisyon rekiperasyon pou katastwòf Cross-Rack ki dekri pi wo a, opsyon ki soti nan AccelStor parèt byen klè nan rès la:

AccelStor NeoSapphire™ Achitekti pa pataje anyen
Lojisyèl oswa pyès ki nan konpitè "virtualizer" sistèm depo
Solisyon ki baze sou replikasyon

Disponibilite

Echèk sèvè
Pa gen D '
Pa gen D '
Pa gen D '

Chanje echèk
Pa gen D '
Pa gen D '
Pa gen D '

Echèk sistèm depo
Pa gen D '
Pa gen D '
D '

Echèk kabinè tout antye
Pa gen D '
Pa gen D '
D '

Pri ak konpleksite

Pri solisyon
Ba*
Segondè
Segondè

Konpleksite deplwaman
Ba
Segondè
Segondè

*AccelStor NeoSapphire™ se toujou yon etalaj All Flash, ki pa definisyon pa koute "3 kopèk," sitou paske li gen yon rezèv kapasite doub. Sepandan, lè w konpare pri final la nan yon solisyon ki baze sou li ak sa ki sanble nan lòt fournisseurs, pri a ka konsidere kòm ba.

Topoloji pou konekte sèvè aplikasyon yo ak tout nœuds etalaj Flash yo pral sanble sa a:

Bati yon solisyon toleran defo ki baze sou achitekti Oracle RAC ak AccelStor Shared-Nothing

Lè w ap planifye topoloji a, li rekòmande tou pou kopi switch jesyon ak entèkonekte sèvè yo.

Apre sa nou pral pale sou koneksyon atravè Fibre Channel. Si ou itilize iSCSI, tout bagay pral menm jan an, ajiste pou kalite switch yo itilize ak anviwònman etalaj yon ti kras diferan.

Travay preparasyon pou etalaj la

Ekipman ak lojisyèl yo itilize

Espesifikasyon sèvè ak switch

Eleman
Deskripsyon

Oracle Database 11g serveurs
De

Sistèm operasyon sèvè
oracle linux

Vèsyon baz done Oracle
11g (RAC)

Processeurs pou chak sèvè
De 16 nwayo Intel® Xeon® CPU E5-2667 v2 @ 3.30GHz

Memwa fizik pou chak sèvè
128GB

Rezo FC
16Gb/s FC ak multipathing

FC HBA
Emulex Lpe-16002B

Pò piblik 1GbE dedye pou jesyon gwoup
Intel Ethernet adaptè RJ45

16Gb/s FC switch
Boukad 6505

Pò prive 10GbE dedye pou senkronizasyon done yo
Intel X520

AccelStor NeoSapphire™ All Flash Array Spesifikasyon

Eleman
Deskripsyon

Sistèm Depo
Modèl disponiblite segondè NeoSapphire™: H710

Vèsyon imaj
4.0.1

Kantite total kondui
48

Kondwi gwosè
1.92TB

Kondwi kalite
SSD

FC sib pò
16x 16Gb pò (8 pou chak ne)

Jesyon pò
Kab Ethernet 1GbE ki konekte ak lame atravè yon switch Ethernet

Pò batman kè
Kab Ethernet 1GbE ki konekte ant de nœuds depo

Pò senkronizasyon done
56 Gb/s InfiniBand kab

Anvan ou ka itilize yon etalaj, ou dwe inisyalize li. Pa default, adrès kontwòl tou de nœuds se menm bagay la (192.168.1.1). Ou bezwen konekte ak yo youn pa youn epi mete nouvo (deja diferan) adrès jesyon ak mete kanpe senkronizasyon tan, apre sa pò yo Jesyon yo ka konekte nan yon rezo sèl. Apre sa, nœuds yo konbine nan yon pè HA lè yo bay subnets pou koneksyon Interlink.

Bati yon solisyon toleran defo ki baze sou achitekti Oracle RAC ak AccelStor Shared-Nothing

Apre inisyalizasyon fini, ou ka jere etalaj la nan nenpòt ne.

Apre sa, nou kreye volim ki nesesè yo epi pibliye yo sou sèvè aplikasyon yo.

Bati yon solisyon toleran defo ki baze sou achitekti Oracle RAC ak AccelStor Shared-Nothing

Li trè rekòmande pou kreye plizyè volim pou Oracle ASM paske sa a pral ogmante kantite sib pou sèvè yo, ki pral finalman amelyore pèfòmans jeneral (plis sou ke moun kap kriye nan yon lòt. Atik).

Tès konfigirasyon

Depo Volim Non
Gwosè Volim

Done01
200GB

Done02
200GB

Done03
200GB

Done04
200GB

Done05
200GB

Done06
200GB

Done07
200GB

Done08
200GB

Done09
200GB

Done10
200GB

Grid01
1GB

Grid02
1GB

Grid03
1GB

Grid04
1GB

Grid05
1GB

Grid06
1GB

Refè01
100GB

Refè02
100GB

Refè03
100GB

Refè04
100GB

Refè05
100GB

Refè06
100GB

Refè07
100GB

Refè08
100GB

Refè09
100GB

Refè10
100GB

Gen kèk eksplikasyon sou mòd fonksyònman etalaj la ak pwosesis ki fèt nan sitiyasyon ijans

Bati yon solisyon toleran defo ki baze sou achitekti Oracle RAC ak AccelStor Shared-Nothing

Seri done chak ne gen yon paramèt "nimewo vèsyon". Apre inisyalizasyon inisyal, li se menm bagay la ak egal a 1. Si pou kèk rezon nimewo vèsyon an diferan, Lè sa a, done yo toujou senkronize soti nan vèsyon an ki pi gran nan youn nan pi piti, apre yo fin ki nimewo a nan vèsyon an ki pi piti ki aliyen, i.e. sa vle di kopi yo idantik. Rezon ki fè vèsyon yo ka diferan:

  • Pwograme rdemare nan youn nan nœuds yo
  • Yon aksidan sou youn nan nœuds yo akòz yon fèmen toudenkou (ekipman, surchof, elatriye).
  • Pèdi koneksyon InfiniBand ak enkapasite pou senkronize
  • Yon aksidan sou youn nan nœuds yo akòz koripsyon done yo. La a ou pral bezwen kreye yon nouvo gwoup HA ak senkronizasyon konplè nan seri done a.

Nan nenpòt ka, ne ki rete sou entènèt ogmante nimewo vèsyon li yo pa youn nan lòd yo senkronize seri done li yo apre koneksyon an ak pè a retabli.

Si koneksyon an sou lyen Ethernet la pèdi, Heartbeat tanporèman chanje nan InfiniBand epi retounen tounen nan 10 segonn lè li retabli.

Mete kanpe lame yo

Pou asire tolerans fay ak amelyore pèfòmans, ou dwe pèmèt sipò MPIO pou etalaj la. Pou fè sa, ou bezwen ajoute liy nan /etc/multipath.conf fichye a, ak Lè sa a, rekòmanse sèvis la multipath.

Tèks kacheaparèy {
aparèy {
machann "AStor"
path_grouping_policy "group_by_prio"
path_selector "longè keu 0"
path_checker "tour"
karakteristik "0"
hardware_handler "0"
prio "const"
failback imedya
fast_io_fail_tmo 5
dev_loss_tmo 60
user_friendly_names wi
detect_prio wi
rr_min_io_rq 1
no_path_retry 0
}
}

Apre sa, pou ASM travay ak MPIO atravè ASMLib, ou bezwen chanje fichye /etc/sysconfig/oracleasm epi kouri /etc/init.d/oracleasm scandisks.

Tèks kache

# ORACLEASM_SCANORDER: Matching modèl pou kòmande eskanè disk
ORACLEASM_SCANORDER="dm"

# ORACLEASM_SCANEXCLUDE: Modèl matche pou eskli disk nan eskanè
ORACLEASM_SCANEXCLUDE="sd"

Note

Si ou pa vle sèvi ak ASMLib, ou ka sèvi ak règ UDEV yo, ki se baz pou ASMLib.

Kòmanse ak vèsyon 12.1.0.2 nan Oracle Database, opsyon a disponib pou enstalasyon kòm yon pati nan lojisyèl ASMFD la.

Li enperatif asire ke disk yo kreye pou Oracle ASM yo aliyen ak gwosè blòk ke etalaj la fizikman opere ak (4K). Sinon, pwoblèm pèfòmans ka rive. Se poutèt sa, li nesesè yo kreye komèsan ak paramèt ki apwopriye yo:

parted /dev/mapper/device-name mklabel gpt mkpart primary 2048s 100% align-check optimal 1

Distribisyon baz done atravè volim kreye pou konfigirasyon tès nou an

Depo Volim Non
Gwosè Volim
Volim LUNs kat
ASM volim aparèy detay
Gwosè Inite Alokasyon

Done01
200GB
Map tout komèsan depo nan sistèm depo tout pò done yo
Redondans: Nòmal
Non: DGDATA
Objektif: Fichye done yo

4MB

Done02
200GB

Done03
200GB

Done04
200GB

Done05
200GB

Done06
200GB

Done07
200GB

Done08
200GB

Done09
200GB

Done10
200GB

Grid01
1GB
Redondans: Nòmal
Non: DGGRID1
Objektif: Grid: CRS ak Vòt

4MB

Grid02
1GB

Grid03
1GB

Grid04
1GB
Redondans: Nòmal
Non: DGGRID2
Objektif: Grid: CRS ak Vòt

4MB

Grid05
1GB

Grid06
1GB

Refè01
100GB
Redondans: Nòmal
Non: DGRADO1
Objektif: Refè boutèy demi lit fil 1

4MB

Refè02
100GB

Refè03
100GB

Refè04
100GB

Refè05
100GB

Refè06
100GB
Redondans: Nòmal
Non: DGRADO2
Objektif: Refè boutèy demi lit fil 2

4MB

Refè07
100GB

Refè08
100GB

Refè09
100GB

Refè10
100GB

Anviwònman baz done

  • Gwosè blòk = 8K
  • Boukante espas = 16GB
  • Enfim AMM (Jesyon memwa otomatik)
  • Enfim Transparan Gwo Paj

Lòt paramèt

# vi /etc/sysctl.conf
✓ fs.aio-max-nr = 1048576
✓ fs.file-max = 6815744
✓ kernel.shmmax 103079215104
✓ kernel.shmall 31457280
✓ kernel.shmmn 4096
✓ kernel.sem = 250 32000 100 128
✓ net.ipv4.ip_local_port_range = 9000 65500
✓ net.core.rmem_default = 262144
✓ net.core.rmem_max = 4194304
✓ net.core.wmem_default = 262144
✓ net.core.wmem_max = 1048586
✓vm.swappiness=10
✓ vm.min_free_kbytes=524288 # pa mete sa si w ap itilize Linux x86
✓ vm.vfs_cache_pressure=200
✓ vm.nr_hugepages = 57000

# vi /etc/security/limits.conf
✓ grid mou nproc 2047
✓ grid hard nproc 16384
✓ grid soft nofile 1024
✓ grid hard nofile 65536
✓ griy mou pile 10240
✓ grid pile difisil 32768
✓ oracle soft nproc 2047
✓ oracle hard nproc 16384
✓ oracle soft nofile 1024
✓ oracle hard nofile 65536
✓ Oracle mou stack 10240
✓ Oracle hard stack 32768
✓ soft memlock 120795954
✓ memlock difisil 120795954

sqlplus "/ kòm sysdba"
chanje sistèm mete pwosesis = 2000 dimansyon = spfile;
alter system set open_cursors=2000 scope=spfile;
chanje sistèm mete session_cached_cursors=300 scope=spfile;
chanje sistèm mete db_files = 8192 scope = spfile;

Tès echèk

Pou rezon demonstrasyon, HammerDB te itilize pou imite yon chaj OLTP. Konfigirasyon HammerDB:

Kantite depo
256

Total tranzaksyon pou chak itilizatè
1000000000000

Itilizatè Virtuel
256

Rezilta a se te yon TPM 2.1M, ki se lwen limit pèfòmans etalaj la H710, men se yon "plafon" pou konfigirasyon pyès ki nan konpitè aktyèl la nan sèvè (sitou akòz processeurs) ak nimewo yo. Objektif tès sa a se toujou demontre tolerans fay nan solisyon an kòm yon antye, epi yo pa reyalize pèfòmans maksimòm. Se poutèt sa, nou pral tou senpleman bati sou figi sa a.

Bati yon solisyon toleran defo ki baze sou achitekti Oracle RAC ak AccelStor Shared-Nothing

Tès pou echèk nan youn nan nœuds yo

Bati yon solisyon toleran defo ki baze sou achitekti Oracle RAC ak AccelStor Shared-Nothing

Bati yon solisyon toleran defo ki baze sou achitekti Oracle RAC ak AccelStor Shared-Nothing

Gen tout pouvwa a pèdi yon pati nan chemen yo nan depo a, kontinye travay nan sa ki rete yo ak dezyèm ne. Pèfòmans tonbe pou kèk segond akòz chemen yo te rebati, ak Lè sa a, tounen nan nòmal. Pa te gen okenn entèripsyon nan sèvis la.

Tès echèk kabinè ak tout ekipman

Bati yon solisyon toleran defo ki baze sou achitekti Oracle RAC ak AccelStor Shared-Nothing

Bati yon solisyon toleran defo ki baze sou achitekti Oracle RAC ak AccelStor Shared-Nothing

Nan ka sa a, pèfòmans tou tonbe pou kèk segond akòz restriktirasyon chemen yo, ak Lè sa a, tounen nan mwatye valè orijinal la. Rezilta a te mwatye nan premye a akòz esklizyon yon sèvè aplikasyon nan operasyon. Pa te gen okenn entèripsyon nan sèvis tou.

Si gen yon nesesite pou aplike yon solisyon rekiperasyon dezas Cross-Rack ki toleran defo pou Oracle a yon pri rezonab ak ti efò deplwaman/administrasyon, Lè sa a, Oracle RAC ak achitekti travay ansanm. AccelStor Pataje-Pa gen anyen pral youn nan pi bon opsyon yo. Olye de Oracle RAC, ka gen nenpòt lòt lojisyèl ki bay clustering, menm DBMS oswa sistèm Virtualization, pou egzanp. Prensip la nan konstwi solisyon an ap rete menm jan an. Ak liy anba a se zewo pou RTO ak RPO.

Sous: www.habr.com

Add nouvo kòmantè