د Oracle RAC او AccelStor Shared-Nothing معمارۍ پراساس د غلطۍ زغمونکي حل رامینځته کول

د پام وړ شمیر د تصدۍ غوښتنلیکونه او د مجازی کولو سیسټمونه د غلطۍ زغمونکي حلونو رامینځته کولو لپاره خپل میکانیزمونه لري. په ځانګړې توګه، Oracle RAC (Oracle Real Application Cluster) د دوه یا ډیرو اوریکل ډیټابیس سرورونو کلستر دی چې د بار توازن کولو او د سرور / غوښتنلیک په کچه د غلطۍ زغم چمتو کولو لپاره یوځای کار کوي. په دې حالت کې د کار کولو لپاره، تاسو یو ګډ ذخیره ته اړتیا لرئ، کوم چې معمولا د ذخیره کولو سیسټم دی.

لکه څنګه چې موږ دمخه زموږ په یوه برخه کې بحث کړی دی مقالې، پخپله د ذخیره کولو سیسټم ، د نقل شوي اجزاو شتون سره سره (د کنټرولر په شمول) ، لاهم د ناکامۍ ټکي لري - په عمده ډول د ډیټا د یوې سیټ په شکل کې. نو له همدې امله، د زیاتې اعتبار اړتیاو سره د اوریکل حل رامینځته کولو لپاره، د "N سرور - یو ذخیره کولو سیسټم" سکیم پیچلې ته اړتیا لري.

د Oracle RAC او AccelStor Shared-Nothing معمارۍ پراساس د غلطۍ زغمونکي حل رامینځته کول

لومړی، البته، موږ باید پریکړه وکړو چې د کوم خطرونو په وړاندې بیمه کولو هڅه کوو. په دې مقاله کې، موږ به د ګواښونو په وړاندې محافظت په پام کې ونیسو لکه "الکا راوتلی." نو د جغرافیائی پلوه منحل شوي ناورین بیا رغونې حل رامینځته کول به د لاندې مقالو څخه یوه موضوع پاتې شي. دلته به موږ د کراس ریک ناورین بیا رغونه حل ته وګورو، کله چې محافظت د سرور کابینې په کچه جوړیږي. کابینې پخپله په ورته خونه کې یا په مختلفو ځایونو کې موقعیت لري، مګر معمولا په ورته ودانۍ کې.

دا کابینې باید د تجهیزاتو او سافټویر ټول اړین سیټ ولري چې د "ګاونډی" حالت په پام کې نیولو پرته د اوریکل ډیټابیس عملیاتو ته اجازه ورکوي. په بل عبارت، د کراس-ریک ناورین د بیا رغونې حل په کارولو سره، موږ د ناکامۍ خطرونه له منځه یوسو:

  • د اوریکل غوښتنلیک سرورونه
  • د زیرمې سیسټمونه
  • د بدلولو سیسټمونه
  • په کابینه کې د ټولو تجهیزاتو بشپړ ناکامي:
    • د بریښنا انکار
    • د یخولو سیسټم ناکامي
    • بهرني عوامل (انسان، طبیعت، او نور)

د اوریکل سرورونو نقل کول د اوریکل RAC خورا عملیاتي اصول معنی لري او د غوښتنلیک له لارې پلي کیږي. د سویچ کولو تاسیساتو تکرار هم کومه ستونزه نده. مګر د ذخیره کولو سیسټم نقل سره، هرڅه دومره ساده ندي.

ترټولو ساده اختیار د اصلي ذخیره کولو سیسټم څخه بیک اپ ته د ډیټا نقل کول دي. همغږي یا غیر متناسب، د ذخیره کولو سیسټم وړتیاو پورې اړه لري. د غیر متناسب نقل سره ، پوښتنه سمدلاسه راپورته کیږي چې د اوریکل په اړه د ډیټا تسلسل تضمین کړي. مګر حتی که چیرې د غوښتنلیک سره د سافټویر ادغام شتون ولري ، په هر حالت کې ، د اصلي ذخیره کولو سیسټم کې د ناکامۍ په صورت کې ، د مدیرانو لخوا لاسي مداخلې ته اړتیا وي ترڅو کلسټر بیک اپ ذخیره ته واړوي.

یو ډیر پیچلی اختیار د سافټویر او / یا هارډویر ذخیره "ورچویلائزر" دی چې د دوام ستونزې او لاسي مداخله به له منځه یوسي. مګر د ګمارلو پیچلتیا او وروسته اداره، او همدارنګه د داسې حلونو خورا نامناسب لګښت، ډیری ډاروي.

د AccelStor NeoSapphire ™ ټول فلش اری حل د سناریوګانو لپاره مناسب دی لکه د کراس ریک ناورین بیا رغونه H710 د شریک شوي - هیڅ شی جوړښت کارول. دا ماډل د دوه نوډ ذخیره کولو سیسټم دی چې د فلش ډرایو سره کار کولو لپاره د ملکیت FlexiRemap® ټیکنالوژي کاروي. مننه FlexiRemap® NeoSapphire ™ H710 د 600K IOPS@4K تصادفي لیکلو او 1M+ IOPS@4K تصادفي لوستلو پورې فعالیت وړاندې کولو وړ دی ، کوم چې د کلاسیک RAID پراساس ذخیره کولو سیسټمونو کارولو پرمهال د لاسرسي وړ ندي.

مګر د NeoSapphire ™ H710 اصلي ځانګړتیا د جلا قضیو په بڼه د دوو نوډونو اجرا کول دي، چې هر یو یې د معلوماتو خپل کاپي لري. نوډونه د InfiniBand بهرني انٹرفیس له لارې همغږي شوي. د دې جوړښت څخه مننه، دا ممکنه ده چې تر 100m پورې فاصله په مختلفو ځایونو کې نوډونه توزیع کړئ، په دې توګه د کراس ریک ناورین بیا رغونه حل چمتو کوي. دواړه نوډونه په بشپړ ډول همغږي کار کوي. د کوربه لوري څخه، H710 د عادي ډبل کنټرولر ذخیره کولو سیسټم په څیر ښکاري. له همدې امله، د اضافي سافټویر یا هارډویر انتخابونو یا په ځانګړې توګه پیچلي ترتیبات ترسره کولو ته اړتیا نشته.

که موږ ټول د کراس ریک ناورین بیا رغونه حلونه پرتله کړو چې پورته تشریح شوي، نو د AccelStor اختیار د پاتې نورو څخه د پام وړ څرګند دی:

AccelStor NeoSapphire™ د هیڅ جوړښت جوړښت شریک نه کړ
سافټویر یا هارډویر "مجازیګر" ذخیره کولو سیسټم
د تکثیر پر بنسټ حل

شتون

د سرور ناکامي
هیڅ وخت ندی
هیڅ وخت ندی
هیڅ وخت ندی

د بدلولو ناکامي
هیڅ وخت ندی
هیڅ وخت ندی
هیڅ وخت ندی

د ذخیره کولو سیسټم ناکامي
هیڅ وخت ندی
هیڅ وخت ندی
رخصتۍ

د کابینې ټوله ناکامي
هیڅ وخت ندی
هیڅ وخت ندی
رخصتۍ

لګښت او پیچلتیا

د حل لګښت
ټیټ*
ویډیو
ویډیو

د ځای پرځای کولو پیچلتیا
Низкая
ویډیو
ویډیو

*AccelStor NeoSapphire ™ لاهم د ټول فلش سرې دی، کوم چې د تعریف له مخې "3 کوپیک" لګښت نلري، په ځانګړې توګه ځکه چې دا د دوه ګوني ظرفیت ذخیره لري. په هرصورت، کله چې د دې پر بنسټ د حل وروستی لګښت د نورو پلورونکو څخه ورته ورته سره پرتله کړئ، لګښت ټیټ ګڼل کیدی شي.

د اپلیکیشن سرورونو او ټول فلش سري نوډونو سره وصل کولو لپاره ټوپولوژي به داسې ښکاري:

د Oracle RAC او AccelStor Shared-Nothing معمارۍ پراساس د غلطۍ زغمونکي حل رامینځته کول

کله چې د ټوپولوژي پلان کول، دا هم ډیره سپارښتنه کیږي چې د مدیریت سویچونو نقل او یو بل سره وصل شوي سرورونه.

دلته او نور به موږ د فایبر چینل له لارې د نښلولو په اړه وغږیږو. که تاسو iSCSI کاروئ، هر څه به ورته وي، د کارول شوي سویچونو ډولونو لپاره تنظیم شوي او یو څه مختلف صف ترتیبات.

په صف کې د چمتووالي کار

وسایل او سافټویر کارول کیږي

د سرور او سویچ مشخصات

اجزاء
شرح

د اوریکل ډیټابیس 11g سرورونه
دوه

د سرور عملیاتي سیسټم
اوریکل لینوکس

د اوریکل ډیټابیس نسخه
11g (RAC)

د هر سرور پروسیسرونه
دوه 16 کور Intel® Xeon® CPU E5-2667 v2 @ 3.30GHz

په هر سرور کې فزیکي حافظه
128GB

د FC شبکه
د ملټي پاټینګ سره 16Gb/s FC

FC HBA
ایمولیکس Lpe-16002B

د کلستر مدیریت لپاره د عامه 1GbE بندرونه وقف شوي
د انټل ایترنیټ اډاپټر RJ45

16Gb/s FC سویچ
بروکیډ 6505

د ډیټا همغږي کولو لپاره شخصي 10GbE بندرونه وقف شوي
Intel X520

AccelStor NeoSapphire ™ ټول فلش سرې مشخصات

اجزاء
شرح

د ذخیره کولو سیسټم
NeoSapphire™ د لوړ شتون ماډل: H710

د انځور نسخه
4.0.1

د ډرایو ټول شمیر
48

د موټر اندازه
1.92TB

د موټر ډول
SSD

د FC هدف بندرونه
16x 16Gb بندرونه (په هر نوډ کې 8)

مدیریت بندرونه
د 1GbE ایترنیټ کیبل د ایترنیټ سویچ له لارې کوربه سره وصل کیږي

د زړه ضربان بندر
د 1GbE ایترنیټ کیبل د دوه ذخیره کولو نوډونو ترمینځ وصل دی

د معلوماتو همغږي کولو بندر
56Gb/s InfiniBand کیبل

مخکې له دې چې تاسو یو صف وکاروئ، دا باید پیل شي. د ډیفالټ په واسطه، د دواړو نوډونو کنټرول پته ورته ده (192.168.1.1). تاسو اړتیا لرئ له دوی سره یو له بل سره وصل شئ او نوي (مخکې مختلف) مدیریت پتې تنظیم کړئ او د وخت ترکیب تنظیم کړئ ، له هغې وروسته د مدیریت بندرونه له یوې شبکې سره وصل کیدی شي. وروسته، نوډونه د انټرلینک اتصال لپاره د فرعي نیټونو په ټاکلو سره د HA جوړه سره یوځای کیږي.

د Oracle RAC او AccelStor Shared-Nothing معمارۍ پراساس د غلطۍ زغمونکي حل رامینځته کول

د پیل کولو بشپړیدو وروسته، تاسو کولی شئ د هر نوډ څخه سري اداره کړئ.

بیا ، موږ اړین حجمونه رامینځته کوو او د غوښتنلیک سرورونو ته یې خپروو.

د Oracle RAC او AccelStor Shared-Nothing معمارۍ پراساس د غلطۍ زغمونکي حل رامینځته کول

دا خورا سپارښتنه کیږي چې د اوریکل ASM لپاره ډیری حجمونه رامینځته کړي ځکه چې دا به د سرورونو لپاره د اهدافو شمیر ډیر کړي ، کوم چې به په نهایت کې ټول فعالیت ښه کړي (په بل کې په قطارونو کې نور. مقالې).

د ازموینې ترتیب

د ذخیرې حجم نوم
د مقدار کچه

ډاټا 01
200GB

ډاټا 02
200GB

ډاټا 03
200GB

ډاټا 04
200GB

ډاټا 05
200GB

ډاټا 06
200GB

ډاټا 07
200GB

ډاټا 08
200GB

ډاټا 09
200GB

ډاټا 10
200GB

Grid01
1GB

Grid02
1GB

Grid03
1GB

Grid04
1GB

Grid05
1GB

Grid06
1GB

Redo01
100GB

Redo02
100GB

Redo03
100GB

Redo04
100GB

Redo05
100GB

Redo06
100GB

Redo07
100GB

Redo08
100GB

Redo09
100GB

Redo10
100GB

د صف د عملیاتي حالتونو او په بیړني حالتونو کې د پروسو په اړه ځینې توضیحات

د Oracle RAC او AccelStor Shared-Nothing معمارۍ پراساس د غلطۍ زغمونکي حل رامینځته کول

د هر نوډ ډیټا سیټ د "نسخه شمیره" پیرامیټر لري. د پیل کولو څخه وروسته، دا د 1 سره یو شان او مساوي وي. که د کوم دلیل لپاره د نسخې شمیره توپیر ولري، نو بیا ډاټا تل د زړې نسخې څخه کوچني ته همغږي کیږي، وروسته له دې چې د ځوان نسخه شمیره همغږي کیږي، د بیلګې په توګه. دا پدې مانا ده چې نقلونه ورته دي. لاملونه چې ولې نسخې توپیر لري:

  • د نوډونو څخه یو مهالویش ریبوټ
  • د ناڅاپه بندیدو له امله په یو نوډ کې حادثه (د بریښنا رسولو، ډیر تودوخې، او نور).
  • د انفینی بانډ پیوستون د همغږي کولو نشتوالي له لاسه ورکړ
  • د معلوماتو فساد له امله په یو نوډ کې حادثه. دلته تاسو اړتیا لرئ د نوي HA ګروپ رامینځته کړئ او د ډیټا سیټ بشپړ همغږي وکړئ.

په هر حالت کې، هغه نوډ چې آنلاین پاتې کیږي د هغې د نسخې شمیره د یو لخوا ډیروي ترڅو د جوړه سره د پیوستون له بیرته راګرځیدو وروسته د هغې ډاټا سیټ همغږي کړي.

که چیرې د ایترنیټ لینک باندې اړیکه له لاسه ورکړي، د زړه ضربان په موقتي توګه InfiniBand ته بدلیږي او په 10 ثانیو کې بیرته راستنیږي کله چې دا بحال شي.

د کوربه تنظیم کول

د خطا زغم ډاډ ترلاسه کولو او فعالیت ښه کولو لپاره ، تاسو باید د صف لپاره د MPIO ملاتړ فعال کړئ. د دې کولو لپاره، تاسو اړتیا لرئ چې /etc/multipath.conf فایل ته لینونه اضافه کړئ، او بیا د ملټيپاټ خدمت بیا پیل کړئ.

پټ متنوسایل {
وسیله {
پلورونکی "AStor"
path_grouping_policy "group_by_prio"
لاره_ټاکونکی "د قطار اوږدوالی 0"
path_checker "tur"
ځانګړتیاوې "0"
هارډویر_مینډر "0"
prio "const"
سمدستي ناکام شو
چټک_io_fail_tmo 5
dev_loss_tmo 60
د کارن_دوستانه_نومونه هو
کشف_prio هو
rr_min_io_rq 1
no_path_retry 0
}
}

بیا، د ASM لپاره د ASMLib له لارې د MPIO سره کار کولو لپاره، تاسو اړتیا لرئ د /etc/sysconfig/oracleasm فایل بدل کړئ او بیا /etc/init.d/oracleasm scandisks چل کړئ.

پټ متن

# ORACLEASM_SCANORDER: د ډیسک سکین کولو امر کولو لپاره نمونې سره سمون خوري
ORACLEASM_SCANORDER="dm"

# ORACLEASM_SCANEXCLUDE: د سکین څخه ډیسکونو لرې کولو لپاره د سمون نمونې
ORACLEASM_SCANEXCLUDE="sd"

تبصره

که تاسو نه غواړئ ASMLib وکاروئ، تاسو کولی شئ د UDEV قواعد وکاروئ، کوم چې د ASMLib اساس دی.

د اوریکل ډیټابیس 12.1.0.2 نسخه سره پیل کول ، اختیار د ASMFD سافټویر برخې په توګه د نصب لپاره شتون لري.

دا اړینه ده چې ډاډ ترلاسه کړئ چې د اوریکل ASM لپاره رامینځته شوي ډیسکونه د بلاک اندازې سره سمون لري چې صف په فزیکي توګه د (4K) سره کار کوي. که نه نو، د فعالیت ستونزې ممکن واقع شي. له همدې امله، دا اړینه ده چې د مناسبو پیرامیټونو سره حجمونه جوړ کړئ:

پارټ شوی /dev/mapper/device-name mklabel gpt mkpart لومړنی 2048s 100% align-check optimal 1

زموږ د ازموینې ترتیب لپاره رامینځته شوي حجمونو کې د ډیټابیسونو ویش

د ذخیرې حجم نوم
د مقدار کچه
د حجم LUNs نقشه کول
د ASM حجم وسیلې توضیحات
د تخصیص واحد اندازه

ډاټا 01
200GB
د ذخیره کولو ټول حجمونه د ذخیره کولو سیسټم ټولو ډیټا بندرونو ته نقشه کړئ
بې ځایه: عادي
نوم: DGDATA
موخه: د معلوماتو فایلونه

4MB

ډاټا 02
200GB

ډاټا 03
200GB

ډاټا 04
200GB

ډاټا 05
200GB

ډاټا 06
200GB

ډاټا 07
200GB

ډاټا 08
200GB

ډاټا 09
200GB

ډاټا 10
200GB

Grid01
1GB
بې ځایه: عادي
نوم: DGGRID1
موخه: گرډ: CRS او رایه ورکول

4MB

Grid02
1GB

Grid03
1GB

Grid04
1GB
بې ځایه: عادي
نوم: DGGRID2
موخه: گرډ: CRS او رایه ورکول

4MB

Grid05
1GB

Grid06
1GB

Redo01
100GB
بې ځایه: عادي
نوم: DGREDO1
موخه: د تار لاګ بیا پیل کړئ 1

4MB

Redo02
100GB

Redo03
100GB

Redo04
100GB

Redo05
100GB

Redo06
100GB
بې ځایه: عادي
نوم: DGREDO2
موخه: د تار لاګ بیا پیل کړئ 2

4MB

Redo07
100GB

Redo08
100GB

Redo09
100GB

Redo10
100GB

د ډیټابیس ترتیبات

  • د بلاک اندازه = 8K
  • د تبادلې ځای = 16GB
  • AMM غیر فعال کړئ (د اتوماتیک حافظې مدیریت)
  • شفاف لوی پاڼې غیر فعال کړئ

نور ترتیبات

# vi /etc/sysctl.conf
✓ fs.aio-max-nr = 1048576
✓ fs.file-max = 6815744
✓ kernel.shmmax 103079215104
✓ kernel.shmall 31457280
✓ kernel.shmmn 4096
✓ kernel.sem = 250 32000 100 128
✓ net.ipv4.ip_local_port_range = 9000 65500
✓ net.core.rmem_default = 262144
✓ net.core.rmem_max = 4194304
✓ net.core.wmem_default = 262144
✓ net.core.wmem_max = 1048586
✓vm.swappiness=10
✓ vm.min_free_kbytes=524288 # دا مه تنظیم کړئ که تاسو لینکس x86 کاروئ
✓ vm.vfs_cache_pressure=200
✓ vm.nr_hugepages = 57000

# vi /etc/security/limits.conf
✓ گرډ نرم nproc 2047
✓ ګریډ هارډ nproc 16384
✓ گرډ نرم نوفایل 1024
✓ گرډ هارډ نوفایل 65536
✓ گرډ نرم سټیک 10240
✓ گرډ هارډ سټیک 32768
✓ اوریکل نرم nproc 2047
✓ اوریکل هارډ این پروک 16384
✓ اوریکل نرم نوفایل 1024
✓ اوریکل هارډ نوفیل 65536
✓ اوریکل نرم سټیک 10240
✓ اوریکل هارډ سټیک 32768
✓ نرم میملاک 120795954
✓ هارډ میملاک 120795954

sqlplus "/ as sysdba"
د سیسټم سیټ پروسې بدل کړئ = 2000 سکوپ = spfile؛
د سیسټم بدلول open_cursors=2000 scope=spfile؛
د سیسټم سیټ بدل کړئ session_cached_cursors=300 scope=spfile؛
د سیسټم بدلول db_files=8192 scope=spfile؛

د ناکامۍ ازموینه

د مظاهرې موخو لپاره، HammerDB د OLTP بار نقل کولو لپاره کارول کیده. د HammerDB ترتیب:

د ګودامونو شمیر
256

د هر کارونکي ټول لیږدونه
1000000000000

مجازی کاروونکي
256

پایله د 2.1M TPM وه، کوم چې د صف د فعالیت حد څخه لرې دی H710، مګر د سرورونو اوسني هارډویر ترتیب لپاره "چت" دی (په عمده ډول د پروسیسرونو له امله) او د دوی شمیر. د دې ازموینې هدف لاهم په بشپړ ډول د حل غلط زغم ښودل دي ، او نه د اعظمي فعالیت ترلاسه کول. له همدې امله، موږ به په ساده ډول دا ارقام جوړ کړو.

د Oracle RAC او AccelStor Shared-Nothing معمارۍ پراساس د غلطۍ زغمونکي حل رامینځته کول

د یو نوډونو د ناکامۍ لپاره ازموینه

د Oracle RAC او AccelStor Shared-Nothing معمارۍ پراساس د غلطۍ زغمونکي حل رامینځته کول

د Oracle RAC او AccelStor Shared-Nothing معمارۍ پراساس د غلطۍ زغمونکي حل رامینځته کول

کوربه ذخیرې ته د لارو یوه برخه له لاسه ورکړه ، د پاتې نورو له لارې د دوهم نوډ سره کار کولو ته دوام ورکوي. فعالیت د څو ثانیو لپاره راټیټ شو ځکه چې د لارو بیا رغول کیږي، او بیا بیرته عادي حالت ته راستانه شوي. په خدمت کې هیڅ خنډ نه و.

د ټولو تجهیزاتو سره د کابینې ناکامۍ ازموینه

د Oracle RAC او AccelStor Shared-Nothing معمارۍ پراساس د غلطۍ زغمونکي حل رامینځته کول

د Oracle RAC او AccelStor Shared-Nothing معمارۍ پراساس د غلطۍ زغمونکي حل رامینځته کول

پدې حالت کې، فعالیت هم د څو ثانیو لپاره د لارو د بیا تنظیم کولو له امله راټیټ شو، او بیا نیم اصلي ارزښت ته راستانه شو. پایله د عملیاتو څخه د یو غوښتنلیک سرور د ایستلو له امله له لومړني څخه نیمه راښکته شوه. په خدمت کې هم کوم خنډ نه و.

که چیرې د اوریکل لپاره په مناسب لګښت او د لږ ګمارنې/ادارې هڅو سره د غلطۍ زغمونکي کراس ریک ناورین بیا رغونه حل پلي کولو ته اړتیا وي ، نو د اوریکل RAC او جوړښت په ګډه کار کوي. AccelStor شریک شوی - هیڅ شی نه یو له غوره انتخابونو څخه به وي. د اوریکل RAC پرځای ، دلته کوم بل سافټویر شتون لري چې کلسټرینګ چمتو کوي ، ورته DBMS یا مجازی سیسټمونه ، د مثال په توګه. د حل د جوړولو اصول به ورته پاتې شي. او لاندینۍ کرښه د RTO او RPO لپاره صفر ده.

سرچینه: www.habr.com

Add a comment