కోల్డ్ డేటా సెంటర్‌లోని సర్వర్‌లో LSI RAID కంట్రోలర్ వేడెక్కడంతో జరిగిన సంఘటనపై చిన్న గమనిక

TL; DR; Supermicro ఆప్టిమల్ సర్వర్ కూలింగ్ సిస్టమ్ యొక్క ఆపరేటింగ్ మోడ్‌ను సెట్ చేయడం వలన కోల్డ్ డేటా సెంటర్‌లో MegaRAID 9361-8i LSI కంట్రోలర్ యొక్క స్థిరమైన ఆపరేషన్‌ను నిర్ధారించదు.

మేము హార్డ్‌వేర్ RAID కంట్రోలర్‌లను ఉపయోగించకూడదని ప్రయత్నిస్తాము, అయితే LSI MegaRAID కాన్ఫిగరేషన్‌లను ఇష్టపడే ఒక క్లయింట్ మాకు ఉంది. ప్లాట్‌ఫారమ్ కారణంగా ఈ రోజు మనం MegaRAID 9361-8i కార్డ్ వేడెక్కడం ఎదుర్కొన్నాము. అనుభూతి చెందలేదు వేడెక్కడం, మరియు RAID కంట్రోలర్ భావించాడు.

RAID కార్డ్‌తో ప్లాట్‌ఫారమ్ క్రింది బొమ్మలలో చూపబడింది:

కోల్డ్ డేటా సెంటర్‌లోని సర్వర్‌లో LSI RAID కంట్రోలర్ వేడెక్కడంతో జరిగిన సంఘటనపై చిన్న గమనిక

కోల్డ్ డేటా సెంటర్‌లోని సర్వర్‌లో LSI RAID కంట్రోలర్ వేడెక్కడంతో జరిగిన సంఘటనపై చిన్న గమనిక

ఈ సర్వర్ మరియు ఆపరేటింగ్ వాతావరణం గురించి కొన్ని ముఖ్యమైన అంశాలు:

ప్లాట్‌ఫారమ్‌ను సమీకరించిన ఇంజనీర్ ప్రత్యేకంగా కార్డ్ ముందు రెండు ఫ్యాన్‌లను ఉంచాడు, ఎందుకంటే LSI కంట్రోలర్‌లు చాలా వేడిగా ఉంటాయని అతనికి తెలుసు. మదర్బోర్డుకు శ్రద్ద, ఇది ఆచరణాత్మకంగా నియంత్రిక క్రింద సరిపోదు, PCI-E స్లాట్ తర్వాత 3 సెం.మీ.

మీరు చూడగలిగినట్లుగా, అభిమానులందరూ సాధారణంగా Supermicro మదర్‌బోర్డుకు కనెక్ట్ చేయబడి ఉంటారు ఆప్టిమల్ దానిపై సెన్సార్లు మరియు CPU ఉష్ణోగ్రతపై ఆధారపడి "బ్లో".

ఈ ప్లాట్‌ఫారమ్‌లో Xeon E-2236 ఉంది - చాలా చల్లని CPU, ఇది క్లయింట్ ఎక్కువగా వేడెక్కలేదు.

ఈ సర్వర్ ఉన్న డేటా సెంటర్ చాలా చల్లగా ఉంటుంది - చల్లని కారిడార్ 18-20 డిగ్రీలు ఇస్తుంది.

ఈ కారకాల కలయిక చాలా ఆసక్తికరమైన దృగ్విషయానికి దారితీసింది - RAID కంట్రోలర్ యొక్క వేడెక్కడం.

ఇది ఎలా జరిగిందో సంభావ్య గొలుసు

  1. కోల్డ్ ప్రాసెసర్ మరియు మదర్‌బోర్డు అభిమానులకు అవి బలహీనంగా వీస్తాయని తెలియజేసాయి.
  2. RAID కింద మదర్‌బోర్డ్ లేదు మరియు వేడెక్కడాన్ని గుర్తించే సెన్సార్‌లు లేవు.
  3. అభిమానులు, కాన్ఫిగర్ చేసినప్పుడు, మదర్‌బోర్డు మరియు CPU అవసరాలకు అనుగుణంగా ఆప్టిమల్ మోడ్‌లో బలహీనంగా ఎగిరింది.
  4. నియంత్రిక, తగినంత గాలి ప్రవాహాన్ని అందుకోలేదు, వేడెక్కింది.

ఏం చేశావు

మేము అభిమానులను "స్టాండర్డ్" మోడ్‌కి మార్చాము; అవసరమైతే, మేము వాటిని అధిక పనితీరు మోడ్‌కి మారుస్తాము.

కనుగొన్న

చాలా మటుకు, డేటా సెంటర్ యొక్క చల్లని నడవ అంత చల్లగా లేకుంటే లేదా క్లయింట్ CPUని తీవ్రంగా ఉపయోగిస్తుంటే, ఈ సమస్య సంభవించి ఉండకపోవచ్చు, ఎందుకంటే అభిమానులు మరింత తీవ్రంగా పని చేస్తారు.

మన కోసం, RAIDతో సర్వర్‌లలోని అభిమానుల ఆపరేటింగ్ మోడ్‌ను ఆప్టిమల్ నుండి పెరిగిన భ్రమణ వేగంతో మోడ్‌కు ఖచ్చితంగా మార్చాలని మేము నిర్ణయించుకున్నాము.

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి