Giám sát trong trung tâm dữ liệu: cách chúng tôi thay thế BMS cũ bằng BMS mới. Phần 1

Giám sát trong trung tâm dữ liệu: cách chúng tôi thay thế BMS cũ bằng BMS mới. Phần 1

BMS là gì

Hệ thống giám sát hoạt động của các hệ thống kỹ thuật trong trung tâm dữ liệu là thành phần chính của cơ sở hạ tầng, ảnh hưởng trực tiếp đến một chỉ số quan trọng đối với trung tâm dữ liệu như tốc độ phản ứng của nhân viên trong các tình huống khẩn cấp và do đó, thời gian hoạt động không bị gián đoạn. 

Hệ thống giám sát BMS (Hệ thống giám sát tòa nhà) được cung cấp bởi nhiều nhà cung cấp thiết bị cho trung tâm dữ liệu trên toàn cầu. Trong quá trình làm việc với Linxdatacenter ở Nga, chúng tôi đã có cơ hội làm quen với các hệ thống khác nhau và gặp phải những cách tiếp cận hoàn toàn trái ngược nhau của các nhà cung cấp đối với hoạt động của các hệ thống này. 

Chúng tôi cho bạn biết cách chúng tôi cập nhật hoàn toàn hệ thống BMS của mình trong năm qua và lý do.  

Gốc rễ của vấn đề

Mọi chuyện bắt đầu từ 10 năm trước với sự ra mắt của trung tâm dữ liệu Linxdatacenter ở St. Petersburg. Hệ thống BMS, theo tiêu chuẩn ngành của những năm đó, là một máy chủ vật lý có cài đặt phần mềm, được truy cập thông qua một chương trình máy khách (được gọi là máy khách “dày”). 

Có rất ít công ty cung cấp giải pháp như vậy trên thị trường vào thời điểm đó. Sản phẩm của họ là tiêu chuẩn, là câu trả lời duy nhất cho nhu cầu hiện tại. Và chúng ta phải đáp ứng đúng yêu cầu của họ: cả thời đó và ngày nay, các công ty dẫn đầu thị trường thường giải quyết nhiệm vụ cơ bản của họ - cung cấp các giải pháp chức năng để vận hành các trung tâm dữ liệu. 

Lựa chọn hợp lý đối với chúng tôi là giải pháp BMS từ một trong những nhà sản xuất lớn nhất thế giới. Hệ thống được lựa chọn vào thời điểm đó đáp ứng tất cả các yêu cầu để giám sát một cơ sở kỹ thuật phức tạp, chẳng hạn như trung tâm dữ liệu. 

Tuy nhiên, theo thời gian, các yêu cầu và mong đợi của người dùng (tức là chúng tôi, những người vận hành trung tâm dữ liệu) đối với các giải pháp CNTT đã thay đổi. Và các nhà cung cấp lớn, như được thể hiện qua phân tích thị trường cho các giải pháp được đề xuất, vẫn chưa sẵn sàng cho việc này.

Thị trường CNTT doanh nghiệp đã chịu ảnh hưởng nghiêm trọng từ khu vực B2C. Các giải pháp kỹ thuật số ngày nay phải mang lại trải nghiệm thoải mái cho người dùng cuối - đây là mục tiêu mà các nhà phát triển đặt ra cho mình. Điều này thể hiện rõ qua những cải tiến về giao diện người dùng (UI) và trải nghiệm người dùng (UX) của nhiều ứng dụng doanh nghiệp. 

Một người đã quen với sự thoải mái của mọi thứ liên quan đến các công cụ kỹ thuật số trong cuộc sống hàng ngày và đặt ra những yêu cầu tương tự đối với các công cụ mà anh ta sử dụng cho công việc. Mọi người mong đợi từ các ứng dụng doanh nghiệp khả năng hiển thị, tính trực quan, đơn giản và minh bạch tương tự như những gì họ có được trong các dịch vụ tài chính, gọi taxi hoặc mua sắm trực tuyến. Các chuyên gia CNTT triển khai các giải pháp trong môi trường doanh nghiệp cũng cố gắng nhận được tất cả các “tiện ích” hiện đại: triển khai và mở rộng quy mô đơn giản, khả năng chịu lỗi và khả năng tùy chỉnh không giới hạn. 

Các nhà cung cấp quốc tế lớn thường bỏ qua những xu hướng này. Dựa vào quyền lực lâu năm của mình trong ngành, các tập đoàn thường tỏ ra cứng rắn và thiếu linh hoạt khi làm việc với khách hàng. Ảo tưởng về tính tất yếu của chính họ không cho phép họ thấy các công ty công nghệ trẻ xuất hiện ngay trước mũi họ như thế nào, đưa ra các giải pháp thay thế phù hợp với một khách hàng cụ thể và không phải trả quá nhiều tiền cho thương hiệu.

Nhược điểm của hệ thống BMS cũ 

Nhược điểm chính của giải pháp BMS lỗi thời hiện tại đối với chúng tôi là hoạt động chậm. Việc điều tra một số sự kiện trong đó nhân viên trực không phản ứng đủ nhanh khiến chúng tôi hiểu rằng đôi khi có sự chậm trễ đáng kể trong việc hiển thị các sự kiện trong BMS. Đồng thời, hệ thống không bị quá tải hoặc bị lỗi, chỉ là các phiên bản của các thành phần của nó (ví dụ: JAVA) đã lỗi thời và không thể hoạt động chính xác với các phiên bản hệ điều hành mới nếu không có bản cập nhật. Chỉ có thể cập nhật chúng cùng với hệ thống BMS và nhà cung cấp không cung cấp tính năng tự động liên tục của các phiên bản, nghĩa là đối với chúng tôi, quy trình này gần như tốn nhiều công sức như việc chuyển sang hệ thống mới và giải pháp mới được giữ lại một số nhược điểm của cái cũ.  

Hãy thêm một vài “điều nhỏ nhặt” khó chịu ở đây:

  1. Thanh toán kết nối thiết bị mới theo nguyên tắc “một địa chỉ IP – một giấy phép trả phí”; 
  2. Không thể cập nhật phần mềm mà không mua gói hỗ trợ (điều này có nghĩa là cập nhật các thành phần miễn phí và loại bỏ lỗi trong chính chương trình BMS);
  3. Chi phí hỗ trợ cao; 
  4. Vị trí trên máy chủ “sắt”, có thể bị lỗi và có tài nguyên máy tính hạn chế;
  5. “Dự phòng” bằng cách cài đặt máy chủ phần cứng thứ hai với gói giấy phép trùng lặp. Đồng thời, không có sự đồng bộ hóa cơ sở dữ liệu giữa máy chủ chính và máy chủ dự phòng - đồng nghĩa với việc chuyển cơ sở dữ liệu thủ công và thời gian chuyển sang sao lưu lâu;
  6. Máy khách người dùng “dày”, không thể truy cập từ bên ngoài, không có tiện ích mở rộng cho thiết bị di động và tùy chọn truy cập từ xa;
  7. Giao diện web đơn giản không có card đồ họa và thông báo âm thanh, có thể truy cập từ bên ngoài nhưng thực tế không được nhân viên sử dụng do thiếu thông tin;
  8. Thiếu hình ảnh động trong giao diện - tất cả đồ họa chỉ bao gồm hình ảnh “nền” và các biểu tượng tĩnh. Kết quả là mức độ hiển thị tổng thể thấp;

    Mọi thứ trông giống như thế này:

    Giám sát trong trung tâm dữ liệu: cách chúng tôi thay thế BMS cũ bằng BMS mới. Phần 1

    Giám sát trong trung tâm dữ liệu: cách chúng tôi thay thế BMS cũ bằng BMS mới. Phần 1

  9. Một hạn chế trong việc tạo cảm biến ảo là chỉ có chức năng cộng, trong khi các mô hình cảm biến thực yêu cầu khả năng thực hiện một tập hợp các phép toán để tính toán chính xác phản ánh thực tế hoạt động; 
  10. Không thể lấy dữ liệu theo thời gian thực hoặc từ kho lưu trữ cho bất kỳ mục đích nào (ví dụ: để hiển thị trong tài khoản cá nhân của khách hàng);
  11. Hoàn toàn thiếu tính linh hoạt và khả năng thay đổi mọi thứ trong BMS để phù hợp với các quy trình hiện có của trung tâm dữ liệu. 

Yêu cầu đối với hệ thống BMS mới

Có tính đến những điều trên, các yêu cầu chính của chúng tôi như sau:

  1. Hai máy dự phòng độc lập với nhau có khả năng đồng bộ hóa tự động, chạy trên hai nền tảng đám mây khác nhau ở các trung tâm dữ liệu khác nhau (trong trường hợp của chúng tôi là trung tâm dữ liệu Linxdatacenter St. Petersburg và Moscow);
  2. Bổ sung miễn phí các thiết bị mới;
  3. Cập nhật phần mềm miễn phí và các thành phần của nó (ngoại trừ cải tiến chức năng);
  4. Mã nguồn mở, cho phép chúng tôi hỗ trợ hệ thống một cách độc lập trong trường hợp có vấn đề từ phía nhà phát triển;
  5. Khả năng nhận và sử dụng dữ liệu từ BMS, ví dụ: trên trang web hoặc trong tài khoản cá nhân của bạn;
  6. Truy cập qua trình duyệt WEB mà không cần client dày;
  7. Sử dụng tài khoản nhân viên miền để truy cập BMS;
  8. Sự sẵn có của hoạt ảnh và nhiều mong muốn nhỏ và không nhỏ khác đã được hiện thực hóa thành một thông số kỹ thuật chi tiết.

Rơm cuối cùng

Giám sát trong trung tâm dữ liệu: cách chúng tôi thay thế BMS cũ bằng BMS mới. Phần 1

Vào thời điểm chúng tôi nhận ra rằng trung tâm dữ liệu đã phát triển vượt mức BMS của nó, giải pháp rõ ràng nhất đối với chúng tôi là cập nhật hệ thống hiện có. “Họ không đổi ngựa giữa chừng,” phải không? 

Tuy nhiên, theo quy định, các tập đoàn lớn không đưa ra các sửa đổi tùy chỉnh cho các giải pháp “đánh bóng” hàng chục năm tuổi của họ được bán ở hàng chục quốc gia. Trong khi các công ty trẻ đang thử nghiệm ý tưởng hoặc nguyên mẫu của một sản phẩm trong tương lai với người tiêu dùng tiềm năng và dựa vào phản hồi của người dùng để phát triển sản phẩm, thì các công ty vẫn tiếp tục bán giấy phép cho một sản phẩm từng thực sự tuyệt vời, nhưng than ôi, ngày nay nó đã lỗi thời và không linh hoạt.

Và chúng tôi đã cảm nhận được sự khác biệt trong cách tiếp cận của chính mình. Trong quá trình trao đổi thư từ với nhà sản xuất BMS cũ, chúng tôi nhanh chóng nhận ra rằng việc cập nhật hệ thống hiện có do nhà cung cấp đề xuất thực sự sẽ dẫn đến việc chúng tôi phải mua một hệ thống mới với tính năng truyền cơ sở dữ liệu bán tự động, chi phí cao và những cạm bẫy trong quá trình thực hiện. chuyển nhượng, điều mà ngay cả bản thân nhà sản xuất cũng không thể đoán trước được. Tất nhiên, trong trường hợp này, chi phí hỗ trợ kỹ thuật cho giải pháp cập nhật đã tăng lên và nhu cầu mua giấy phép trong quá trình mở rộng vẫn còn.

Và điều khó chịu nhất là hệ thống mới không thể đáp ứng đầy đủ yêu cầu đặt chỗ của chúng tôi. Hệ thống BMS cập nhật có thể được triển khai như chúng tôi muốn trên nền tảng đám mây, điều này sẽ cho phép chúng tôi loại bỏ phần cứng, nhưng tùy chọn dự phòng không được bao gồm trong giá. Để sao lưu dữ liệu, chúng tôi sẽ phải mua máy chủ ảo BMS thứ hai và một bộ giấy phép bổ sung. Với chi phí của một giấy phép là khoảng 76 USD và số lượng địa chỉ IP là 1000 đơn vị, tổng chi phí bổ sung chỉ dành cho giấy phép cho máy dự phòng lên tới 76 USD. 

Điểm “quả anh đào” trong phiên bản mới của BMS là nhu cầu mua thêm giấy phép “cho tất cả các thiết bị” – ngay cả đối với máy chủ chính. Ở đây cần làm rõ rằng có những thiết bị được kết nối với BMS thông qua các cổng. Cổng có một địa chỉ IP nhưng kiểm soát một số thiết bị (trung bình là 10). Trong BMS cũ, điều này yêu cầu một giấy phép cho mỗi địa chỉ IP cổng, số liệu thống kê trông giống như sau: “1000 địa chỉ IP/giấy phép, 1200 thiết bị”. BMS được cập nhật hoạt động theo một nguyên tắc khác và số liệu thống kê sẽ như sau: “1000 địa chỉ IP, 1200 thiết bị/giấy phép”. Tức là nhà cung cấp ở phiên bản mới đã thay đổi nguyên tắc cấp giấy phép và chúng tôi phải mua thêm khoảng 200 giấy phép. 

Ngân sách “cập nhật” cuối cùng bao gồm bốn điểm: 

  • chi phí của phiên bản đám mây và dịch vụ di chuyển sang nó; 
  • giấy phép bổ sung cho gói hiện có dành cho các thiết bị được kết nối qua cổng;
  • chi phí phiên bản đám mây dự phòng;  
  • một bộ giấy phép cho máy sao lưu. 

Tổng chi phí của dự án là hơn 100 USD! Và đó là chưa kể đến nhu cầu mua giấy phép cho các thiết bị mới trong tương lai.

Do đó, chúng tôi nhận ra rằng sẽ dễ dàng hơn cho chúng tôi - và có lẽ thậm chí còn rẻ hơn - khi đặt hàng một hệ thống được tạo ra từ đầu, có tính đến tất cả các yêu cầu của chúng tôi và mang lại khả năng hiện đại hóa trong tương lai. Nhưng những người muốn phát triển một hệ thống phức tạp như vậy vẫn phải tìm ra, so sánh các đề xuất, lựa chọn và cùng với người vào chung kết đi theo con đường từ thông số kỹ thuật đến triển khai... Hãy đọc sớm về điều này trong phần thứ hai của tài liệu. 

Nguồn: www.habr.com

Thêm một lời nhận xét