Sao lưu Phần 6: So sánh các công cụ sao lưu

Sao lưu Phần 6: So sánh các công cụ sao lưu
Bài viết này sẽ so sánh các công cụ sao lưu, nhưng trước tiên bạn nên tìm hiểu xem chúng có khả năng khôi phục dữ liệu từ bản sao lưu nhanh chóng và tốt như thế nào.
Để dễ so sánh, chúng tôi sẽ xem xét việc khôi phục từ bản sao lưu đầy đủ, đặc biệt vì tất cả các ứng cử viên đều hỗ trợ chế độ hoạt động này. Để đơn giản, các số đã được tính trung bình (trung bình số học của một số lần chạy). Các kết quả sẽ được tóm tắt trong một bảng, cũng chứa thông tin về các khả năng: sự hiện diện của giao diện web, dễ cài đặt và vận hành, khả năng tự động hóa, sự hiện diện của nhiều tính năng bổ sung khác nhau (ví dụ: kiểm tra tính toàn vẹn dữ liệu) , vân vân. Các biểu đồ sẽ hiển thị tải trên máy chủ nơi dữ liệu sẽ được sử dụng (không phải máy chủ lưu trữ các bản sao lưu).

Phục hồi dữ liệu

rsync và tar sẽ được sử dụng làm điểm tham chiếu vì họ thường dựa vào chúng các tập lệnh đơn giản để tạo bản sao lưu.

Đồng bộ hóa xử lý tập dữ liệu thử nghiệm trong 4 phút 28 giây, hiển thị

một gánh nặng như vậySao lưu Phần 6: So sánh các công cụ sao lưu

Quá trình khôi phục đã gặp phải hạn chế của hệ thống con đĩa của máy chủ lưu trữ dự phòng (biểu đồ răng cưa). Bạn cũng có thể thấy rõ quá trình tải một hạt nhân mà không gặp vấn đề gì (iawait và softirq thấp - tương ứng không có vấn đề gì với đĩa và mạng). Vì hai chương trình còn lại, cụ thể là rdiff-backup và rsnapshot, dựa trên rsync và cũng cung cấp rsync thông thường làm công cụ khôi phục nên chúng sẽ có cùng cấu hình tải và thời gian khôi phục sao lưu.

Tar đã hoàn thành nó nhanh hơn một chút

2 phút 43 giây:Sao lưu Phần 6: So sánh các công cụ sao lưu

Tổng tải hệ thống trung bình cao hơn 20% do phần mềm tăng - chi phí chung trong quá trình vận hành hệ thống con mạng tăng lên.

Nếu kho lưu trữ được nén thêm, thời gian khôi phục sẽ tăng lên 3 phút 19 giây.
với tải như vậy trên máy chủ chính (giải nén ở bên cạnh máy chủ chính):Sao lưu Phần 6: So sánh các công cụ sao lưu

Quá trình giải nén chiếm cả hai lõi xử lý vì có hai tiến trình đang chạy. Nói chung, đây là kết quả mong đợi. Ngoài ra, thu được kết quả tương đương (3 phút 20 giây) khi chạy gzip ở phía máy chủ có bản sao lưu; cấu hình tải trên máy chủ chính rất giống với chạy tar mà không có máy nén gzip (xem biểu đồ trước).

В sao lưu dự phòng bạn có thể đồng bộ hóa bản sao lưu cuối cùng mà bạn đã thực hiện bằng rsync thông thường (kết quả sẽ tương tự), nhưng các bản sao lưu cũ hơn vẫn cần được khôi phục bằng chương trình rdiff-backup, quá trình khôi phục hoàn tất sau 17 phút 17 giây, hiển thị

tải này:Sao lưu Phần 6: So sánh các công cụ sao lưu

Có lẽ điều này có chủ ý, ít nhất là để hạn chế tốc độ của tác giả đưa ra một giải pháp như vậy. Quá trình khôi phục bản sao lưu chỉ mất ít hơn một nửa lõi một chút, với hiệu suất tương đương (tức là chậm hơn 2-5 lần) qua đĩa và mạng bằng rsync.

ảnh chụp nhanh Để khôi phục, nó gợi ý sử dụng rsync thông thường, do đó kết quả của nó sẽ tương tự. Nói chung, mọi chuyện diễn ra như thế này.

Ợ hơi Tôi đã hoàn thành nhiệm vụ khôi phục bản sao lưu trong 7 phút 2 giây với
với tải này:Sao lưu Phần 6: So sánh các công cụ sao lưu

Nó hoạt động khá nhanh và ít nhất là thuận tiện hơn nhiều so với rsync thuần túy: không cần nhớ bất kỳ cờ nào, giao diện cli đơn giản và trực quan, hỗ trợ tích hợp cho nhiều bản sao - mặc dù chậm hơn hai lần. Nếu cần khôi phục dữ liệu từ bản sao lưu gần đây nhất mà bạn đã tạo, bạn có thể sử dụng rsync với một số lưu ý.

Chương trình cho thấy tốc độ và tải gần như nhau sao lưu máy tính khi bật chế độ truyền rsync, hãy triển khai bản sao lưu cho

7 phút 42 giây:Sao lưu Phần 6: So sánh các công cụ sao lưu

Nhưng ở chế độ truyền dữ liệu, BackupPC xử lý tar chậm hơn: trong 12 phút 15 giây, tải của bộ xử lý thường thấp hơn

một lần rưỡi:Sao lưu Phần 6: So sánh các công cụ sao lưu

Nhị tâm không mã hóa cho kết quả tốt hơn một chút, khôi phục bản sao lưu trong 10 phút 58 giây. Nếu bạn kích hoạt mã hóa bằng gpg, thời gian khôi phục sẽ tăng lên 15 phút 3 giây. Ngoài ra, khi tạo kho lưu trữ để lưu trữ các bản sao, bạn có thể chỉ định kích thước lưu trữ sẽ được sử dụng khi phân tách luồng dữ liệu đến. Nhìn chung, trên các ổ cứng thông thường, cũng do chế độ hoạt động đơn luồng nên không có nhiều khác biệt. Nó có thể xuất hiện ở các kích thước khối khác nhau khi sử dụng bộ lưu trữ kết hợp. Tải trên máy chủ chính trong quá trình khôi phục như sau:

không mã hóaSao lưu Phần 6: So sánh các công cụ sao lưu

với mã hóaSao lưu Phần 6: So sánh các công cụ sao lưu

Bản sao cho thấy tốc độ phục hồi tương đương, hoàn thành trong 13 phút 45 giây. Mất khoảng 5 phút nữa để kiểm tra tính chính xác của dữ liệu đã khôi phục (tổng cộng khoảng 19 phút). Tải trọng là

Kha cao:Sao lưu Phần 6: So sánh các công cụ sao lưu

Khi mã hóa aes được kích hoạt nội bộ, thời gian khôi phục là 21 phút 40 giây, với mức sử dụng CPU ở mức tối đa (cả hai lõi!) trong quá trình khôi phục; Khi kiểm tra dữ liệu, chỉ có một luồng hoạt động, chiếm một lõi xử lý. Việc kiểm tra dữ liệu sau khi khôi phục cũng mất 5 phút tương tự (tổng cộng gần 27 phút).

Kết quảSao lưu Phần 6: So sánh các công cụ sao lưu

duplicati nhanh hơn một chút trong quá trình khôi phục khi sử dụng chương trình gpg bên ngoài để mã hóa, nhưng nhìn chung, sự khác biệt so với chế độ trước đó là rất ít. Thời gian thực hiện là 16 phút 30 giây, xác minh dữ liệu trong 6 phút. Tải trọng là

như là:Sao lưu Phần 6: So sánh các công cụ sao lưu

AMANDA, sử dụng tar, hoàn thành trong 2 phút 49 giây, về nguyên tắc, rất gần với tar thông thường. Tải vào hệ thống về nguyên tắc

giống nhau:Sao lưu Phần 6: So sánh các công cụ sao lưu

Khi khôi phục bản sao lưu bằng cách sử dụng sao lưu đây là kết quả đạt được:

mã hóa, nén lzmaSao lưu Phần 6: So sánh các công cụ sao lưu

Thời gian chạy 11 phút 8 giây

Mã hóa AES, nén lzmaSao lưu Phần 6: So sánh các công cụ sao lưu

Thời gian làm việc 14 phút

Mã hóa AES, nén lzoSao lưu Phần 6: So sánh các công cụ sao lưu

Thời gian chạy 6 phút 19 giây

Nhìn chung, không tệ. Tất cả phụ thuộc vào tốc độ của bộ xử lý trên máy chủ dự phòng, điều này có thể thấy rõ qua thời gian chạy của chương trình với các máy nén khác nhau. Về phía máy chủ dự phòng, một tar thông thường đã được khởi chạy nên nếu so sánh với nó thì quá trình khôi phục chậm hơn 3 lần. Có thể đáng để kiểm tra hoạt động ở chế độ đa luồng, có nhiều hơn hai luồng.

BorgSao lưu ở chế độ không được mã hóa, nó chậm hơn tar một chút, trong 2 phút 45 giây, tuy nhiên, không giống như tar, có thể sao chép kho lưu trữ. Tải trọng hóa ra là

tiếp theo:Sao lưu Phần 6: So sánh các công cụ sao lưu

Nếu bạn bật mã hóa dựa trên blake, tốc độ khôi phục bản sao lưu sẽ chậm hơn một chút. Thời gian khôi phục ở chế độ này là 3 phút 19 giây và hết tải

như thế này:Sao lưu Phần 6: So sánh các công cụ sao lưu

Mã hóa AES chậm hơn một chút, thời gian khôi phục là 3 phút 23 giây, đặc biệt là tải

Không thay đổi:Sao lưu Phần 6: So sánh các công cụ sao lưu

Vì Borg có thể hoạt động ở chế độ đa luồng, tải của bộ xử lý là tối đa và khi các chức năng bổ sung được kích hoạt, thời gian hoạt động sẽ tăng lên. Rõ ràng, rất đáng để khám phá đa luồng theo cách tương tự như zbackup.

nghỉ ngơi Đối phó với quá trình phục hồi chậm hơn một chút, thời gian phẫu thuật là 4 phút 28 giây. Tải trọng trông giống như

như sau:Sao lưu Phần 6: So sánh các công cụ sao lưu

Rõ ràng quá trình khôi phục hoạt động trong một số luồng, nhưng hiệu quả không cao bằng BorgBackup, nhưng có thể so sánh về thời gian với rsync thông thường.

Với Sao lưu dự phòng Có thể khôi phục dữ liệu trong 8 phút 19 giây, tải là

như là:Sao lưu Phần 6: So sánh các công cụ sao lưu

Tải trọng vẫn không cao lắm, thậm chí còn thấp hơn cả nhựa đường. Ở một số nơi có hiện tượng nổ, nhưng không quá tải của một lõi.

Lựa chọn và căn cứ các tiêu chí để so sánh

Như đã nêu ở một trong những bài viết trước, hệ thống sao lưu phải đáp ứng các tiêu chí sau:

  • Dễ sử dụng
  • linh hoạt
  • Ổn định
  • Tốc độ

Điều đáng xem xét chi tiết hơn từng điểm một cách riêng biệt.

Dê hoạt động

Tốt nhất là khi có một nút “Làm tốt mọi thứ”, nhưng nếu quay lại các chương trình thực, tiện lợi nhất sẽ là một nguyên tắc hoạt động tiêu chuẩn và quen thuộc nào đó.
Hầu hết người dùng rất có thể sẽ tốt hơn nếu họ không phải nhớ một loạt phím cho cli, định cấu hình một loạt các tùy chọn khác nhau, thường bị che khuất qua web hoặc tui hoặc thiết lập thông báo về hoạt động không thành công. Điều này cũng bao gồm khả năng dễ dàng “lắp” giải pháp sao lưu vào cơ sở hạ tầng hiện có, cũng như tự động hóa quá trình sao lưu. Ngoài ra còn có khả năng cài đặt bằng trình quản lý gói hoặc bằng một hoặc hai lệnh như “tải xuống và giải nén”. curl ссылка | sudo bash - một phương pháp phức tạp, vì bạn cần kiểm tra những gì đến qua liên kết.

Ví dụ, trong số các ứng cử viên được xem xét, một giải pháp đơn giản là ợ hơi, sao lưu dự phòng và nghỉ ngơi, có các phím ghi nhớ cho các chế độ vận hành khác nhau. Phức tạp hơn một chút là borg và sự trùng lặp. Khó khăn nhất là AMANDA. Phần còn lại ở đâu đó ở giữa về mức độ dễ sử dụng. Trong mọi trường hợp, nếu bạn cần hơn 30 giây để đọc hướng dẫn sử dụng hoặc bạn cần truy cập Google hoặc một công cụ tìm kiếm khác và cũng cuộn qua một trang trợ giúp dài, thì việc đưa ra quyết định là khó khăn, bằng cách này hay cách khác.

Một số ứng viên được xem xét có thể tự động gửi tin nhắn qua e-mailjabber, trong khi những ứng viên khác dựa vào các cảnh báo được định cấu hình trong hệ thống. Hơn nữa, hầu hết các giải pháp phức tạp thường không có cài đặt cảnh báo hoàn toàn rõ ràng. Trong mọi trường hợp, nếu chương trình sao lưu tạo ra mã trả về khác 0, mã này sẽ được dịch vụ hệ thống hiểu chính xác cho các tác vụ định kỳ (một thông báo sẽ được gửi đến quản trị viên hệ thống hoặc trực tiếp để giám sát) - tình hình rất đơn giản. Nhưng nếu hệ thống sao lưu không chạy trên máy chủ dự phòng không thể được cấu hình thì cách rõ ràng nhất để nói về vấn đề là độ phức tạp đã quá mức. Trong mọi trường hợp, việc chỉ đưa ra cảnh báo và các thông báo khác cho giao diện web hoặc nhật ký là một cách làm không tốt vì hầu hết chúng thường bị bỏ qua.

Đối với tự động hóa, chẳng hạn, một chương trình đơn giản có thể đọc các biến môi trường đặt chế độ hoạt động của nó hoặc nó có một cli được phát triển có thể sao chép hoàn toàn hành vi khi làm việc thông qua giao diện web. Điều này cũng bao gồm khả năng hoạt động liên tục, sự sẵn có của các cơ hội mở rộng, v.v.

linh hoạt

Lặp lại một phần tiểu mục trước đó về tự động hóa, việc “khớp” quy trình sao lưu vào cơ sở hạ tầng hiện có không phải là một vấn đề cụ thể.
Điều đáng chú ý là việc sử dụng các cổng không chuẩn (tốt, ngoại trừ giao diện web) cho công việc, thực hiện mã hóa theo cách không chuẩn, trao đổi dữ liệu bằng giao thức không chuẩn là những dấu hiệu của sự không chuẩn. -giải pháp phổ quát. Phần lớn, tất cả các ứng viên đều có chúng theo cách này hay cách khác vì lý do rõ ràng: sự đơn giản và tính linh hoạt thường không đi đôi với nhau. Như một ngoại lệ - ợ, có những người khác.

Như một dấu hiệu - khả năng hoạt động bằng ssh thông thường.

Tốc độ làm việc

Điểm gây tranh cãi và gây tranh cãi nhất. Một mặt, chúng tôi đã khởi động quy trình, nó hoạt động nhanh nhất có thể và không can thiệp vào các nhiệm vụ chính. Mặt khác, có sự gia tăng lưu lượng truy cập và tải bộ xử lý trong thời gian sao lưu. Cũng cần lưu ý rằng các chương trình tạo bản sao nhanh nhất thường kém nhất về các chức năng quan trọng đối với người dùng. Một lần nữa: nếu để có được một tệp văn bản không may có kích thước vài chục byte kèm theo mật khẩu và do đó, toàn bộ chi phí dịch vụ (vâng, vâng, tôi hiểu rằng quy trình sao lưu thường không đáng trách ở đây), và bạn cần đọc lại tuần tự tất cả các tệp trong kho lưu trữ hoặc mở rộng toàn bộ kho lưu trữ - hệ thống sao lưu không bao giờ nhanh. Một điểm khác thường trở thành trở ngại là tốc độ triển khai bản sao lưu từ kho lưu trữ. Ở đây có một lợi thế rõ ràng dành cho những người có thể chỉ cần sao chép hoặc di chuyển tệp đến vị trí mong muốn mà không cần thao tác nhiều (ví dụ: rsync), nhưng hầu hết vấn đề phải được giải quyết theo cách có tổ chức, theo kinh nghiệm: bằng cách đo thời gian khôi phục sao lưu và thông báo công khai cho người dùng về điều này.

Ổn định

Cần hiểu như thế này: một mặt phải có khả năng triển khai lại bản sao lưu bằng mọi cách, mặt khác nó phải có khả năng chống lại nhiều vấn đề khác nhau: gián đoạn mạng, lỗi ổ đĩa, xóa một phần của kho.

So sánh các công cụ sao lưu

Sao chép thời gian tạo
Sao chép thời gian phục hồi
Dễ dàng cài đặt
thiết lập dễ dàng
Sử dụng đơn giản
Tự động hóa đơn giản
Bạn có cần một máy chủ khách hàng?
Kiểm tra tính toàn vẹn của kho lưu trữ
Bản sao khác biệt
Làm việc qua đường ống
linh hoạt
Sự độc lập
Tính minh bạch của kho lưu trữ
Mã hóa
Nén
Chống trùng lặp
giao diện web
Lấp đầy đám mây
Hỗ trợ Windows
Điểm số

Đồng bộ hóa
4m15s
4m28s
vâng
không
không
không
vâng
không
không
vâng
không
vâng
vâng
không
không
không
không
không
vâng
6

Tar
tinh khiết
3m12s
2m43s
vâng
không
không
không
không
không
vâng
vâng
không
vâng
không
không
không
không
không
không
vâng
8,5

gzip
9m37s
3m19s
vâng

Sao lưu Rdiff
16m26s
17m17s
vâng
vâng
vâng
vâng
vâng
không
vâng
không
vâng
không
vâng
không
vâng
vâng
vâng
không
vâng
11

ảnh chụp nhanh
4m19s
4m28s
vâng
vâng
vâng
vâng
không
không
vâng
không
vâng
không
vâng
không
không
vâng
vâng
không
vâng
12,5

Ợ hơi
11m9s
7m2s
vâng
không
vâng
vâng
vâng
vâng
vâng
không
vâng
vâng
không
không
vâng
không
vâng
không
vâng
10,5

Nhị tâm
không mã hóa
16m48s
10m58s
vâng
vâng
không
vâng
không
vâng
vâng
không
không
vâng
không
vâng
vâng
không
vâng
không
vâng
11

gpg
17m27s
15m3s

Bản sao
không mã hóa
20m28s
13m45s
không
vâng
không
không
không
vâng
vâng
không
không
vâng
không
vâng
vâng
vâng
vâng
vâng
vâng
11

aes
29m41s
21m40s

gpg
26m19s
16m30s

sao lưu
không mã hóa
40m3s
11m8s
vâng
vâng
không
không
không
vâng
vâng
vâng
không
vâng
không
vâng
vâng
vâng
không
không
không
10

aes
42m0s
14m1s

aes+lzo
18m9s
6m19s

BorgSao lưu
không mã hóa
4m7s
2m45s
vâng
vâng
vâng
vâng
vâng
vâng
vâng
vâng
vâng
vâng
không
vâng
vâng
vâng
vâng
không
vâng
16

aes
4m58s
3m23s

Blake2
4m39s
3m19s

nghỉ ngơi
5m38s
4m28s
vâng
vâng
vâng
vâng
không
vâng
vâng
vâng
vâng
vâng
không
vâng
không
vâng
không
vâng
vâng
15,5

Sao lưu dự phòng
8m21s
8m19s
vâng
vâng
vâng
không
vâng
không
vâng
không
vâng
vâng
không
vâng
vâng
vâng
vâng
không
vâng
12

Amanda
9m3s
2m49s
vâng
không
không
vâng
vâng
vâng
vâng
không
vâng
vâng
vâng
vâng
vâng
không
vâng
vâng
vâng
13

sao lưu máy tính
rsync
12m22s
7m42s
vâng
không
vâng
vâng
vâng
vâng
vâng
không
vâng
không
không
vâng
vâng
không
vâng
không
vâng
10,5

tar
12m34s
12m15s

Chú giải bảng:

  • Màu xanh lá cây, thời gian hoạt động dưới 1 phút hoặc trả lời “Có” (trừ cột “Cần máy chủ khách?”), XNUMX điểm
  • Màu vàng, thời gian hoạt động từ 0.5 đến XNUMX phút, XNUMX điểm
  • Màu đỏ, thời gian làm việc hơn mười phút hoặc câu trả lời là “Không” (ngoại trừ cột “Bạn có cần máy chủ khách không?”), 0 điểm

Theo bảng trên, công cụ sao lưu đơn giản, nhanh nhất, đồng thời tiện lợi và mạnh mẽ là BorgBackup. Restic chiếm vị trí thứ hai, những ứng cử viên còn lại được xem xét được xếp xấp xỉ bằng nhau với cách biệt một hoặc hai điểm ở cuối.

Tôi cảm ơn tất cả những người đã đọc đến cuối bộ truyện, mời các bạn thảo luận về các phương án và đưa ra các phương án của riêng mình, nếu có. Khi cuộc thảo luận tiến triển, bảng có thể được mở rộng.

Kết quả của loạt bài này sẽ là bài viết cuối cùng, trong đó sẽ nỗ lực phát triển một công cụ sao lưu lý tưởng, nhanh chóng và dễ quản lý, cho phép bạn triển khai bản sao trở lại trong thời gian ngắn nhất, đồng thời thuận tiện và dễ dàng để cấu hình và bảo trì.

Thông báo

Sao lưu, phần 1: Tại sao cần sao lưu, tổng quan về các phương pháp, công nghệ
Sao lưu Phần 2: Xem xét và thử nghiệm các công cụ sao lưu dựa trên rsync
Backup Phần 3: Rà soát, kiểm tra tính trùng lặp, trùng lặp
Backup Part 4: Review và test zbackup, restic, borgbackup
Backup Phần 5: Test bacula và veeam backup cho linux
Sao lưu Phần 6: So sánh các công cụ sao lưu
Sao lưu Phần 7: Kết luận

Nguồn: www.habr.com

Thêm một lời nhận xét