Встановлення розподіленого відмовостійкого сховища об'єктів LeoFS, сумісного з клієнтами, які використовують S3, NFS

Згідно з Opennet: LeoFS - розподілене відмовостійке сховище об'єктів LeoFS, сумісне з клієнтами, що використовують API Amazon S3 і REST-API, а також підтримує режим роботи в ролі сервера NFS. Є оптимізації для зберігання як дрібних, так і дуже великих об'єктів, є вбудований механізм кешування, можлива реплікація сховищ між дата-центрами. Серед цілей проекту відзначається досягнення надійності 99.9999999% за рахунок надлишкового реплікування дублікатів та виключення єдиної точки відмови. Код проекту написано мовою Erlang.

LeoFS складається з трьох компонентів:

  • LeoFS Storage — обслуговує операції додавання, вилучення та видалення об'єктів та метаданих, відповідає за виконання реплікації, відновлення та формування черги запитів клієнтів.
  • LeoFS Gateway — обслуговує HTTP-запити та перенаправляє відповіді клієнтам із використанням REST-API або S3-API, забезпечує кешування найбільш затребуваних даних у пам'яті та на диску.
  • LeoFS Manager - відстежує роботу вузлів LeoFS Gateway та LeoFS Storage, веде моніторинг стану вузлів та перевіряє контрольні суми. Гарантує цілісність даних та високу доступність сховища.

У цьому пості встановимо Leofs за допомогою ansible-playbook, протестуємо S3, NFS.

Якщо ви спробуєте встановити LeoFS використовуючи офіційні playbook-і, то на вас чекають різні помилки: 1,2. У цьому пості напишу, що потрібно зробити, щоб ці помилки уникнути.

Там, де ви будете запускати ansible-playbook, потрібно встановити netcat.

Приклад inventory

Приклад inventory (в репозиторії hosts.sample):

# Please check roles/common/vars/leofs_releases for available versions


# nodename of leo_manager_0 and leo_manager_1 are set at group_vars/all

[leo_storage] [email protected] [email protected] [email protected] [email protected]

[leo_gateway] [email protected] [email protected]


Підготовка серверів

Вимкнення Selinux. Сподіваюся, що спільнота створить політики Selinux для LeoFS.

    - name: Install libselinux as prerequisite for SELinux Ansible module
        name: "{{item}}"
        state: latest
        - libselinux-python
        - libsemanage-python

    - name: Disable SELinux at next reboot
        state: disabled

    - name: Set SELinux in permissive mode until the machine is rebooted
      command: setenforce 0
      ignore_errors: true
      changed_when: false

Встановлення netcat и redhat-lsb-core. netcat потрібен для leofs-adm, redhat-lsb-core необхідний визначення версії ОС тут.

    - name: Install Packages
      yum: name={{ item }} state=present
        - nmap-ncat
        - redhat-lsb-core

Створення користувача leofs і додавання його до групи wheel

    - name: Create user leofs
        name: leofs
        state: present

    - name: Allow 'wheel' group to have passwordless sudo
        dest: /etc/sudoers
        state: present
        regexp: '^%wheel'
        line: '%wheel ALL=(ALL) NOPASSWD: ALL'
        validate: 'visudo -cf %s'

    - name: Add the user 'leofs' to group 'wheel'
        name: leofs
        groups: wheel
        append: yes

Установка Erlang

    - name: Remote erlang- install with yum
      yum: name=https://github.com/rabbitmq/erlang-rpm/releases/download/v20.3.8.23/erlang-

Повну версію виправлених ansible playbook можна знайти тут: https://github.com/patsevanton/leofs_ansible

Встановлення, конфігурування, запуск

Далі виконуємо як написано в https://github.com/leo-project/leofs_ansible без build_leofs.yml

## Install LeoFS
$ ansible-playbook -i hosts install_leofs.yml

## Config LeoFS
$ ansible-playbook -i hosts config_leofs.yml

## Start LeoFS
$ ansible-playbook -i hosts start_leofs.yml

Перевіряємо статус кластера на Primary LeoManager

leofs-adm status

Primary та Secondary можна побачити у логах ansible-playbook

Висновок буде приблизно такий

 [System Confiuration]
 Item                              | Value    
 Basic/Consistency level
                    system version | 1.4.3
                        cluster Id | leofs_1
                             DC Id | dc_1
                    Total replicas | 2
          number of successes of R | 1
          number of successes of W | 1
          number of successes of D | 1
 number of rack-awareness replicas | 0
                         ring size | 2^128
 Multi DC replication settings
 [mdcr] max number of joinable DCs | 2
 [mdcr] total replicas per a DC    | 1
 [mdcr] number of successes of R   | 1
 [mdcr] number of successes of W   | 1
 [mdcr] number of successes of D   | 1
 Manager RING hash
                 current ring-hash | a0314afb
                previous ring-hash | a0314afb

 [State of Node(s)]
 type  |         node         |    state     | rack id |  current ring  |   prev ring    |          updated at         
  S    | [email protected]      | running      |         | a0314afb       | a0314afb       | 2019-12-05 10:33:47 +0000
  S    | [email protected]      | running      |         | a0314afb       | a0314afb       | 2019-12-05 10:33:47 +0000
  S    | [email protected]      | running      |         | a0314afb       | a0314afb       | 2019-12-05 10:33:47 +0000
  S    | [email protected]      | attached     |         |                |                | 2019-12-05 10:33:58 +0000
  G    | [email protected]      | running      |         | a0314afb       | a0314afb       | 2019-12-05 10:33:49 +0000
  G    | [email protected]      | running      |         | a0314afb       | a0314afb       | 2019-12-05 10:33:49 +0000

Створюємо користувача

Створюємо користувача leofs:

leofs-adm create-user leofs leofs

  access-key-id: 9c2615f32e81e6a1caf5
  secret-access-key: 8aaaa35c1ad78a2cbfa1a6cd49ba8aaeb3ba39eb

Список користувачів:

leofs-adm get-users
user_id     | role_id | access_key_id          | created_at                
_test_leofs | 9       | 05236                  | 2019-12-02 06:56:49 +0000
leofs       | 1       | 9c2615f32e81e6a1caf5   | 2019-12-02 10:43:29 +0000

Створюємо Bucket

Зробив bucket

leofs-adm add-bucket leofs 9c2615f32e81e6a1caf5

Список bucket:

 leofs-adm get-buckets
cluster id   | bucket   | owner  | permissions      | created at                
leofs_1      | leofs    | leofs  | Me(full_control) | 2019-12-02 10:44:02 +0000

Конфігурація s3cmd

В полі HTTP Proxy server name вказуємо IP сервера Gateway

s3cmd --configure 

Enter new values or accept defaults in brackets with Enter.
Refer to user manual for detailed description of all options.

Access key and Secret key are your identifiers for Amazon S3. Leave them empty for using the env variables.
Access Key [9c2615f32e81e6a1caf5]: 
Secret Key [8aaaa35c1ad78a2cbfa1a6cd49ba8aaeb3ba39eb]: 
Default Region [US]: 

Use "s3.amazonaws.com" for S3 Endpoint and not modify it to the target Amazon S3.
S3 Endpoint [s3.amazonaws.com]: 

Use "%(bucket)s.s3.amazonaws.com" to the target Amazon S3. "%(bucket)s" and "%(location)s" vars can be used
if the target S3 system supports dns based buckets.
DNS-style bucket+hostname:port template for accessing a bucket [%(bucket)s.s3.amazonaws.com]: leofs

Encryption password is used to protect your files from reading
by unauthorized persons while in transfer to S3
Encryption password: 
Path to GPG program [/usr/bin/gpg]: 

When using secure HTTPS protocol all communication with Amazon S3
servers is protected from 3rd party eavesdropping. This method is
slower than plain HTTP, and can only be proxied with Python 2.7 or newer
Use HTTPS protocol [No]: 

On some networks all internet access must go through a HTTP proxy.
Try setting it here if you can't connect to S3 directly
HTTP Proxy server name []: 
HTTP Proxy server port [8080]: 

New settings:
  Access Key: 9c2615f32e81e6a1caf5
  Secret Key: 8aaaa35c1ad78a2cbfa1a6cd49ba8aaeb3ba39eb
  Default Region: US
  S3 Endpoint: s3.amazonaws.com
  DNS-style bucket+hostname:port template for accessing a bucket: leofs
  Encryption password: 
  Path to GPG program: /usr/bin/gpg
  Use HTTPS protocol: False
  HTTP Proxy server name:
  HTTP Proxy server port: 8080

Test access with supplied credentials? [Y/n] Y
Please wait, attempting to list all buckets...
Success. Your access key and secret key worked fine :-)

Now verifying that encryption works...
Not configured. Never mind.

Save settings? [y/N] y
Configuration saved to '/home/user/.s3cfg'

Якщо у вас з'являється помилка ERROR: S3 error: 403 (AccessDenied): Access Denied:

s3cmd put test.py s3://leofs/
upload: 'test.py' -> 's3://leofs/test.py'  [1 of 1]
 382 of 382   100% in    0s     3.40 kB/s  done
ERROR: S3 error: 403 (AccessDenied): Access Denied

То потрібно в конфізі s3cmd виправити signature_v2 на True. Подробиці в цьому питання.

Якщо signature_v2 буде False, то буде така помилка:

WARNING: Retrying failed request: /?delimiter=%2F (getaddrinfo() argument 2 must be integer or string)
WARNING: Waiting 3 sec...
WARNING: Retrying failed request: /?delimiter=%2F (getaddrinfo() argument 2 must be integer or string)
WARNING: Waiting 6 sec...
ERROR: Test failed: Request failed for: /?delimiter=%2F

Тестування завантаження

Створюємо файл 1ГБ

fallocate -l 1GB 1gb

Завантажуємо його в Leofs

time s3cmd put 1gb s3://leofs/
real    0m19.099s
user    0m7.855s
sys 0m1.620s


leofs-adm du для 1 ноди:

leofs-adm du [email protected]
 active number of objects: 156
  total number of objects: 156
   active size of objects: 602954495
    total size of objects: 602954495
     ratio of active size: 100.0%
    last compaction start: ____-__-__ __:__:__
      last compaction end: ____-__-__ __:__:__

Бачимо, що висновок не дуже інформативний.

Подивимося, де розташований цей файл.
leofs-adm whereis leofs/1gb

leofs-adm whereis leofs/1gb
 del?  |         node         |             ring address             |    size    |   checksum   |  has children  |  total chunks  |     clock      |             when            
       | [email protected]      | 657a9f3a3db822a7f1f5050925b26270     |    976563K |   a4634eea55 | true           |             64 | 598f2aa976a4f  | 2019-12-05 10:48:15 +0000
       | [email protected]      | 657a9f3a3db822a7f1f5050925b26270     |    976563K |   a4634eea55 | true           |             64 | 598f2aa976a4f  | 2019-12-05 10:48:15 +0000

Активуємо NFS

Активуємо NFS на сервері Leo Gateway

На сервері та клієнті встановимо nfs-utils

sudo yum install nfs-utils

Згідно з інструкцією виправимо файл конфігурації /usr/local/leofs/current/leo_gateway/etc/leo_gateway.conf

protocol = nfs

На сервері запустимо rpcbind та leofs-gateway

sudo service rpcbind start
sudo service leofs-gateway restart

На сервері де запущено leo_manager створимо bucket для NFS і згенеруємо ключ для підключення до NFS

leofs-adm add-bucket test 05236
leofs-adm gen-nfs-mnt-key test 05236 ip-адрес-nfs-клиента

Підключення до NFS

sudo mkdir /mnt/leofs
## for Linux - "sudo mount -t nfs -o nolock <host>:/<bucket>/<token> <dir>"
sudo mount -t nfs -o nolock ip-адрес-nfs-сервера-там-где-у-вас-установлен-gateway:/bucket/access_key_id/ключ-полученный-от-gen-nfs-mnt-key /mnt/leofs
sudo mount -t nfs -o nolock /mnt/leofs

Перегляд дискового простору через NFS клієнт

Дисковий простір з урахуванням що кожна нода storage має диск 40ГБ (3 ноди running, 1 нода attached):

df -hP
Filesystem                                                         Size  Used Avail Use% Mounted on   60G  3.6G   57G   6% /mnt/leofs

Установка LeoFS з 6 storage нодами.

Inventory (без Builder):

# Please check roles/common/vars/leofs_releases for available versions

# nodename of leo_manager_0 and leo_manager_1 are set at group_vars/all

[leo_storage] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected]

[leo_gateway] [email protected] [email protected]


Висновок leofs-adm status

 [System Confiuration]
 Item                              | Value    
 Basic/Consistency level
                    system version | 1.4.3
                        cluster Id | leofs_1
                             DC Id | dc_1
                    Total replicas | 2
          number of successes of R | 1
          number of successes of W | 1
          number of successes of D | 1
 number of rack-awareness replicas | 0
                         ring size | 2^128
 Multi DC replication settings
 [mdcr] max number of joinable DCs | 2
 [mdcr] total replicas per a DC    | 1
 [mdcr] number of successes of R   | 1
 [mdcr] number of successes of W   | 1
 [mdcr] number of successes of D   | 1
 Manager RING hash
                 current ring-hash | d8ff465e
                previous ring-hash | d8ff465e

 [State of Node(s)]
 type  |         node         |    state     | rack id |  current ring  |   prev ring    |          updated at         
  S    | [email protected]      | running      |         | d8ff465e       | d8ff465e       | 2019-12-06 05:18:29 +0000
  S    | [email protected]      | running      |         | d8ff465e       | d8ff465e       | 2019-12-06 05:18:29 +0000
  S    | [email protected]      | running      |         | d8ff465e       | d8ff465e       | 2019-12-06 05:18:30 +0000
  S    | [email protected]      | running      |         | d8ff465e       | d8ff465e       | 2019-12-06 05:18:29 +0000
  S    | [email protected]      | running      |         | d8ff465e       | d8ff465e       | 2019-12-06 05:18:29 +0000
  S    | [email protected]      | running      |         | d8ff465e       | d8ff465e       | 2019-12-06 05:18:29 +0000
  G    | [email protected]      | running      |         | d8ff465e       | d8ff465e       | 2019-12-06 05:18:31 +0000
  G    | [email protected]      | running      |         | d8ff465e       | d8ff465e       | 2019-12-06 05:18:31 +0000

Дисковий простір з урахуванням що кожна нода storage має диск 40ГБ (6 нод running):

df -hP
Filesystem                                                         Size  Used Avail Use% Mounted on  120G  3.6G  117G   3% /mnt/leofs

Якщо використовується 5 нод storage

[leo_storage] [email protected] [email protected] [email protected] [email protected] [email protected]

df -hP  100G  3.0G   97G   3% /mnt/leofs


Логи знаходяться у директоріях /usr/local/leofs/current/*/log

