Доступний новий випуск Paperless-ngx, веб-додатки для роботи з документами, що перетворює паперові документи на електронні, доступні для повнотекстового пошуку, скачування та зберігання онлайн. Код написаний мовою Python з використанням фреймворку Django та поширюється під ліцензією GPLv3. Для ознайомлення з можливостями системи підготовлено демонстраційний сайт demo.paperless-ngx.com (логін/пароль - demo/demo).
Paperless-ngx є відгалуженням від проекту paperless-ng, який, у свою чергу, відповів від оригінального проекту paperlsess (форки створювалися для продовження розробки після припинення супроводу минулими розробниками). Після завантаження відсканованого документа будь-яким доступним способом (по FTP, через веб-інтерфейс, через Android-додаток, електронною поштою через IMAP), програма здійснює оптичне розпізнавання тексту (OCR), використовуючи движок Tesseract, далі в інтерфейсі доступне тегування (у тому числі автоматичне з використанням машинного навчання), повнотекстовий пошук, а також завантаження версії документа у форматі PDF/A або у форматах офісних пакетів.
В новой версії:
- Скрипти пре/пост обробки використовують змінні оточення замість аргументів командного рядка.
- Мініатюри у веб-інтерфейсі переведені у формат WebP замість PNG.
- Налаштування веб-інтерфейсу зберігаються у базі даних.
- Під час зміни мови документа в інтерфейсі з'являється підказка про необхідність перезавантаження сторінки.
- При виникненні помилки зв'язку з Redis відображається докладніша інформація.
- У веб-інтерфейсі додано можливість перегляду черги документів на обробку.
Джерело: opennet.ru