Dostępna jest nowa wersja Paperless-ngx, internetowej aplikacji do zarządzania dokumentami, która konwertuje dokumenty papierowe na dokumenty elektroniczne, które można wyszukiwać, pobierać i przechowywać online w pełnym tekście. Kod napisany jest w języku Python z wykorzystaniem frameworka Django i rozpowszechniany jest na licencji GPLv3. Aby zapoznać się z możliwościami systemu, przygotowano stronę demonstracyjną demo.paperless-ngx.com (login/hasło - demo/demo).
Paperless-ngx jest rozwidleniem projektu Paperless-ng, który z kolei rozwidlił się z oryginalnego projektu Paperless (forki zostały stworzone, aby kontynuować rozwój po tym, jak poprzedni programiści przestali go utrzymywać). Po przesłaniu zeskanowanego dokumentu w dowolny dostępny sposób (przez FTP, przez interfejs www, poprzez aplikację na Androida, poprzez e-mail poprzez IMAP), program dokonuje optycznego rozpoznawania tekstu (OCR) z wykorzystaniem silnika Tesseract, wówczas w interfejsie dostępne jest tagowanie (w tym automatyczne z wykorzystaniem uczenia maszynowego), wyszukiwanie pełnotekstowe, a także pobranie wersji dokumentu w formacie PDF/A lub w formatach pakietu biurowego.
W nowej wersji:
- Skrypty przetwarzania wstępnego/końcowego używają zmiennych środowiskowych zamiast argumentów wiersza poleceń.
- Miniatury w interfejsie internetowym zostały przekonwertowane do formatu WebP zamiast PNG.
- Ustawienia interfejsu WWW zapisywane są w bazie danych.
- Gdy zmienisz język dokumentu, w interfejsie pojawi się podpowiedź o konieczności ponownego załadowania strony.
- Jeśli wystąpi błąd komunikacji z Redis, zostaną wyświetlone bardziej szczegółowe informacje.
- W interfejsie WWW dodano możliwość podglądu kolejki dokumentów do przetworzenia.
Źródło: opennet.ru