Даступны новы выпуск Paperless-ngx, вэб-прыкладанні для працы з дакументамі, якое пераўтворыць папяровыя дакументы ў электронныя, даступныя для паўнатэкставага пошуку, запампоўкі і захоўванні анлайн. Код напісаны на мове Python з выкарыстаннем фрэймворка Django і распаўсюджваецца пад ліцэнзіяй GPLv3. Для азнаямлення з магчымасцямі сістэмы падрыхтаваны дэманстрацыйны сайт demo.paperless-ngx.com (лагін/пароль - demo/demo).
Paperless-ngx з'яўляецца адгалінаваннем ад праекту paperless-ng, які, у сваю чаргу, адгарэўся ад арыгінальнага праекту paperlsess (форкі ствараліся для працягу распрацоўкі пасля спынення суправаджэння мінулымі распрацоўнікамі). Пасля загрузкі адсканаванага дакумента любым даступным спосабам (па FTP, праз вэб-інтэрфейс, праз Android-дадатак, па электроннай пошце праз IMAP), праграма ажыццяўляе аптычнае распазнанне тэксту (OCR), выкарыстоўваючы рухавічок Tesseract, далей у інтэрфейсе даступна тэгіраванне (у тым ліку аўтаматычнае з выкарыстаннем машыннага навучання), паўнатэкставы пошук, а таксама загрузка версіі дакумента ў фармаце PDF/A ці ў фарматах офісных пакетаў.
У новай версіі:
- Скрыпты прэ/пост апрацоўкі выкарыстоўваюць зменныя асяроддзі замест аргументаў каманднага радка.
- Мініяцюры ў вэб-інтэрфейсе пераведзены ў фармат WebP замест PNG.
- Настройкі вэб-інтэрфейсу захоўваюцца ў базе дадзеных.
- Пры змене мовы дакумента ў інтэрфейсе з'яўляецца падказка аб неабходнасці перазагрузіць старонку.
- Пры ўзнікненні памылкі сувязі з Redis паказваецца больш падрабязная інфармацыя.
- У вэб-інтэрфейсе дададзена магчымасць прагляду чаргі дакументаў на апрацоўку.
Крыніца: opennet.ru