uWSGI 레시피: LibreOffice를 사용하여 문서 변환

문서 변환을 준비하려면 필요한 것 LibreOffice, uwsgi-파이썬, 파일로킷 и 웹밥. 당신은 또한 사용할 수 있습니다 기성품. 하지만 이는 uWSGI 서버를 시작하고 우리가 사용할 uWSGI 서버에 연결하기 위한 것입니다. Nginx에.

Python에서 가장 간단한 uWSGI 애플리케이션은 두 개의 인수 environ 및 start_response를 사용하는 함수 애플리케이션으로 구성됩니다.

import os       # импортируем
import pylokit  # необходимые
import tempfile # нам
import webob    # модули

office = pylokit.Office('/usr/lib/libreoffice/program') # загружаем библиотеку LibreOffice по указанному пути

def application(environ, start_response): # функция для uWSGI
    request = webob.Request(environ) # получаем запрос из окружения
    file = request.POST['file'] # файл для преобразования передаётся через multipart/form-data с именем file
    filename, extension = os.path.splitext(file.filename) # получаем имя и расширение
    with tempfile.NamedTemporaryFile(suffix=extension) as inp, tempfile.NamedTemporaryFile(suffix='.%s' % request.path.split('/')[-1]) as out: # создаём один временный файл с расширением переданного файла и другой временный файл с расширением из окончания запроса (для совместимости с unoconv-api)
        inp.write(file.file.read()) # записываем содержимое переданного файла в первый временный файл
        inp.flush() # (т.к. LibreOfficeKit почему-то работает только с файлами)
        with office.documentLoad(inp.name) as doc: # загружаем переданный файл 
            doc.saveAs(out.name) # экспортируем загруженный файл в другой временный файл (формат берётся из расширения)
            with open(out.name, 'rb') as out2: # открываем другой временный файл
                response = webob.Response(body=out2.read()) # создаём результат из чтения другого временного файла
                return response(environ, start_response) # и возвращаем его

물론 오류 처리를 추가할 수도 있습니다.

테스트 단일 페이지 odt 파일을 pdf로 변환하는 것은 PDF로 변환하는 것보다 약 1,5배 빠릅니다. unoconv-api.

출처 : habr.com

코멘트를 추가