Fà una biblioteca di casa cù Notion è Python

Sò sempre statu interessatu in quantu megliu distribuisce libri in a mo biblioteca elettronica. In fine, aghju ghjuntu à sta opzione cù u calculu automaticu di u numeru di pagine è altre boni. Pregu tutte e persone interessate sottu cat.

Parte 1. Dropbox

Tutti i mo libri sò in dropbox. Ci sò 4 categurie in quale aghju divisu tuttu: Testu, Riferimentu, Fiction, Non-fiction. Ma ùn aghju micca aghjunghje libri di riferimentu à a tavula.

A maiò parte di i libri sò .epub, u restu sò .pdf. Vale à dì, a suluzione finale deve in qualchì manera copre e duie opzioni.

I mo percorsi per i libri sò qualcosa cusì:

/Книги/Нехудожественное/Новое/Дизайн/Юрий Гордон/Книга про буквы от А до Я.epub 

Se u libru hè fiction, allora a categuria (vale à dì, "Design" in u casu sopra) hè eliminata.

Aghju decisu di ùn disturbà micca cù l'API Dropbox, postu chì aghju a so applicazione chì sincronizza u cartulare. Questu hè, u pianu hè questu: pigliamu i libri da u cartulare, eseguimu ogni libru à traversu un contatore di parolle, è aghjunghje à Notion.

Parte 2. Aghjunghjite una linea

A tavula stessa deve esse simile à questu. ATTENZIONE: hè megliu fà i nomi di colonna in latinu.

Fà una biblioteca di casa cù Notion è Python

Useremu l'API di Notion non ufficiale, perchè l'ufficiale ùn hè ancu statu furnitu.

Fà una biblioteca di casa cù Notion è Python

Andà à Notion, appughjà Ctrl + Shift + J, andate in Applicazione -> Cookies, copia token_v2 è chjamate TOKEN. Allora andemu à a pagina chì avemu bisognu cù u segnu di a biblioteca è copià u ligame. Chjamemu NOTION.

Allora scrivemu u codice per cunnette à Notion.

database = client.get_collection_view(NOTION)
current_rows = database.default_query().execute()

Dopu, scrivemu una funzione per aghjunghje una fila à a tavula.

def add_row(path, file, words_count, pages_count, hours):
    row = database.collection.add_row()
    row.title = file

    tags = path.split("/")

    if len(tags) >= 1:
        row.what = tags[0]

    if len(tags) >= 2:
        row.state = tags[1]

    if len(tags) >= 3:
        if tags[0] == "Художественное":
            row.author = tags[2]

        elif tags[0] == "Нехудожественное":
            row.tags = tags[2]

        elif tags[0] == "Учебники":
            row.tags = tags[2]

    if len(tags) >= 4:
        row.author = tags[3]

    row.hours = hours
    row.pages = pages_count
    row.words = words_count

Ciò chì passa quì. Pigliemu è aghjunghje una nova fila à a tavula in a prima fila. Dopu, spartemu a nostra strada longu "/" è uttene tag. Tags - in termini di "Arte", "Design", quale hè l'autore, è cusì. Allora avemu stabilitu tutti i campi necessarii di a piastra.

Parte 3. Cuntà parolle, ore è altre delizie

Questu hè un compitu più difficiule. Comu ricurdamu, avemu dui formati: epub è pdf. Se tuttu hè chjaru cù l'epub - e parolle sò prubabilmente quì, allora tuttu ùn hè micca cusì chjaru nantu à u pdf: pò esse simplicemente custituitu da l'imaghjini incollati.

Allora a nostra funzione per cuntà e parolle in PDF serà cusì: pigliamu u numeru di pagine è multiplicate da una certa constante (u numeru mediu di parolle per pagina).

Eccu ella:

def get_words_count(pages_number):
    return pages_number * WORDS_PER_PAGE

Questa WORDS_PER_PAGE per una pagina A4 hè di circa 300.

Avà scrivemu una funzione per cuntà e pagine. Avemu aduprà pyPDF2.

def get_pdf_pages_number(path, filename):
    pdf = PdfFileReader(open(os.path.join(path, filename), 'rb'))
    return pdf.getNumPages()

Dopu, scriveremu una cosa per cuntà e pagine in Epub. Avemu aduprà epub_converter. Quì pigliamu u libru, cunvertisce in linii, è cuntemu e parolle per ogni linea.

def get_epub_pages_number(path, filename):
    book = open_book(os.path.join(path, filename))
    lines = convert_epub_to_lines(book)
    words_count = 0

    for line in lines:
        words_count += len(line.split(" "))

    return round(words_count / WORDS_PER_PAGE)

Avà calculemu u tempu. Pigliemu u nostru conte di parolle preferite è u dividemu per a vostra velocità di lettura.

def get_reading_time(words_count):
    return round(((words_count / WORDS_PER_MINUTE) / 60) * 10) / 10

Part 4. Connecting all the parts

Avemu bisognu di passà per tutti i camini pussibuli in u nostru cartulare di libri. Verificate s'ellu ci hè digià un libru in Notion : s'ellu ci hè, ùn ci hè più bisognu di creà una linea.
Allora avemu bisognu di determinà u tipu di schedariu è, sicondu questu, cuntà u numeru di parolle. Aghjunghjite un libru à a fine.

Questu hè u codice chì avemu:

for root, subdirs, files in os.walk(BOOKS_DIR):
    if len(files) > 0 and check_for_excusion(root):
        for file in files:
            array = file.split(".")
            filetype = file.split(".")[len(array) - 1]
            filename = file.replace("." + filetype, "")
            local_root = root.replace(BOOKS_DIR, "")

            print("Dir: {}, file: {}".format(local_root, file))

            if not check_for_existence(filename):
                print("Dir: {}, file: {}".format(local_root, file))

                if filetype == "pdf":
                    count = get_pdf_pages_number(root, file)

                else:
                    count = get_epub_pages_number(root, file)

                words_count = get_words_count(count)
                hours = get_reading_time(words_count)
                print("Pages: {}, Words: {}, Hours: {}".format(count, words_count, hours))
                add_row(local_root, filename, words_count, count, hours)

È a funzione per verificà s'ellu hè statu aghjuntu un libru hè cusì:

def check_for_existence(filename):
    for row in current_rows:
        if row.title in filename:
            return True

        elif filename in row.title:
            return True

    return False

cunchiusioni

Grazie à tutti quelli chì leghje stu articulu. Spergu chì vi aiuta à leghje più :)

Source: www.habr.com

Add a comment