แแแแปแแแแแแแ แถแแแขแถแแแแแแแขแแแธแแแแแแแแแแขแแแแปแแแแแปแแแถแแ แแแ แถแแแแแแ แแ แแแแปแแแแแแถแแแแขแแกแทแ แแแแผแแทแ แแแแแแแแปแแ แแ แแธแแแแ แแแแแแปแแแถแแแแแแแแแแแพแแแแแแถแแฝแแแนแแแถแแแแแถแแแแแแแแแแแแแแแแทแแแ แแแฝแแแแแแแแทแแขแแแแแแแแแแแแแแแ แแแแปแแแฝแแขแแแแ แถแแแขแถแแแแแแแแถแแแขแแแแ แแแแแแแแแถแ
แแแแแแแธ 1. Dropbox
แแแแแ แแถแแแขแแแแแแแแแแปแแแถแแแ แแพแแแแขแแแแแแแถแแแ แปแแ แแถแ 4 แแแแแแแแแแแแแปแแแถแแแแแ แแแขแแแธแแแแแแแแถแ: แแแแแ แแทแแแแถ, แฏแแแถแแแแ, แแแแแทแ, แแทแแแแแแทแแ แแแปแแแแโแแแแปแโแแทแโแแแแแแโแแแแแ โแแแโแแ โแแแแปแโแแถแแถแโแแแ
แแแแแ แแถแแ แแแพแแแบ .epub แแ แแแแแบ .pdf แ แแแแแบแแแแแแแแแถแแ แปแแแแแแแแแแผแแแแแแแแแแแแแแแพแแแแแพแแแถแแแแธแแ
แแแแผแแแแแแแแแปแแแ แแถแแแแแแแ แแถแแแผแ แแถแ
/ะะฝะธะณะธ/ะะตั
ัะดะพะถะตััะฒะตะฝะฝะพะต/ะะพะฒะพะต/ะะธะทะฐะนะฝ/ะฎัะธะน ะะพัะดะพะฝ/ะะฝะธะณะฐ ะฟัะพ ะฑัะบะฒั ะพั ะ ะดะพ ะฏ.epub
แแแแแทแแแพแแแแแ แแแแแถแแฟแแแแแแทแ แแแแแแแแแ (แแแแแบ "แแถแแแ แแถ" แแแแปแแแแแธแแถแแแพ) แแแแผแแแถแแแแ แแแ
แแแแปแแแถแแแแแแแ แ แทแแแแแทแแแแแถแแแถแแฝแ Dropbox API แแ แแแแแแแแแปแแแถแแแแแแแทแแธแแแแแแฝแแแแแแแแแแพแแแแถแแแแแแแแฏแแแถแแ แแแแแบแแถแแแแแถแแแบแแแแ แแพแแแแแแแแ แ แแแแธแแแฏแแแถแ แแแแพแแแถแแแแแแ แแธแแฝแแแแถแแแแแงแแแแแแแถแแแแถแแแ แ แพแแแแแแแแแถแแ แแแแปแแแแแแถแแ
แแแแแแแธ 2. แแแแแแแแแแแถแแ
แแปแแแแฝแแฏแแแฝแแแแแพแแแ แแผแ แแแแ แแแ แทแแแแแปแแแถแแแ แแถแแถแแถแแแแแแพแแแแแปแแแถแแแแแแพแแแแแแแแฝแแแแแถแแถแแถแกแถแแถแแแ
แแพแโแแนแโแแแแพ Notion API แแแแ โแแแแผแโแแถแ แแแแแโแแถโแแแแผแโแแถแโแแทแโแแถแแโแแแแผแโแแถแโแแแแแโแแผแโแแ โแกแพแโแแแ
แ แผแแแ แแถแแ Notion แ แปแ Ctrl + Shift + J แ แผแแแ แแถแแ Application -> Cookies แ แแแแ token_v2 แ แพแแ แ แแถแแถ TOKEN แ แแแแแถแแแแแแพแแแ แแถแแแแแแแแแแแแพแแแแแผแแแถแแแถแแฝแแแนแแแแแแถแแแแแถแแแ แ แพแแ แแแแแแแแ แแพแแ แ แแถแแถ NOTION แ
แแแแแถแแแแแแพแแแแแแแแผแแแพแแแแธแแแแถแแแแ Notion แ
database = client.get_collection_view(NOTION)
current_rows = database.default_query().execute()
แแแแแถแแโแแ แแพแโแแแแแโแแปแแแถแโแแพแแแแธโแแแแแแโแแฝแโแแแโแแ โแแถแแถแแ
def add_row(path, file, words_count, pages_count, hours):
row = database.collection.add_row()
row.title = file
tags = path.split("/")
if len(tags) >= 1:
row.what = tags[0]
if len(tags) >= 2:
row.state = tags[1]
if len(tags) >= 3:
if tags[0] == "ะฅัะดะพะถะตััะฒะตะฝะฝะพะต":
row.author = tags[2]
elif tags[0] == "ะะตั
ัะดะพะถะตััะฒะตะฝะฝะพะต":
row.tags = tags[2]
elif tags[0] == "ะฃัะตะฑะฝะธะบะธ":
row.tags = tags[2]
if len(tags) >= 4:
row.author = tags[3]
row.hours = hours
row.pages = pages_count
row.words = words_count
แแพแแถแแขแแแธแแพแแกแพแแแ แแธแแแแ แแพแแแแ แพแแแแแแแแแฝแแแแแธแแ แแถแแถแแแ แแฝแแแธแแฝแแ แแแแแถแแแแ แแพแแแแแแแแแแผแแแแแแแพแแแถแ โ/โ แ แพแแแแฝแแแถแแแแแถแแ แแแแถแ - แแ แแแแปแแแแแแแแแแแ "แแทแแแแ", "แแถแแแ แแถ", แแแแถแแถแขแแแแแทแแแแแแทแแแผแ แแแแแแ แแพแ แแแแแถแแแแแแพแแแแแแแแถแแ แถแแแถแ แแแถแแแขแแแแแ แถแแ
แแแแแแแธ 3. แแถแแแถแแแแถแแแแแแแแแทแแแถแแแธแแแถแแแแแแแแแแ
แแแแแบแแถแแทแ แแ แแถแแแแแแทแแถแแแถแแ แแผแ แแแแแพแแ แแ แถแแแพแแแถแแแแแแแแแธแแแบ epub แแทแ pdf แ แแแแแทแแแพแขแแแธแแแถแแแถแแ แแแถแแแแถแแแแถแแฝแ epub - แแถแแแแแแแ แแแแถแแ แแธแแแ แแแแขแแแธแแแทแแ แแแถแแแขแแแธ pdf แแแ แแถแขแถแ แแถแแแผแแแถแแแแขแทแแแถแแแ
แแผแ แแแแแแปแแแถแแแแแแแพแแแแแแถแแแแถแแแถแแแแถแแแแแ แแแแปแ PDF แแนแแแพแแแ แแผแ แแแแ แแพแแแแ แแแฝแแแแแแ แ แพแแแปแแแนแแ แแแฝแแแแแแถแแแแถแแแแฝแ (แ แแแฝแแแแแแแแแแถแแแแแแแปแแแฝแแแแแแ)แ
แแ แแธแแแแแถแแ
def get_words_count(pages_number):
return pages_number * WORDS_PER_PAGE
WORDS_PER_PAGE แแแแแแแแถแแแแแแแ A4 แแบแแแแ แแ 300แ
แฅแกแผแโแแพแโแแแแแโแแปแแแถแโแแถแแโแแแแแแ แแพแแแนแแแแแพ
def get_pdf_pages_number(path, filename):
pdf = PdfFileReader(open(os.path.join(path, filename), 'rb'))
return pdf.getNumPages()
แแแแแถแแ แแพแแแนแแแแแแแแฟแแแฝแแแแแแถแแแแถแแแแแแแแแ
แแแแปแ Epub แ แแพแโแแแแพ
def get_epub_pages_number(path, filename):
book = open_book(os.path.join(path, filename))
lines = convert_epub_to_lines(book)
words_count = 0
for line in lines:
words_count += len(line.split(" "))
return round(words_count / WORDS_PER_PAGE)
แฅแกแผแแแพแแแแแถแแแแแแแถแ แแพแแแแ แแแฝแแแถแแแแแแแแพแแ แผแแ แทแแแ แ แพแแแแแ แแแแถแแถแแแแแฟแแขแถแแแแแแขแแแแ
def get_reading_time(words_count):
return round(((words_count / WORDS_PER_MINUTE) / 60) * 10) / 10
แแแแแแแธ 4. แแถแแแแแถแแแแแแแแแถแแแขแแแ
แแพแแแแแผแแแแแแแถแแแแแแผแแแแแขแถแ
แแแแพแแถแแแถแแแขแแแแ
แแแแปแแแแแแแแ
แแแแแแพแแ แแทแแทแแแแแพแแแถแแพแแถแแแแแแ
แแ
แแแแปแ Notion แแฝแ
แ แพแแฌแแ
แ แแแแแทแแแพแแถแ แแพแแแทแแ
แถแแแถแ
แแแแแแพแแแแแแถแแแแแแแแ
แแแแแถแแแแแแพแแแแแผแแแแแแแแแแแแแฏแแแถแแขแถแแแแแแแพแแแแแถแแแ
แแแฝแแแถแแแแ แแแแแแแแแแแ
แแ
แ
แปแแแแแ
แแแ
แแแแแบแแถแแแแแผแแแแแแพแแแแฝแแแถแแ
for root, subdirs, files in os.walk(BOOKS_DIR):
if len(files) > 0 and check_for_excusion(root):
for file in files:
array = file.split(".")
filetype = file.split(".")[len(array) - 1]
filename = file.replace("." + filetype, "")
local_root = root.replace(BOOKS_DIR, "")
print("Dir: {}, file: {}".format(local_root, file))
if not check_for_existence(filename):
print("Dir: {}, file: {}".format(local_root, file))
if filetype == "pdf":
count = get_pdf_pages_number(root, file)
else:
count = get_epub_pages_number(root, file)
words_count = get_words_count(count)
hours = get_reading_time(words_count)
print("Pages: {}, Words: {}, Hours: {}".format(count, words_count, hours))
add_row(local_root, filename, words_count, count, hours)
แ แพแแแปแแแถแแแพแแแแธแแทแแทแแแแแพแแแถแแพแแแแแ แแแแผแแแถแแแแแแแแแพแแแ แแผแ แแแแ
def check_for_existence(filename):
for row in current_rows:
if row.title in filename:
return True
elif filename in row.title:
return True
return False
แแแ แแแแธแแแแแทแแแแถแ
แแผแแขแแแปแแแแแขแแแแแแแแแแแแถแแแแแถแแขแถแแขแแแแแแแแแ แแแแปแแแแแแนแแแถแแถแแฝแแขแแแแขแถแแแแแแแ :)
แแแแแ: www.habr.com