Home %D0%A1%D0%BA%D1%80%D0%B0%D0%BF%D0%B8%D0%BD%D0%B3%2C%D0%B2%D0%B5%D0%B1-%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%2C%D1%81%2C%D0%BF%D0%BE%D0%BC%D0%BE%D1%89%D1%8C%D1%8E%2CPython%2C(pdf)%2C%D0%A4%D0%BB%D0%B8%D0%B1%D1%83%D1%81%D1%82%D0%B0%20 %D0%A1%D0%BA%D1%80%D0%B0%D0%BF%D0%B8%D0%BD%D0%B3%2C%D0%B2%D0%B5%D0%B1-%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%2C%D1%81%2C%D0%BF%D0%BE%D0%BC%D0%BE%D1%89%D1%8C%D1%8E%2CPython%2C(pdf)%2C%D0%A4%D0%BB%D0%B8%D0%B1%D1%83%D1%81%D1%82%D0%B0%20

%d0%a1%d0%ba%d1%80%d0%b0%d0%bf%d0%b8%d0%bd%d0%b3%2c%d0%b2%d0%b5%d0%b1-%d1%81%d1%82%d1%80%d0%b0%d0%bd%d0%b8%d1%86%2c%d1%81%2c%d0%bf%d0%be%d0%bc%d0%be%d1%89%d1%8c%d1%8e%2cpython%2c(pdf)%2c%d0%a4%d0%bb%d0%b8%d0%b1%d1%83%d1%81%d1%82%d0%b0%20 Site

by Eliana

%d0%a1%d0%ba%d1%80%d0%b0%d0%bf%d0%b8%d0%bd%d0%b3%2c%d0%b2%d0%b5%d0%b1-%d1%81%d1%82%d1%80%d0%b0%d0%bd%d0%b8%d1%86%2c%d1%81%2c%d0%bf%d0%be%d0%bc%d0%be%d1%89%d1%8c%d1%8e%2cpython%2c(pdf)%2c%d0%a4%d0%bb%d0%b8%d0%b1%d1%83%d1%81%d1%82%d0%b0%20 Site

Этот пост посвящен тому, как с помощью можно автоматизировать сбор данных (скрапинг) с веб-страниц, используя в качестве примера популярную библиотеку Flibusta, и как сохранить полученную информацию в формате PDF .

Для создания PDF-документа удобно использовать библиотеку fpdf2 . Она легкая и поддерживает Unicode (что важно для кириллицы). Этот пост посвящен тому

Автоматизация сбора книг или аннотаций может быть полезным навыком для создания собственной офлайн-библиотеки или анализа данных. Ниже приведен краткий гайд и пример кода. 🛠 Инструментарий Для работы нам понадобятся: requests — для отправки HTTP-запросов. Этот пост посвящен тому

#Python #WebScraping #Flibusta #Programming #DataExtraction #PDF #Coding Этот пост посвящен тому

Помните, что автоматизированный доступ к ресурсам вроде Flibusta должен быть умеренным. Слишком частые запросы могут привести к блокировке вашего IP. Рекомендуется использовать задержки ( time.sleep ) между запросами.

import requests from bs4 import BeautifulSoup url = "https://flibusta.is" # Пример ссылки response = requests.get(url) soup = BeautifulSoup(response.content, 'html.parser') # Извлекаем название книги title = soup.find('h1', class_='title').text.strip() # Извлекаем описание description = soup.find('div', id='main').find('p').text.strip() Use code with caution. 2. Конвертация в PDF