%d0%a1%d0%ba%d1%80%d0%b0%d0%bf%d0%b8%d0%bd%d0%b3%2c%d0%b2%d0%b5%d0%b1-%d1%81%d1%82%d1%80%d0%b0%d0%bd%d0%b8%d1%86%2c%d1%81%2c%d0%bf%d0%be%d0%bc%d0%be%d1%89%d1%8c%d1%8e%2cpython%2c(pdf)%2c%d0%a4%d0%bb%d0%b8%d0%b1%d1%83%d1%81%d1%82%d0%b0%20 Site
Этот пост посвящен тому, как с помощью можно автоматизировать сбор данных (скрапинг) с веб-страниц, используя в качестве примера популярную библиотеку Flibusta, и как сохранить полученную информацию в формате PDF .
Для создания PDF-документа удобно использовать библиотеку fpdf2 . Она легкая и поддерживает Unicode (что важно для кириллицы). Этот пост посвящен тому
Автоматизация сбора книг или аннотаций может быть полезным навыком для создания собственной офлайн-библиотеки или анализа данных. Ниже приведен краткий гайд и пример кода. 🛠 Инструментарий Для работы нам понадобятся: requests — для отправки HTTP-запросов. Этот пост посвящен тому
#Python #WebScraping #Flibusta #Programming #DataExtraction #PDF #Coding Этот пост посвящен тому
Помните, что автоматизированный доступ к ресурсам вроде Flibusta должен быть умеренным. Слишком частые запросы могут привести к блокировке вашего IP. Рекомендуется использовать задержки ( time.sleep ) между запросами.
import requests from bs4 import BeautifulSoup url = "https://flibusta.is" # Пример ссылки response = requests.get(url) soup = BeautifulSoup(response.content, 'html.parser') # Извлекаем название книги title = soup.find('h1', class_='title').text.strip() # Извлекаем описание description = soup.find('div', id='main').find('p').text.strip() Use code with caution. 2. Конвертация в PDF
