ProArena»Видео»Парсинг сайтов. Scrapy, Splash, Selenium, requests, bs4 (2021) PCRec

Парсинг сайтов. Scrapy, Splash, Selenium, requests, bs4 (2021) PCRec

Опубликовал: bubagame, 03-10-2021, 10:28, Видео, 203, 0

Парсинг сайтов. Scrapy, Splash, Selenium, requests, bs4 (2021) PCRec

Сбор данных с сайтов с использованием различных библиотек и фреймворков. Этот курс предназначен для тех, кто хочет научиться автоматизированному сбору информации с различных сайтов, то есть парсингу. Для прохождения курса требуются базовые знания питона. На лекциях будут рассмотрены основные подходы к сбору данных с использованием таких библиотек, как requests, beautifulsoup4 и splash, а также фреймворков Scrapy и Selenium.

В этом курсе рассматриваются основные базовые подходы к сбору данных, а также затрагивается вопрос этичного парсинга. По итогам курса студенты будут иметь базовое представление о том, как парсить различные сайты, используя Python.

Этот курс будет не очень интересен тем, кто уже имеет базовое представление о том, что такое парсинг и как создавать скрипты для автоматизированного сбора данных.

После прохождения курса студенты будут знать:
- Как найти и установить необходимые библиотеки для парсинга данных.
- Что такое этичный парсинг, как не нарушить права и закон при парсинге данных.
- Для чего нужен файл robots.txt.
- Каким образом получать HTML сайта для извлечения необходимой информации.
- Как пользоваться xpath для указания точного расположения элементов на странице.
- Как переходить по страницам на многостраничном сайте.
- Как создавать проект и запускать «пауков» Scrapy.
- Как парсить всю информацию о каждом товаре на сайте.
- Как осуществлять переход на страницу каждого товара.
- Каким образом парсить сайты, использующие jаvascript при загрузке.
- Как авторизовываться на сайте, используя фреймворк Selenium.
- Как парсить сайты с бесконечной прокруткой, имитируя действия пользователя на странице.



Название: Парсинг сайтов. Scrapy, Splash, Selenium, requests, bs4
Год выхода: 2021
Автор: Анна Кузина
Жанр: Видеокурс, программирование, разработка, обучение
Формат: MP4
Видео: AVC | 1280x720 | ~974 Kbps
Аудио: AAC | 128 kb/s | 48 KHz
Язык: Русский
Продолжительность: 02:56:30
Размер: 2.98 Gb

Скачать: Парсинг сайтов. Scrapy, Splash, Selenium, requests, bs4 (2021) PCRec

Похожие публикации
У данной публикации еще нет комментариев. Хотите начать обсуждение?

Информация

Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.
Календарь
«    Апрель 2024    »
ПнВтСрЧтПтСбВс
1234567
891011121314
15161718192021
22232425262728
2930 

PROARENA

ProArena Развлекательнопознавательный ресурс 2007-2021г.