Парсинг kinopoisk.ru
Требовалось реализовать скрипт парсера крупного российского кинопртала kinopoisk.ru
Скрипт парсинга реализован на php/curl/mysql. Многопоточность была реализована через запуск нескольких экземпляров скрипта и разрулирования очереди через mysql — не самое удачное решение, но это был первый крупный проект по парсингу, тогда еще не было опыта с curl-multi.
Процесс парсинга происходил на стороне клиента, поэтому сколько вытянуто данных таким образом не известно.
Парсились такие данные как полная информация по фильму, рейтинги, жанры, люди принимавшие участие в создание фильма и их роль, постеры и другие картинки, саундтреки.
С учетом последней попытки смены дизайна портала, парсинг кинопоиска будет еще долго востребован.