Поступил заказ на парсинг сайта redpower.ru. По техническомо заданию требовалось не просто спарсить весь сайт, а спарсить только те позиции которые были в прайсе, плюс взять цену из определенной колонки прайса и добавить к ней наценку.
Также необходимо было создать дерево категорий не как на сайте-доноре, а как в прайсе, в котором категории значительно отличались от тех, что были на сайте.
На многих страницах сайта-донора были видео презентации. Необходимо было спарсить эти видео и добавить их в код результирующего файла.
Весь полученный контент требовалось импортировать в CMS на движке OpenCart. После того как проект был готов и на сайт заказчика был импортирован образец парсинга поступил запрос на переделку данного проекта под другую CMS, а именно Cs-Cart. Просто заказчик определялся с движком своего нового сайта и выбрал тот, что понравился больше. За небольшую доплату проект был переделан по импорт на Cs-Cart и результаты парсинга были успешно импортированы на сайт заказчика.
Особенности парсинга данного сайта:
— При парсинге потребовался обход фильтров сайта-донора;
— На сайте-доноре картинки были в очень большом разрешении и импорт их не потянул. Пришлось парсить картинки, на лету их форматировать и заливать на собственный сайт, чтобы потом при импортировании перезалить их на сайт заказчика.
— Картинки ипортировались отдельным файлом с собственной структурой таблицы. Для экономии ресурсов проект был создан таким образом, что во время парсинга паралельно создавалось два файла: для импорта контента и для импорта картинок.
В итоге парсинг был сложен, но интересен, а результат, как обычно, получился безупречен.