Вообще похвально, когда клиент точно знает чего хочет, когда заказывает парсинг сайта. И вот он присылает мне ТЗ по парсингу на листике А4, и я ему отвечаю: «Да, все супер, сделаю!» А про себя думаю: йомоё, как это все сделать-то? Но глаза боятся, а руки делают. На самом деле так намного легче работать, когда клиент ставит конкретную задачу и подробно расписывает результат, который желает получить. И вот, после мозгового штурма, начинает рождаться проект парсинга, который выдает требуемый результат. В процессе работы еще и сайт-донор часто подкидывает задачки, которые с первого взгляда выглядят совсем не решаемыми. И приходится садиться за мануалы и придумывать как это все заставить работать. Конечно, благодаря опыту, накопившемуся за 2 года работы, уже знаешь где примерно копать, но парсинг по прежнему остается весьма творческим процессом.
Парсинг сайта domclick.ru как раз запомнился детальностью постановки задачи и как невозможное стало возможным. Началось с того, что сайт оказался сильно заскриптован и пришлось придумать как с него вообще хоть что-то спарсить. Потом, как часто бывает на сайтах-агрегаторах, у domclick.ru оказался весьма трудно читаемых код. Плюс еще клиент решил загрузить меня по полной и заказал аж 19 полей (колонок) с информацией, с пересчетом цен по формуле, со сбором картинок в папки, переименнованные по значению артикула. Но результат парсинга сначала порадовал меня, потом сильно порадовал клиента. Результат парсинга соответствовал ТЗ с точностью до запятой. Очень жду таких же продуманных заданий на парсинг.