Scrapy SgmlLinkExtractor и атрибут span

Мне нужно сопоставить атрибут с некоторыми строками. Я попытался добавить атрибут span в sgmllinkextractor, но он, похоже, игнорирует его, поскольку в нем нет ссылки.

есть ли возможность использовать функцию обратного вызова, которая будет вызываться, когда ссылка не может быть извлечена через linkExtractor?

Я хочу сопоставить страницу с некоторой строкой тогда и только тогда, когда не было совпадения с linkExtractor.

Спасибо


person DjangoPy    schedule 21.07.2012    source источник
comment
попробуйте создать подкласс BaseSpider вместо использования CrawlSpider   -  person warvariuc    schedule 21.07.2012
comment
Чтобы отметить вопрос как решенный - примите ответ.   -  person warvariuc    schedule 21.07.2012


Ответы (1)


Попробуйте создать подкласс BaseSpider вместо использования CrawlSpider.

person warvariuc    schedule 21.07.2012