Скриншот экрана или сканирование выпадающих полей со всеми перестановками с другого сайта

Сначала мне нужно спросить, в чем разница между поисковым роботом и очисткой экрана. во-вторых, я хочу просканировать или просмотреть раскрывающиеся поля очистить с различными перестановками, чтобы я мог получить эти данные в своей собственной базе данных. заполняется, когда я выбираю его подкатегорию, затем заполняется связанная с ней подкатегория и т. д. с различными комбинациями. Все, что я хочу, это чтобы категории, которые поставляются с различными хранилищами перестановок, хранились в моей базе данных. Я буду использовать С#.net

Любая помощь будет принята с благодарностью.

Спасибо. Вакар Икбал.


person waqari    schedule 07.01.2011    source источник


Ответы (1)


Сканирование — сбор информации о самих веб-страницах и определение их структуры и ценности.

Скриншот — сбор содержимого веб-страницы и сохранение/использование этого содержимого.

Все это можно выполнить с помощью элемента управления .NET WebBrowser и его внутренние функции (о которых вы бы собирали информацию из его HtmlElement)

person Kyle Rosendo    schedule 07.01.2011
comment
нет, я думаю, что для этого понадобится сканер, потому что мне нужно получить данные в раскрывающемся списке с другого сайта. Любая идея по работе с сканером для получения элементов раскрывающегося списка. - person waqari; 07.01.2011
comment
@user - сканер этого не делает - он не получит информацию из раскрывающегося списка. Это то, что делает парсер контента. Однако вы можете создать функцию сканирования, чтобы перейти на другой сайт. Опять же, все возможное в пределах WebBrowser. - person Kyle Rosendo; 07.01.2011
comment
спасибо за ваш ответ .. хммм, так что мне не нужно писать сканер и скребок .. у вас есть какой-нибудь пример, связанный с моим сценарием ?? - person waqari; 07.01.2011
comment
@user - Обновите свой вопрос, указав немного больше о том, что вы хотите сделать, и я постараюсь привести пример. Сейчас это слишком общее. - person Kyle Rosendo; 07.01.2011
comment
Ну, это немного менее общее, но вы бы использовали WebBrowser, чтобы получить элемент с определенным атрибутом из Html (фактически HtmlElement), вытащить InnerHtml из этих элементов и проанализировать их (используя <li>'s). Это действительно зависит от того, насколько общий вы хотите пойти. - person Kyle Rosendo; 07.01.2011
comment
хорошо, я постараюсь разобраться с вашими предложениями. спасибо, это было так приятно с вашей стороны :) - person waqari; 11.01.2011