Извлечение данных из Web Scraping C#

Я разработчик MVC ASP.NET.

Я получил содержимое с любого URL, т.е. http, https и т. Д., Используя класс WebRequest.

Я получил все содержимое этого конкретного URL. (сейчас я взял http://google.com/)

Мой следующий шаг - извлечь кнопки, колонтитулы, цвета, текст и т. Д.

Вот мой код сейчас:

public ActionResult GetContent(UrlModel model) //model having a string URL
which is entered in a text box and method hits using submit button.
{
    //WebRequest request = WebRequest.Create(model.URL);

    WebRequest request = WebRequest.Create(model.URL);

    request.Credentials = CredentialCache.DefaultCredentials;

    WebResponse response = request.GetResponse();

    Stream dataStream = response.GetResponseStream();

    StreamReader reader = new StreamReader(dataStream);

    string responseFromServer = reader.ReadToEnd();
    ViewBag.Response = responseFromServer;

    reader.Close();
    response.Close();
    return View();
}

Может кто-нибудь помочь мне с написанием кода?

Также предложите мне некоторые методы извлечения данных в C#.

1 ответ

Решение

Это ваш путь, чтобы пойти http://htmlagilitypack.codeplex.com/

Об этом есть множество сообщений от stackru. Вы можете легко получить любые элементы из HTML.

Другие вопросы по тегам