Использую код с сайта, он работает и с ним все хорошо. Но я не понимаю принципа
//создаем переменную и кладем в нее сразу через фунекцию код страницы
var pageContent = LoadPage(@"https://www.noob-club.ru/");
//Создаем объект класса
var document = new HtmlDocument();
//Используем метод класса и отправляем в него код страницы
document.LoadHtml(pageContent);
//дальше не совсем понятно
//Создаем коллекцию и кладем в не то что спарсили?
HtmlNodeCollection links = document.DocumentNode.SelectNodes("/html/body/div[5]/div/table/tbody/tr/td[1]/div[4]/span[1]/h1/a");
foreach (HtmlNode link in links)
Console.WriteLine("{0} - {1}", link.InnerText, link.GetAttributeValue("href", ""));
//Этот код не сработает так как я незнаю что делает "link.InnerText, link.GetAttributeValue("href", "")" и не редактировал их.
//Если я попытаюсь вывести содержимое коллекции
HtmlNodeCollection links = document.DocumentNode.SelectNodes(".//h2/a");
Console.WriteLine(links[1]);
//то получу
HtmlAgilityPack.HtmlNode
Как мне просто спарсить данные одним xpath и положить их в коллекцию? Сайт который в коде просто для примера.
html, в нем возьмиbody, там возьми 5-йdiv..." Что произойдет например, если нужный контент будет вdivпод номером 10? Или вовсе он перейдет куда то в другое место (в другойdivнапример)? Вам нужно искать что-то уникальное в этой всей каше, напримерIdилиclassи уже по ним искать контент. – EvgeniyZ Dec 29 '19 at 17:31"//td[@class='content']/div[@class='entry first']", то получите "ноды" всех новостей сайта, дальше вам по полученному результату нужно будет пройтись циклом и распарсить каждую "ноду", например получение заголовка -"./span[@class="entry-header"]"и у полученной "ноды" вызываетеInnerText. Теперь самиInnerTextиGetAttributeValue()- первое выдаст вам текст, который находится в этом месте, безhtml, а второе выдаст значение какого либо атрибута (в вашем коде этоhrefу ссылки). – EvgeniyZ Dec 29 '19 at 17:35https://www.google.com/search?q=free+proxy+listВот кодHtmlNodeCollection links = document.DocumentNode.SelectNodes("//div[starts-with(@class,'g')]/div[1]/div[1]/div[1]/a[1]"); foreach (HtmlNode link in links) Console.WriteLine("{0} - {1}", link.InnerText, link.GetAttributeValue("href",""));Я проверял xpath в 3х разных программах и он находит ссылки, а тут почему то ошибка. https://dotnetfiddle.net/Ef9NHv – User12351259599491 Dec 29 '19 at 21:42pageContent, посмотрите, похожа ли та страница, что отдает вам гугл на ту, что он выдает в браузере. Я вам скажу, что нет. – EvgeniyZ Dec 29 '19 at 23:01