0

Каким образом можно спарсить html-документ без сторонних библиотек таких как AngleSharp и т.д.?

  • Без сторонних никак – Zergatul Jun 26 '18 at 10:55
  • А именно Regex... – EvgeniyZ Jun 26 '18 at 11:05
  • Средствами C# нельзя, но можно использовать входящую в Windows Microsoft HTML Object Library (пример: https://ru.stackoverflow.com/a/738668/240512). – MSDN.WhiteKnight Jun 26 '18 at 11:06
  • @EvgeniyZ Так вроде регулярные выражения не следует использовать для парсинга? – Castiel_Luciefer2000 Jun 26 '18 at 11:16
  • @Castiel_Luciefer2000 Ну вы сами изобретаете велосипед, без заточенных специально под это дело инструментов пытаетесь что то сделать... Я лично вижу два варианта - регулярки и парсить как xml и то и то довольно плохо. – EvgeniyZ Jun 26 '18 at 11:19
  • Ни регулярками, ни xml вы ничего не распарсите. В HTML есть теги, которые не закрывают, например <br>, xml парсер сломается на таком. Парсить HTML регулярками, это все равно что парсить c# код регулярками. – Zergatul Jun 26 '18 at 12:17
  • @Zergatul Ну тогда с эталонной закрывашки про регулялярки убрать наверно надо? Я лично пробовал регулярками, геморно, тупо, но возможно! По поводу XML отличия есть, да... По этому я и назвал все эти методы "плохими", но с определенными задачами они справятся. – EvgeniyZ Jun 26 '18 at 13:29

0 Answers0