Ранее я написал скрипт для программы-оболочки «Windows PowerShell» версии 5.1 (или для «PowerShell» версии 7), работающей в операционной системе «Windows 10». Этот скрипт получает текст из текстового файла с кодом на языке HTML (в кодировке UTF-8 без метки BOM) и помещает его в переменную $html
типа System.String
. После этого с помощью библиотеки «HTML Agility Pack» содержимое переменной $html
конвертируется в объект $dom
, содержащий HTML-дерево:
Add-Type -Path "HtmlAgilityPack.1.11.43libnetstandard2.0HtmlAgilityPack.dll"
$dom = New-Object -TypeName "HtmlAgilityPack.HtmlDocument"
$dom.LoadHtml($html)