2018年7月19日木曜日

php標準のDOMDocumentの取り扱い注意点

無駄に悩んだので注意。
DOMDocumentで構造が正しくないDOMが破棄される。
補完機能が不足している。

$url = "https://google.com/search?q=あいうえお";
$doc = new DOMDocument();
@$doc->loadHTMLFile($url);
$xpath = new DOMXpath($doc);
echo $doc->saveHTML();

結論、nightmareJSかpupeteerでやれって話。

ウエイトなしで389回取りに行ったらブロックされた。

0 件のコメント:

コメントを投稿