用phpQuery简单实现网页内容爬虫
安装方法:
代码语言:javascript复制composer require jaeger/querylist
用法:
代码语言:javascript复制$phpQuery = phpQuery::newDocumentFile($url);
$result = phpQuery::pq('.art_content', $phpQuery);//.art_content 节点
$string = $result->text();//节点文本内容
$html = $result->html();//节点HTML代码
可以通过这个方法实现一个简单的网页爬虫,抓取HTML节点代码
以简书为例,爬取一篇文章内容
代码语言:javascript复制$phpQuery = phpQuery::newDocumentFile("https://www.jianshu.com/p/0c856519824d");
$title = phpQuery::pq('title', $phpQuery)->text();//网页title
$content = phpQuery::pq('.show-content', $phpQuery)->html();//文章内容节点