PHP之phpQuery爬虫

2022-06-07 15:29:57 浏览数 (1)

用phpQuery简单实现网页内容爬虫

安装方法:

代码语言:javascript复制
composer require jaeger/querylist

用法:

代码语言:javascript复制
$phpQuery = phpQuery::newDocumentFile($url);
$result = phpQuery::pq('.art_content', $phpQuery);//.art_content 节点
$string = $result->text();//节点文本内容
$html = $result->html();//节点HTML代码

可以通过这个方法实现一个简单的网页爬虫,抓取HTML节点代码

以简书为例,爬取一篇文章内容

代码语言:javascript复制
$phpQuery = phpQuery::newDocumentFile("https://www.jianshu.com/p/0c856519824d");
$title = phpQuery::pq('title', $phpQuery)->text();//网页title
$content = phpQuery::pq('.show-content', $phpQuery)->html();//文章内容节点

0 人点赞