标签:lis 域名 div color 记录 child https 富文本 过滤
$rules = [ ‘p1‘ => [‘#side > div.content.clearfix > div.content_left > div.centent_centent > p:nth-child(1)‘, ‘text‘], //文本,比如图片就会被过滤掉 ‘content‘ => [‘#side > div.content.clearfix > div.content_left > div.centent_centent‘, ‘html‘], //HTML 包含标签等,图片会爬下来,类似富文本 ‘img‘ => [‘#side > div.content.clearfix > div.content_left > div.centent_centent > p:nth-child(4) > img‘, ‘src‘], //图片的链接
‘alt‘ => [‘#side > div.content.clearfix > div.content_left > div.centent_centent > p:nth-child(4) > img‘, ‘alt‘], //img 的 alt
‘a‘ => [‘h3>a‘, ‘href‘]; //a 标签的href 链接
];
标签:lis 域名 div color 记录 child https 富文本 过滤
原文地址:https://www.cnblogs.com/bneglect/p/12192272.html