码迷,mamicode.com
首页 > Web开发 > 详细

PHP 之simple_html_dom实现网页数据采集

时间:2019-04-05 23:50:03      阅读:212      评论:0      收藏:0      [点我收藏+]

标签:网页数据   github   list   get   color   count   src   https   .com   

<?php
    set_time_limit(0);
    include ‘./simple_html_dom.php‘;
    $url = ‘https://price.pcauto.com.cn/price/rank/nb1-lb0-o1/‘;
    $html = file_get_html($url);
    $list = $html->find("#JlistTb .j-list");
    $id = array();
    $title = array();
    $price = array();
    $dealer_price = array();
    $pic = array();
    for ($i=0; $i < count($list); $i++) { 
        $idText = $html->find("#JlistTb .j-list dd[name=dealer_price]", $i)->id;
        $id[] = explode("_", $idText)[2];
        $title[] = $html->find("#JlistTb .j-list .sname", $i)->innertext;
        $price[] = $html->find("#JlistTb .j-list .pri", $i)->innertext;
        $dealer_price[] = $html->find("#JlistTb .j-list .emphs", $i)->innertext;
        $pic[] = "https:".$html->find("#JlistTb .j-list .pic img", $i)->getAttribute("#src");
    }
    $list = array();
    for ($i=0; $i < count($title); $i++) { 
        $list[$i] = array(
            ‘id‘ => $id[$i],
            ‘title‘ => $title[$i],
            ‘price‘ => $price[$i],
            ‘dealer_price‘ => $dealer_price[$i],
            ‘pic‘ => $pic[$i],
            ‘area_id‘ => 1
        );
    }
    var_dump($list);
?>

数组打印结果为

技术图片

参考文档:https://github.com/yangsphp/simple_html_dom-master

PHP 之simple_html_dom实现网页数据采集

标签:网页数据   github   list   get   color   count   src   https   .com   

原文地址:https://www.cnblogs.com/yang-2018/p/10660446.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!