码迷,mamicode.com
首页 > Web开发 > 详细

PHP采集CSDN博客边栏的阅读排行

时间:2014-07-13 15:29:04      阅读:262      评论:0      收藏:0      [点我收藏+]

标签:style   blog   http   color   使用   数据   

  项目中要用到采集的数据,所以就先拿CSDN博客来试了试。这里使用Simple HTML DOM(官网)这个库,它能够方便的遍历HTML文档。 

bubuko.com,布布扣
<?php
    include_once(‘simple_html_dom.php‘);
    header(‘Content-Type:text/html;charset=utf-8‘);
    $html = file_get_html(‘http://blog.csdn.net/szy361‘);

    $res = $html->find(‘#hotarticls ul.panel_body li a[title]‘);//取得id=hotarticls下class为panel_bodya的ul标签下的a的title
    $span = $html->find(‘#hotarticls ul.panel_body li span‘);//取得span
    foreach($res as $element){
        $arr[] = $element->title.‘+‘.$element->href;//将title值和href的值通过+连起来
    }
    foreach($span as $e){
        $brr[] = $e->innertext;//得到span下的值组成的数组
    }
    
    //将两个数组组成一个新的二维数组
    for($i=0;$i<count($res);$i++){
        $crr[] = explode(‘+‘,$arr[$i]);
        $crr[$i][] = $brr[$i];
    }
    return $crr;
bubuko.com,布布扣

 

扩展:

PHP Simple HTML DOM解析器使用入门

PHP采集CSDN博客边栏的阅读排行,布布扣,bubuko.com

PHP采集CSDN博客边栏的阅读排行

标签:style   blog   http   color   使用   数据   

原文地址:http://blog.csdn.net/szy361/article/details/37729869

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!