码迷,mamicode.com
首页 > 其他好文 > 详细

数据用

时间:2018-03-20 00:51:48      阅读:127      评论:0      收藏:0      [点我收藏+]

标签:concat   存储   info   use   命名   cti   char   cat   www.   

https://segmentfault.com/a/1190000008745531

 

var cheerio = require(‘cheerio‘);
var http = require(‘http‘);
var iconv = require(‘iconv-lite‘);
//https://segmentfault.com/a/1190000008745531
//var url = ‘http://www.ygdy8.net/html/gndy/dyzz/index.html‘;
var url = "http://nj.rent.house365.com/district_i1/dl_x1.html";
http.get(url, function(sres) {
    var chunks = [];
    sres.on(‘data‘, function(chunk) {
        chunks.push(chunk);
    });
    // chunks里面存储着网页的 html 内容,将它zhuan ma传给 cheerio.load 之后
    // 就可以得到一个实现了 jQuery 接口的变量,将它命名为 `$`
    // 剩下就都是 jQuery 的内容了
    sres.on(‘end‘, function() {
        var titles = [];
        //由于咱们发现此网页的编码格式为gb2312,所以需要对其进行转码,否则乱码
        //依据:“<meta http-equiv="Content-Type" content="text/html; charset=gb2312">”
        var html = iconv.decode(Buffer.concat(chunks), ‘gb2312‘);
        var $ = cheerio.load(html, {decodeEntities: false});
        $(‘.info .name a‘).each(function (idx, element) {
            var $element = $(element);
            console.log($element.attr("href"),$element.text());
            titles.push({
                title: $element.text()
            })
        })
        //console.log(titles);
    });
});

  

数据用

标签:concat   存储   info   use   命名   cti   char   cat   www.   

原文地址:https://www.cnblogs.com/cnchengv/p/8605728.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!