码迷,mamicode.com
首页 > 其他好文 > 详细

个人记录03-node小爬虫

时间:2021-02-02 11:15:44      阅读:0      评论:0      收藏:0      [点我收藏+]

标签:内容   substring   指定   sub   gettime   col   mobile   src   load   

个人记录

let http = require("http");
let fs = require("fs");
let cheerio = require("cheerio");//服务端的DOM解析模块

http.get("http://www.mobiletrain.org/teacher/", (res) => {
    let result = "";
    res.on("data", (chunk) => {
        result += chunk;
    })
    res.on("end", () => {

        fs.readFile("./temp/demo.html", { encoding: "utf8" }, (err, data) => {
            //data就是整个模板字符串 解析就当字符串用
            if (!err) {//没有错
                let $ = cheerio.load(result);//解析成JQ的DOM
                $(".jiangshi1 li").each((index, item) => { //找到指定样式下面的li标签
                    //item就是li标签
                    //console.log( $(item).find("h6").html());
                    let teachername = $(item).find("h6").html();
                    let teacherjieshao = $(item).find(".jieshao").html();
                    let teacherimg = $(item).find("img").attr("src");
                    let detail = $(item).attr("onclick")
                    detail = detail.substring(13, detail.length - 2);
                    // console.log(detail);

                    let  newStr = data.replace("{{detail}}",detail).replace("{{teachername}}",teachername).replace("{{teacherjieshao}}",teacherjieshao).replace("{{teacherimg}}",teacherimg);
                    //生成一个新的字符串

                    teachername= teachername.split(":")[1];

                    // let  date = new  Date();
                    // date.getTime()
                    fs.writeFile("./temp/"+teachername+new Date().getTime()+".html",newStr,(err)=>{
                        if(!err){
                            console.log("写入完成");
                        }
                    })






                });
            }

        })
        //这段代码 只是来看页面内容的   
        // fs.writeFile("qianfeng.html",result,(err)=>{
        //     if(!err){
        //     }
        // })
    })

})

 

个人记录03-node小爬虫

标签:内容   substring   指定   sub   gettime   col   mobile   src   load   

原文地址:https://www.cnblogs.com/setbug/p/14358460.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!