分享web开发知识

注册/登录|最近发布|今日推荐

主页 IT知识网页技术软件开发前端开发代码编程运营维护技术分享教程案例
当前位置:首页 > 技术分享

nodejs的爬虫

发布时间:2023-09-06 02:26责任编辑:顾先生关键词:jsnodejs爬虫
//爬取静态页面const request = require (‘request‘);const cheerio = require(‘cheerio‘);const mysql = require(‘mysql‘);var conn = mysql.createConnection({ ???host:‘localhost‘, ???user:‘root‘, ???password:‘root‘, ???port:‘3306‘, ???database:‘xiaomi‘});// conn.connect();request(‘https://www.epet.com/cleargoodsmdog.html‘,function(err,res,body){ ???var $ = cheerio.load(body); ???var list = $(‘.qcGoodsBox.bgwhite .fl.rela‘); ???console.log(list); ???request(imgsrc).pipe(fs.createWriteStream(__dirname+"/downloadimg/"+path.parse(imgsrc).base)); ???list.each(function(index){ ???????var pic = $(this).find(‘.cloud-zoom img‘).attr(‘src0‘); ???????var title = $(this).find(‘.qcGoodsTit a‘).text(); ???????var price = $(this).find(‘.qcPriceBox .ft20‘).text(); ???????var yprice = $(this).find(‘.qcPriceBox .ft12‘).text(); ???????conn.query(‘insert into goods(goodsname,price,pic,goodsclass) values(?,?,?,?)‘,[title,price,pic,yprice],function(err,results,fields){ ???????????console.log(results); ???????}) ???}); ???conn.end();})
//爬取动态数据用的是phantomconst phantom = require (‘phantom‘);const cheerio = require (‘cheerio‘); (async function() { ?const instance = await phantom.create(); ?const page = await instance.createPage(); ?await page.on(‘onResourceRequested‘, function(requestData) { ???console.info(‘Requesting‘, requestData.url); ?}); ??const status = await page.open(‘http://you.163.com/item/list?categoryId=1065000&subCategoryId=1065001‘); ?const content = await page.property(‘content‘);// ??console.log(content); ?var $ = cheerio.load(content); ?var list = $(‘.m-itemList.m-itemList-level2Category .item‘); ?list.each(function(index){ ???????var title = $(this).find(‘.name a span:nth-of-type(3)‘).text(); ???????console.log(title); ???}); ???await instance.exit();})();

nodejs的爬虫

原文地址:https://www.cnblogs.com/bao2333/p/10142910.html

知识推荐

我的编程学习网——分享web前端后端开发技术知识。 垃圾信息处理邮箱 tousu563@163.com 网站地图
icp备案号 闽ICP备2023006418号-8 不良信息举报平台 互联网安全管理备案 Copyright 2023 www.wodecom.cn All Rights Reserved