分享web开发知识

注册/登录|最近发布|今日推荐

主页 IT知识网页技术软件开发前端开发代码编程运营维护技术分享教程案例
当前位置:首页 > 软件开发

【url ---lib___】笔趣阁(抓取部分)

发布时间:2023-09-06 01:59责任编辑:白小东关键词:url
 1 url=‘http://www.biquge.info/10_10218/‘ #定义网址 2 UA={"User-Agent":"Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24"}#定义协议 3 import time,lxml 4 from lxml import etree 5 from urllib.request import Request 6 from urllib.request import urlopen 7 import os 8 #c=os.path.join(os.path.abspath(os.path.dirname(__name__)),‘1.html‘)#写到本地读入 9 #with open(c,‘r‘) as f:10 # ??a=f.read()11 def source(url):#写入到本地的网页源代码12 ???global UA13 ???print(UA)14 ???text=urlopen(Request(url,None,UA),timeout=5)15 ???return text.read()16 17 def respon(text):#xpath到各个章节的链接地址18 ???global url19 ???seletor=etree.HTML(text)20 ???url1=seletor.xpath("//*[@id=‘list‘]/dl/dd/a/@href")21 ???name=seletor.xpath("//*[@id=‘list‘]/dl/dd/a/text()")22 ???for i in range(len(url1)):23 ???????print(url+url1[i],name[i])24 a=source(url)25 respon(a)

特别需要注意的是UA在Request中传值会出现错误,这时需要耐心来把问题解决

【url ---lib___】笔趣阁(抓取部分)

原文地址:https://www.cnblogs.com/Skyda/p/9179420.html

知识推荐

我的编程学习网——分享web前端后端开发技术知识。 垃圾信息处理邮箱 tousu563@163.com 网站地图
icp备案号 闽ICP备2023006418号-8 不良信息举报平台 互联网安全管理备案 Copyright 2023 www.wodecom.cn All Rights Reserved