分享web开发知识

注册/登录|最近发布|今日推荐

主页 IT知识网页技术软件开发前端开发代码编程运营维护技术分享教程案例
当前位置:首页 > 运营维护

selenium+PhantomJS简单爬虫

发布时间:2023-09-06 01:18责任编辑:傅花花关键词:selenium爬虫
#!/usr/bin/env python# -*- coding: utf-8 -*-‘‘‘Created on 2017年10月19日@author: zzy‘‘‘import timefrom selenium import webdriverfrom selenium.common import exceptions#注意:Python文件名或者包名不要命名为selenium,会导致无法导入def main(): ???#browser = webdriver.Ie(executable_path=‘C:\geckodriver\geckodriver.exe‘) ???browser = webdriver.PhantomJS(executable_path=‘C:\geckodriver\phantomjs.exe‘) ???try: ???????browser.get(r‘https://qian.qq.com/index.shtml?stat_data=oum62ppcsy004&ADTAG=SCQD.PINZ.PC.CZZ1‘) ???????#time.sleep(5) ???????html = browser.find_element_by_css_selector(‘.banner‘).get_attribute(‘innerHTML‘) ???????print(html) ???except exceptions.TimeoutException as ex: ???????print(ex)if __name__ == ‘__main__‘: ???main()

 版本说明:

py3.6

selenium3.6

geckodriver-v0.19.0-win64

phantomjs-2.1.1-windows

selenium+PhantomJS简单爬虫

原文地址:http://www.cnblogs.com/OnlyDreams/p/7691910.html

知识推荐

我的编程学习网——分享web前端后端开发技术知识。 垃圾信息处理邮箱 tousu563@163.com 网站地图
icp备案号 闽ICP备2023006418号-8 不良信息举报平台 互联网安全管理备案 Copyright 2023 www.wodecom.cn All Rights Reserved