分享web开发知识

注册/登录|最近发布|今日推荐

主页 IT知识网页技术软件开发前端开发代码编程运营维护技术分享教程案例
当前位置:首页 > 网页技术

scrapy使用PhantomJS和selenium爬取数据

发布时间:2023-09-06 02:06责任编辑:顾先生关键词:selenium

1.phantomjs 安装

下载:http://phantomjs.org/download.html

解压:

tar ?-jxvf ?phantomjs-2.1.1-linux-x86_64.tar.bz2

重命名:

mv /usr/local/phantomjs-2.1.1-linux-x86_64/ /usr/local/phantomjs

软连接:

ln -s /usr/local/phantomjs/bin/phantomjs /usr/bin/ 

[root@izuf622gt8apcfsz7i1mqdz /]# phantomjs
phantomjs>

2.selenium 安装

pip 安装: pip install selenium

使用:

 ???def process_request(self, request, spider): ???????driver = webdriver.PhantomJS() ???????# driver = webdriver.Chrome() ???????driver.get(request.url) ???????body = driver.page_source ???????input_first ?= driver.find_element_by_id(‘stockID_‘) ???????input_first.clear() ???????input_first.send_keys(‘000150‘) ???????button = driver.find_element_by_id(‘button‘) ???????dataClick = button.click() ???????print(dataClick) ???????body = driver.page_source ???????# driver.switch_to.frame(‘i_nr‘) ???????# print("访问:", driver.page_source) ???????return HtmlResponse(driver.current_url, body=body, encoding=‘utf-8‘)

scrapy使用PhantomJS和selenium爬取数据

原文地址:https://www.cnblogs.com/myvic/p/9392079.html

知识推荐

我的编程学习网——分享web前端后端开发技术知识。 垃圾信息处理邮箱 tousu563@163.com 网站地图
icp备案号 闽ICP备2023006418号-8 不良信息举报平台 互联网安全管理备案 Copyright 2023 www.wodecom.cn All Rights Reserved