【重磅推荐】在Pycharm中调试scrapy爬虫的两种方法（有坑，务必注意）-白红宇

【重磅推荐】在Pycharm中调试scrapy爬虫的两种方法（有坑，务必注意）

阅读量：669 次

发布时间：2019-03-15

本文共 667 字，大约阅读时间需要 2 分钟。

PyCharm调试Scrapy常用的命令配置方法

Scrapy是一个强大的网页抓取框架，在PyCharm中调试Scrapy项目可以帮助开发者快速定位问题。以下是两种常用的调试方法：

第一种模式：使用scrapy.cmdline的execute方法

这种方法在项目根目录下创建main.py文件，配置相关调试参数。具体步骤如下：

在项目根目录下找到scrapy.cfg文件，创建同级目录下的main.py文件

在main.py文件中输入以下代码：

from scrapy.cmdline import executeimport sysimport ossys.path.append(os.path.dirname(os.path.abspath(__file__)))

在需要调试的爬虫文件中设置断点，运行main.py即可在PyCharm中调试

第二种模式：直接使用Scrapy命令

执行单文件调试模式1：

scrapy runspider scrapy_first/spiders/book.py

执行单文件调试模式2：

scrapy crawl spider_name

注意：这里的spider_name是Spider子类的名称属性，而不是文件名

示例：

class Test1Spider(Spider):    name = 'test'    def parse(self, response):        pass

图1：PyCharm调试界面示例

(Demo图展示了如何在PyCharm中设置断点和使用调试工具)

转载地址：http://pimmz.baihongyu.com/

你可能感兴趣的文章

PLC结构体（西门子）

查看>>

PLC编程语言ST文本语法的常用数据类型及变量

查看>>

PLC通讯方式

查看>>

Please install 'webpack-cli' in addition to webpack itself to use the CLI

查看>>

Ploly Dash，更新一个Dash应用程序JJJA上的实时人物

查看>>

Ploly烛台的定制颜色

查看>>

Ploly：如何在Excel中嵌入完全交互的Ploly图形？

查看>>

plotloss记录

查看>>

Plotly (Python) 子图:填充构面和共享图例

Plotly-Dash 存在未知问题并创建“加载依赖项时出错“；通过使用 Python-pandas.date_range

查看>>

Plotly-Dash:如何过滤具有多个数据框列的仪表板?

查看>>

Plotly:如何为 x 轴上的时间序列设置主要刻度线/网格线的值?

查看>>

Plotly:如何从 x 轴删除空日期?

查看>>

Plotly:如何从单条迹线制作堆积条形图?

查看>>

Plotly:如何以 Root 样式绘制直方图，仅显示直方图的轮廓?

查看>>

Plotly:如何使用 Plotly Express 组合散点图和线图?

查看>>