【重磅推荐】在Pycharm中调试scrapy爬虫的两种方法（有坑，务必注意）-白红宇

【重磅推荐】在Pycharm中调试scrapy爬虫的两种方法（有坑，务必注意）

阅读量：669 次

发布时间：2019-03-15

本文共 667 字，大约阅读时间需要 2 分钟。

PyCharm调试Scrapy常用的命令配置方法

Scrapy是一个强大的网页抓取框架，在PyCharm中调试Scrapy项目可以帮助开发者快速定位问题。以下是两种常用的调试方法：

第一种模式：使用scrapy.cmdline的execute方法

这种方法在项目根目录下创建main.py文件，配置相关调试参数。具体步骤如下：

在项目根目录下找到scrapy.cfg文件，创建同级目录下的main.py文件

在main.py文件中输入以下代码：

from scrapy.cmdline import executeimport sysimport ossys.path.append(os.path.dirname(os.path.abspath(__file__)))

在需要调试的爬虫文件中设置断点，运行main.py即可在PyCharm中调试

第二种模式：直接使用Scrapy命令

执行单文件调试模式1：

scrapy runspider scrapy_first/spiders/book.py

执行单文件调试模式2：

scrapy crawl spider_name

注意：这里的spider_name是Spider子类的名称属性，而不是文件名

示例：

class Test1Spider(Spider):    name = 'test'    def parse(self, response):        pass

图1：PyCharm调试界面示例

(Demo图展示了如何在PyCharm中设置断点和使用调试工具)

转载地址：http://pimmz.baihongyu.com/

你可能感兴趣的文章

Postgresql中PL/pgSQL代码块的语法与使用-声明与赋值、IF语句、CASE语句、循环语句

查看>>

Postgresql中PL/pgSQL的游标、自定义函数、存储过程的使用

查看>>

Postgresql中的表结构和数据同步/数据传输到Mysql

查看>>

Postgresql中自增主键序列的使用以及数据传输时提示:错误:关系“xxx_xx_xx_seq“不存在

查看>>

postgreSQL入门命令

查看>>

PostgreSQL删除数据库报"ERROR: There is 1 other session using the database."

查看>>

Qt开发——爱情公寓人事管理系统

查看>>

PostgreSQL和Oracle两种数据库有啥区别？如何选择？

查看>>

Postgresql在Windows中使用pg_dump实现数据库(指定表)的导出与导入

查看>>

PostgreSQL在何处处理 sql查询之四

查看>>

postgresql基本使用

查看>>

PostgreSQL学习总结（10）—— PostgreSQL 数据库体系架构

查看>>

PostgreSQL学习总结（11）—— PostgreSQL 常用的高可用集群方案

查看>>

Qt开发——多线程网络时间客户端

查看>>

PostgreSQL学习总结（13）—— PostgreSQL 15.8 如何成就数据库性能王者？

查看>>

PostgreSQL学习总结（13）—— PostgreSQL 目录结构与配置文件 postgresql.conf 详解

查看>>

PostgreSQL学习总结（1）—— PostgreSQL 入门简介与安装

查看>>

PostgreSQL学习总结（2）—— PostgreSQL 语法

查看>>

PostgreSQL学习总结（3）—— PostgreSQL 数据类型

查看>>

Qt开发——圆面积计算器

查看>>