免费

第 1 回

教程文档

Scrapy 爬虫开发教程 - 安装 Scrapy

local_offer Python

2023年11月23日更新

安装 Scrapy

安装

pip install scrapy  # 安装scrapy爬虫框架

会安装大量依赖包，其中包含

pyOpenSSL: 用于支持 SSL 的包
cryptography：用于加密
CFFI: 用于调用 C 的接口库
zepto.interface: 为缺少接口而提供扩展的库
lxml: 处理 XML、HTML 文档的库
cssselect: 用于处理 CSS 选择器的包
Twisted: 提供基于事件驱动的网络引擎包

创建 Scrapy 项目

scrapy startproject ClwySpider

scrapy.cfg：项目总配置文件，通常无需修改
ClwySpider：项目的 Python 模块，程序从此导入 Python 代码
ClwySpider/items.py：用于定义项目用到的 Item 类。
ClwySpider/pipelines.py：管道文件，负责处理爬取到的信息
ClwySpider/settings.p...

请登录后查看更多expand_more

课程介绍

Scrapy 是适用于 Python 的一个快速、高层次的屏幕抓取和 web 抓取框架，用于抓取 web 站点并从页面中提取结构化的数据。Scrapy 用途广泛，可以用于数据挖掘、监测和自动化测试。

Scrapy 吸引人的地方在于它是一个框架，任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类，如 BaseSpider、sitemap 爬虫等，最新版本又提供了 web2.0 爬虫的支持。

Scrapy 是一个适用爬取网站数据、提取结构性数据的应用程序框架，它可以应用在广泛领域：Scrapy 常应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。通常我们可以很简单的通过 Scrapy 框架实现一个爬虫，抓取指定网站的内容或图片。

尽管 Scrapy 原本是设计用来屏幕抓取（更精确的说，是网络抓取），但它也可以用来访问 API 来提取数据。

授课老师

刘东

CEO／长乐未央公司

1987年生于湖北。2007年大学毕业后，先后在教育部门、美企、国内互联网公司从事开发工作，历任研发工程师、CTO、COO等职务。2013年创办了长乐未央公司，任职CEO。擅长使用Ruby、PHP、Node.js、Python等开发后端程序。擅长HTML 5、CSS 3、原生JavaScript、jQuery、Vue.js、React开发。擅长微信公众号、小程序开发。擅长使用React Native开发iOS、Android原生App。对编程、AI和机器人都有深厚的兴趣，觉得做开发非常快乐，能创造梦想中的产品是一件非常有幸福感的事情。喜爱阅读，尤其是历史相关的书籍。喜欢音乐，钢琴、Ukulele都能简单自娱自乐。爱好旅行和美食，人生梦想之一是希望能带着妻子吃遍全世界。

内容索引
目录列表

AI 时代

前端开发

后端开发

移动端开发

数据库

Scrapy 爬虫开发教程

Scrapy 爬虫开发教程 - 安装 Scrapy

安装 Scrapy

安装

创建 Scrapy 项目

课程介绍

授课老师

刘东

内容索引

目录列表

全4回 Rails + Active Admin 实践手册

全48回 PHP 入门教程

全37回 Python 入门教程

全26回 Ruby On Rails 实践教程

全26回 Python 语言基础面试复习

全37回 Flask 开发教程

全71回 Django 开发教程

全20回 Django REST framework 开发 Api 接口教程

全9回 Scrapy 爬虫开发教程

全17回 Express 实践教程

AI 时代

前端开发

后端开发

移动端开发

数据库

Scrapy 爬虫开发教程

Scrapy 爬虫开发教程 - 安装 Scrapy

安装 Scrapy

安装

创建 Scrapy 项目

课程介绍

授课老师

刘东

内容索引

目录列表

全4回 Rails + Active Admin 实践手册

全48回 PHP 入门教程

全37回 Python 入门教程

全26回 Ruby On Rails 实践教程

全26回 Python 语言基础面试复习

全37回 Flask 开发教程

全71回 Django 开发教程

全20回 Django REST framework 开发 Api 接口教程

全9回 Scrapy 爬虫开发教程

全17回 Express 实践教程

打开微信，使用「扫一扫」