Scrapy

初窥Scrapy
安装指南
- 安装Scrapy
- 平台安装指南
Scrapy入门教程
例子

命令行工具(Command line tools)
Items
Spiders
- Spider参数
- 内置Spider参考手册
选择器(Selectors)
- 使用选择器(selectors)
- 内建选择器的参考
Item Loaders
Scrapy终端(Scrapy shell)
Item Pipeline
Feed exports
Link Extractors
- 内置Link Extractor 参考

Logging
数据收集(Stats Collection)
- 常见数据收集器使用方法
- 可用的数据收集器
发送email
Telnet终端(Telnet Console)
Web Service

常见问题(FAQ)
调试(Debugging)Spiders
Spiders Contracts
- 自定义Contracts
实践经验(Common Practices)
通用爬虫(Broad Crawls)
借助Firefox来爬取
- 在浏览器中检查DOM的注意事项
- 对爬取有帮助的实用Firefox插件
使用Firebug进行爬取
调试内存溢出
下载项目图片
Ubuntu 软件包
Scrapyd
自动限速(AutoThrottle)扩展
Benchmarking
Jobs: 暂停，恢复爬虫
DjangoItem

架构概览
下载器中间件(Downloader Middleware)
Spider中间件(Middleware)
扩展(Extensions)
核心API

Requests and Responses
Settings
信号(Signals)
- 延迟的信号处理器(Deferred signal handlers)
- 内置信号参考手册(Built-in signals reference)
异常(Exceptions)
- 内置异常参考手册(Built-in Exceptions reference)
Item Exporters
- 使用 Item Exporter
- Item Exporters 参考资料

Release notes
Contributing to Scrapy
Versioning and API Stability
- Versioning
- API Stability
试验阶段特性
- 使用外部库插入命令

Scrapy

Docs »
Web Service
返回在线手册首页

Web Service¶

webserver 被移动到另外一个项目中。

托管在:

https://github.com/scrapy/scrapy-jsonrpc

Next Previous

© 版权所有 2008-2014, written by Scrapy developers, translated by Summer&Friends. 最后更新于 Dec 04, 2014.