Windows下安装Scrapy

						这几天正好有需求实现一个爬虫程序，想到爬虫程序立马就想到了python，python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了，正好发现了python有一个开源库scrapy，正是用来实现爬虫框架的，于是果断采用这个实现。下面就先安装scrapy，决定在windows下面安装。
Scrapy简介
Scrapy，Python开发的一个快速、高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。
Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。 

Scrapy吸引人的地方在于它是一个框架，任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类，如BaseSpider、sitemap爬虫等，最新版本又提供了web2.0爬虫的支持。
安装依赖

  Scrapy安装依赖于以下几个Python库
  lxml, an efficient XML and HTML parser
  parsel, an HTML/XML data extraction library written on top of lxml,
  w3lib, a multi-purpose helper for dealing with URLs and web page encodings
  twisted, an asynchronous networking framework
  cryptography and pyOpenSSL, to deal with various network-level security needs

我选择手动安装这些依赖

  pip install lxml
  pip install parsel
  pip install w3lib
  pip install twisted
  pip install cryptography
  pip install pyOpenSSL

其他的安装都很顺利，就是在安装twisted的时候报错了。


Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

于是下载离线的安装（下载自己的版本） 
http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
下载到一个目录，然后用
pip install Twisted-17.9.0-cp36-cp36m-win32.whl
之后再用下面的命令安装就可以了
pip install Scrapy
在命令行中输入scrapy，出现如下界面，则表示安装成功

总结
以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对中文源码网的支持。如果你想了解更多相关内容请查看下面相关链接