Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。
使用Scrapy抓取Instagram数据,存储到我们自己的服务器上。其中访问Instagram需要翻墙,我们使用的是Shadowsocks。Shadowsocks使用的是socks代理,scrapy只支持http代理,所以使用polipo将socks代理转换成http代理。
-
Notifications
You must be signed in to change notification settings - Fork 1
songcser/webscraper
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
webscraper
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published