一个Pixiv小爬虫,目前只可以爬每日, 支持长时间爬取 跳过已经爬过的
.gitignore | ||
LICENSE | ||
Pixiv.py | ||
README.md | ||
redis_monitor.py | ||
requirements.txt |
一个Pixiv小爬虫,目前只可以爬每日, 支持长时间爬取 跳过已经爬过的
环境需求
Python:3.8+ / Redis
食用方法
Linux/OSX:
git clone https://github.com/nyaasuki/PixivSpider.git && cd ./PixivSpider
python3 Pixiv.py
Windows:
-
下载/clone这个项目
-
配置好环境(python、Redis)
-
打开你的CMD窗口
-
输入python+‘ ’ ←这是一个空格
-
用鼠标把Pixiv.py这个文件拖到cmd窗口
^_^
注意事项
1.requests安装错误
ERROR: Could not find a version that satisfies the requirement resquests ERROR: No matching distribution found for resquests
解决方案:手动安装requests
'pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests'
2.请输入一个cookie
目前此项留空直接回车也可以正常爬取(匿名模式),如果后续添加新功能可能需要
此项储存在本地redis中
3.错误:无法连接到Redis服务,请确保Redis服务正在运行 项目使用redis查重 需要安装redis 官方安装教程:https://redis.io/docs/latest/operate/oss_and_stack/install/install-redis/
同时新增了一个redis快速管理小工具 能自动识别写入的数据库 提供查和删功能 使用方法同上 运行 redis_monitor.py 即可
特别提醒
正常来说,当没有出现上方问题时,程序出现问题大多为你的上网方式不够科学 缓慢更新中...