2020-12-14 16:38:41 +08:00
|
|
|
|
**一个Pixiv小爬虫,目前只可以爬每日, 支持长时间爬取 跳过已经爬过的**
|
2019-09-17 01:03:33 +08:00
|
|
|
|
|
|
|
|
|
## 环境需求
|
|
|
|
|
|
2024-12-19 19:00:11 +08:00
|
|
|
|
Python:3.8+ / Redis
|
2019-09-17 01:03:33 +08:00
|
|
|
|
|
|
|
|
|
## 食用方法
|
|
|
|
|
|
|
|
|
|
**Linux/OSX:**
|
|
|
|
|
|
|
|
|
|
```shell
|
|
|
|
|
git clone https://github.com/nyaasuki/PixivSpider.git && cd ./PixivSpider
|
|
|
|
|
python3 Pixiv.py
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
**Windows:**
|
|
|
|
|
|
|
|
|
|
1. 下载/clone这个项目
|
|
|
|
|
|
|
|
|
|
2. 配置好环境(python、Redis)
|
|
|
|
|
|
|
|
|
|
3. 打开你的CMD窗口
|
|
|
|
|
|
|
|
|
|
4. 输入python+‘ ’ ←这是一个空格
|
|
|
|
|
|
|
|
|
|
5. 用鼠标把**Pixiv.py**这个文件拖到cmd窗口
|
|
|
|
|
|
|
|
|
|
^_^
|
|
|
|
|
|
2020-12-14 16:35:26 +08:00
|
|
|
|
## 注意事项
|
|
|
|
|
|
|
|
|
|
1.requests安装错误
|
|
|
|
|
|
|
|
|
|
`ERROR: Could not find a version that satisfies the requirement resquests
|
|
|
|
|
ERROR: No matching distribution found for resquests`
|
|
|
|
|
|
|
|
|
|
解决方案:手动安装requests
|
|
|
|
|
|
|
|
|
|
'pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests'
|
|
|
|
|
|
|
|
|
|
2.请输入一个cookie
|
|
|
|
|
|
2024-12-19 21:24:24 +08:00
|
|
|
|
目前此项留空直接回车也可以正常爬取(匿名模式),如果后续添加新功能可能需要
|
2020-12-14 16:35:26 +08:00
|
|
|
|
|
|
|
|
|
此项储存在本地redis中
|
|
|
|
|
|
2024-12-19 21:20:25 +08:00
|
|
|
|
3.错误:无法连接到Redis服务,请确保Redis服务正在运行
|
|
|
|
|
项目使用redis查重 需要安装redis
|
|
|
|
|
官方安装教程:https://redis.io/docs/latest/operate/oss_and_stack/install/install-redis/
|
|
|
|
|
|
|
|
|
|
同时新增了一个redis快速管理小工具 能自动识别写入的数据库 提供查和删功能
|
|
|
|
|
使用方法同上 运行 redis_monitor.py 即可
|
2019-09-17 01:05:13 +08:00
|
|
|
|
## 特别提醒
|
|
|
|
|
|
2020-12-14 16:38:41 +08:00
|
|
|
|
正常来说,当没有出现上方问题时,程序出现问题大多为你的上网方式不够科学
|
|
|
|
|
缓慢更新中...
|