一个Pixiv小爬虫,目前只可以爬每日, 支持长时间爬取 跳过已经爬过的
Go to file
2024-12-19 21:30:19 +08:00
.gitignore up to data 2020-12-15 06:03:17 +08:00
LICENSE 添加 LICENSE 2019-09-16 16:44:23 +00:00
Pixiv.py 优化Redis去重逻辑,减少开销 2024-12-19 21:20:02 +08:00
README.md update 2024-12-19 21:24:24 +08:00
redis_monitor.py 新增Redis管理工具支持多库切换 2024-12-19 21:20:17 +08:00
requirements.txt Update Python version requirement and dependencies in README.md and requirements.txt 2024-12-19 19:00:11 +08:00

一个Pixiv小爬虫目前只可以爬每日 支持长时间爬取 跳过已经爬过的

环境需求

Python:3.8+ / Redis

食用方法

Linux/OSX:

git clone https://github.com/nyaasuki/PixivSpider.git && cd ./PixivSpider
python3 Pixiv.py

Windows:

  1. 下载/clone这个项目

  2. 配置好环境python、Redis

  3. 打开你的CMD窗口

  4. 输入python+ ←这是一个空格

  5. 用鼠标把Pixiv.py这个文件拖到cmd窗口

    ^_^

注意事项

1.requests安装错误

ERROR: Could not find a version that satisfies the requirement resquests ERROR: No matching distribution found for resquests

解决方案手动安装requests

'pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests'

2.请输入一个cookie

目前此项留空直接回车也可以正常爬取(匿名模式),如果后续添加新功能可能需要

此项储存在本地redis中

3.错误无法连接到Redis服务请确保Redis服务正在运行 项目使用redis查重 需要安装redis 官方安装教程:https://redis.io/docs/latest/operate/oss_and_stack/install/install-redis/

同时新增了一个redis快速管理小工具 能自动识别写入的数据库 提供查和删功能 使用方法同上 运行 redis_monitor.py 即可

特别提醒

正常来说,当没有出现上方问题时,程序出现问题大多为你的上网方式不够科学 缓慢更新中...