背景
这两天构思了一个爬虫框架,对外提供API创建爬虫任务,然后内部的队列会进行爬虫的消费。只需要实现数据的解析接口就能快速编写爬虫。非常适合需要利用AI快速生成爬虫代码的团队。
这个框架对外提供了API接口来创建,非常便利。目前的设计思路就是只需要实现一个parse接口,就行了,方便后续AI的介入。
后续开发计划
- 开放AI接口,通过AI自动生成爬虫代码
- 集成基于redis的任务队列
- 实现对外输出的接口层,例如爬虫结果转储到mysql等。
目前这是一个非常简单清晰的项目,希望和感兴趣的朋友共建这个项目,提升大家的技术影响力,或许对找远程工作也是有帮助的。
最后修改于
爬虫的话Mongo数据库比MySQL更好用吧
也可以的。这个比较灵活,交给了写爬虫的人