独立产品Python 爬虫微框架 web-craft

头像
Tao
41阅读2评论

背景

这两天构思了一个爬虫框架,对外提供API创建爬虫任务,然后内部的队列会进行爬虫的消费。只需要实现数据的解析接口就能快速编写爬虫。非常适合需要利用AI快速生成爬虫代码的团队。
Python 爬虫微框架 web-craft

这个框架对外提供了API接口来创建,非常便利。目前的设计思路就是只需要实现一个parse接口,就行了,方便后续AI的介入。

后续开发计划

  1. 开放AI接口,通过AI自动生成爬虫代码
  2. 集成基于redis的任务队列
  3. 实现对外输出的接口层,例如爬虫结果转储到mysql等。

目前这是一个非常简单清晰的项目,希望和感兴趣的朋友共建这个项目,提升大家的技术影响力,或许对找远程工作也是有帮助的。

项目地址:
happytaoer/web-craft: A Python-based modular web scraping framework focused on efficient single URL crawling, supporting asynchronous processing, API services, and highly customizable spider modules.

最后修改于

收藏
举报
精选评论
头像
等级0

爬虫的话Mongo数据库比MySQL更好用吧

也可以的。这个比较灵活,交给了写爬虫的人

版块详情

独立产品

1k 帖子
3k 评论
581 关注
请真诚分享你的个人作品的创作灵感、开发经验、运营过程等;不得只罗列产品功能来借机营销
版主
远程老司机/游牧旅居中/电鸭社区站长
远程全职推荐

扫码下载应用

下载APP以便及时收到回复或进展