【项目目标】根据关键词、账号、笔记等信息爬取某书的笔记和评论,提取并处理其中的图⽚和视频内容,并将相关数据存储⾄数据库和⽂件服务器。同时,系统需具备⾃动化部署能⼒,确保⾼效稳定的运⾏。
【能力要求】
- 熟悉爬虫系统,可根据要求在开源系统上做修改和扩展。
- 数据清洗与分析能力: 擅长数据清洗、转换和分析,熟练使用Python库如Pandas, NumPy, 和Dask,具备开发高效数据处理管道的经验。
- 视频音频内容处理和提取。
【薪资待遇】8000~15000/月
【面试方式】线上面试 (1-2轮)
招聘类型:
企业直招
职业:
开发
工作方式:
线上兼职远程工作
城市:
杭州
领域:
AI/人工智能
我爬过dcard,还有小红书的我没有代码,但是我现在看了, 我可以做的
可以聊一下
做过某书的爬虫,实景图片的数据分析,没用过dask,但pandas和numpy是我处理数据必用的,cv方面的模型也用过几个。有两年没做过相关的了,不过我便宜,重新上手不慢。期待联系。
行了,别听上面吹,你先问问他们有几个能过旋转验证码
RPA高级认证工程师,做过大量案例,包括小红书,抖音,微博,京东到家,饿了么等。
很刑!
有做过多个爬虫系统 可联系 小红书有开源现成代码