一、项目简介
我这边在做一套内部用的舆情采集系统 BN,底层技术栈是 Node.js + Playwright + PostgreSQL,需要找一位有真实平台采集经验的工程师合作完成阶段一。
二、阶段一要做什么(1–2 周)
- 用 Node.js + Playwright 写可稳定运行的采集脚本;
- 目标平台:
抖音:指定视频下评论列表(昵称、内容、点赞数、时间);
微博:话题搜索结果 + 热门评论;
公众号:文章标题 + 正文; - 需要处理基本反爬:登录 / cookie 注入 / UA 与 headers 模拟 / 简单滑块处理 / 错误重试;
- 把采集结果写入 PostgreSQL(我这边提供表结构);
- 提供:可运行 demo + 核心代码 + 简要说明文档。
三、期望你具备
做过任意一种真实平台采集(抖音 / 快手 / 微博 / 公众号 / 小红书等);
熟悉 Playwright 或 Puppeteer(Node 方向);
有账号登录、cookie 注入、反爬处理经验;
能独立开发并远程交付 demo。
四、合作方式
周期:约 1–2 周;
预算:¥10k–14k(按阶段验收,可细聊);
形式:远程合作,按项目结算,有长期合作可能(后续会扩展 n8n 节点、舆情分析与可视化)。
五、简单筛选问题(私信时请一起回复) - 你做过的真实采集项目有哪些?(平台 + 简要说明)
- 你最熟的是哪个平台?(例如抖音 / 微博 / 公众号…)
- 是否方便提供一小段可以公开的 Playwright / Puppeteer 代码片段(可打码)?
- 从接需求到交付第一个 demo,大概需要多久?
只找做过真实平台采集的同学,没做过抖音/微博/公众号这类平台的就先不用投啦,谢谢。
职业:


8


给泼冷水下,playwright 方案不好整,你的平台都是国内大厂风控拉满,量少还好点,量大起来很麻烦,然后 0-1 做过舆情软件可以交流
你好,我是“BN 系统”那个需求发布者。
看到你评论里提到你参与从 0–1 做过舆情软件,这段经验正是我现在缺的。
我这边不是大规模全网监控,只做轻量级采集,把舆情报表跑通。
想跟你具体聊聊,你当时怎么处理平台限制、访问频率、账号池、分布式调度这些问题,
也看看你是否愿意作为我们 BN 系统 1.0 的主程或技术顾问参与。
可以啊,我看你查看了我的联系方式,上面是 wx
我上个月刚做过一个这个项目,是vue+electron的,小红书不好弄,而且脚本维护起来需要专人维护
多谢分享经验🙏
我这边是做后台舆情系统,不是桌面版工具,部署在服务器端,后面要接 PostgreSQL 和自动化调度。
小红书这块我也知道比较费劲,目前第一阶段优先做抖音 / 微博 / 公众号,量级也不会拉太猛。
有空可以交流一下你那边维护成本和反爬策略,我这边如果后面做桌面侧工具,再考虑跟您合作。