社区帖子招聘【远程|Node + Playwright】BN舆情采集系统采集模块开发(抖音/微博/公众号)

头像
138****9828
118阅读5评论

一、项目简介
我这边在做一套内部用的舆情采集系统 BN,底层技术栈是 Node.js + Playwright + PostgreSQL,需要找一位有真实平台采集经验的工程师合作完成阶段一。
二、阶段一要做什么(1–2 周)

  1. 用 Node.js + Playwright 写可稳定运行的采集脚本;
  2. 目标平台:
    抖音:指定视频下评论列表(昵称、内容、点赞数、时间);
    微博:话题搜索结果 + 热门评论;
    公众号:文章标题 + 正文;
  3. 需要处理基本反爬:登录 / cookie 注入 / UA 与 headers 模拟 / 简单滑块处理 / 错误重试;
  4. 把采集结果写入 PostgreSQL(我这边提供表结构);
  5. 提供:可运行 demo + 核心代码 + 简要说明文档。
    三、期望你具备
    做过任意一种真实平台采集(抖音 / 快手 / 微博 / 公众号 / 小红书等);
    熟悉 Playwright 或 Puppeteer(Node 方向);
    有账号登录、cookie 注入、反爬处理经验;
    能独立开发并远程交付 demo。
    四、合作方式
    周期:约 1–2 周;
    预算:¥10k–14k(按阶段验收,可细聊);
    形式:远程合作,按项目结算,有长期合作可能(后续会扩展 n8n 节点、舆情分析与可视化)。
    五、简单筛选问题(私信时请一起回复)
  6. 你做过的真实采集项目有哪些?(平台 + 简要说明)
  7. 你最熟的是哪个平台?(例如抖音 / 微博 / 公众号…)
  8. 是否方便提供一小段可以公开的 Playwright / Puppeteer 代码片段(可打码)?
  9. 从接需求到交付第一个 demo,大概需要多久?
    只找做过真实平台采集的同学,没做过抖音/微博/公众号这类平台的就先不用投啦,谢谢。
职业:
需消耗电量 5
收藏
举报
精选评论
头像
等级1

给泼冷水下,playwright 方案不好整,你的平台都是国内大厂风控拉满,量少还好点,量大起来很麻烦,然后 0-1 做过舆情软件可以交流

你好,我是“BN 系统”那个需求发布者。
看到你评论里提到你参与从 0–1 做过舆情软件,这段经验正是我现在缺的。
我这边不是大规模全网监控,只做轻量级采集,把舆情报表跑通。
想跟你具体聊聊,你当时怎么处理平台限制、访问频率、账号池、分布式调度这些问题,
也看看你是否愿意作为我们 BN 系统 1.0 的主程或技术顾问参与。

可以啊,我看你查看了我的联系方式,上面是 wx

头像
等级4

我上个月刚做过一个这个项目,是vue+electron的,小红书不好弄,而且脚本维护起来需要专人维护

多谢分享经验🙏
我这边是做后台舆情系统,不是桌面版工具,部署在服务器端,后面要接 PostgreSQL 和自动化调度。
小红书这块我也知道比较费劲,目前第一阶段优先做抖音 / 微博 / 公众号,量级也不会拉太猛。
有空可以交流一下你那边维护成本和反爬策略,我这边如果后面做桌面侧工具,再考虑跟您合作。