招聘&找人【招满】找工具开发团队,定制转换器,专检资料爬取,爬虫

头像
178****1845
239阅读18评论

修车神汽(广州)科技有限公司 价格一千以上 交付时间 如果可以的话一个月内厉害的话你随意,付款方式:按合同
需求:本地安装一个资料包软件,用IE或Chrome浏览器打开首页,爬取这个网页及其子网页数据,按给出的格式要求转换。

网页一般有好几种格式,比如:

  1. 有一个index.html入口,通常是左侧一个树状目录结构,点击树状的叶子节点,右边就会显示内容;
  2. 有一个index.html入口,页面显示一个列表,点击列表可以进入子页面,子页面又又列表,点击列表可以进入子页面,直到进入叶子页面;

转换要求:

  1. 把树状目录结构解析成一个json文件,文件名称为meta.json,另存到1个新目录B;
  2. 把叶子页面的html文件及图片放到新目录B,并保证文件名称唯一;
  3. html文件内的<a>链接、img图片、link、script、embed等元素要变成新的地址;
  4. Html文件中能<a>链接、img图片、link等元素,跳转的到其他文件也同样要处理;
  5. 如果<a>链接、link等元素链接寻找不到,要把href置为#;
  6. 如果img图片等元素链接寻找不到,要把此元素删除掉(只删除此元素);

最后修改于

招聘类型:
职业:
工作方式:
城市:
需消耗电量 5
收藏
举报
充电支持Ta
精选评论
头像
等级0

加我,可以聊聊。我爬虫多年。

你好啊,我想拜师,你收不收徒弟啊,有一定的基础,好学,就是问题有点多,拜托拜托

头像
等级3

昨天不是发了一个吗,怎么删除了,今天又发?

你这个一样的,没说价格,社区规则就是这样,你可以写个大概的范围

价格跳跃太大了,写不了,写低了没人理,写多了自己又被割

头像
等级0

专业爬虫,有过往的案例,欢迎来聊

头像
等级0

加我,把网站发我,顺带聊聊价格

头像
等级0

聊一下,前期谈拢了,开工后广州市内可以面谈细节包括驻场。

你好啊,我想拜师,你收不收徒弟啊,有一定的基础,好学,就是问题有点多,拜托拜托

头像
等级0

最近正好无聊,采集这块做了好几年了。容易的话 一千块给你做了

头像
等级1

找到了吗亲 可以聊一下我也做过的

头像
等级0

你好,我做过类似的项目,问题不大,细节可以详谈,欢迎联系

头像共建者
等级8

感谢你能给社区同学带来工作机会。

友情提示,请参考社区规则:https://eleduck.com/posts/6GzfGe
认真对待你的招聘帖子内容:公司/项目介绍、交付周期、预算、支付方式等。

换位思考,没有这些信息,用户将很难判断自己是否应该申请;与其在之后的环节给每个人都一一解释一遍,还不如直接在帖子里写清楚,沟通效率更高。

请在当日内尽快补充完善,不符则删,希望您能理解:)