视频招聘会 首页 活动大厅

爬虫工程师

中教智选教育科技

刷新于:2022-07-29

8千-1.5万元/月

  • 五险一金
  • 带薪年假
  • 绩效奖金
  • 零食下午茶

大专 / 2年及以上 / 语言不限 / 性别不限

渝中区-大坪 (重庆渝中区大坪康德国际5A甲级写字楼23-4) 上班路线查询

招聘1人

职位发布人:陈老师 人力资源
投递简历

公司简介

中国教育在线(www.eol.cn)依托CERNET创建于2001年,主要以市场化模式,为社会各界提供各种专业的教育信息服务。中国教育在线服务内容与领域覆盖了从学前到中小学,以及大学阶段的各种信息服务。CERNET是中国第一个互联网,也是中国教育信息化服务平台。2000年,经国家相关部门批准,组建赛尔网络有限公司,负责CERNET的日常运营与服务。2011年,为进一步提高服务质量,拓展服务内容与领域,赛尔网络有限公司与相关方面组建赛尔互联(北京)教育科技有限公司,全面负责中国教育在线的运营服务。

学业桥(www.daxue.cn)是中国教育在线旗下高中教育品牌,在中国教育在线传统优势基础之上,整合优质资源,建立学生发展指导服务平台,为学生、家长、行业伙伴、大中院校及社会各界提供开放式综合服务。

依托同步考试院最新数据的强大数据库,结合互联网与信息分析技术,构建数据全面、功能实用的志愿模拟填报系统,为考生和家长提供志愿填报信息参考,配套生涯测评、智能选科、专业探索、职能探索功能,助力中国学生学业发展。

中教智选(重庆)教育科技有限公司作为学业桥运营服务商,立足重庆本土,同北京公司南北相望,构建起辐射全国的教育信息与产品服务网络,致力成为推动教育前进的力量。

岗位职责

岗位职责:

1.负责内容相关的数据抓取和清洗工作;

2.推进抓取架构的完善,不断提升系统的准确性、实时性;

3.配合后端完成运营平台的相关开发。

4.负责记录的定向爬取、深度提取和挖掘。

5.设计爬虫策略和防屏蔽规则提升抓取效率和质量;

职位要求:

1.有python研发经验,2年以上数据抓取工作经验;熟悉linux开发环境;

2.有扎实的算法和数据结构能力;

3.熟悉爬虫原理,熟悉常见的反爬虫技术,有爬虫相关项目开发经验者优先;

4.掌握http协议,熟悉html、dom、xpath等常见的数据抽取技术;

5.精通任意一种开源爬虫框架,比如scrapy、nutch等等,有开发爬虫框架经验优先;

6.熟悉验证码识别技术者优先;

7.有大规模数据处理、数据挖掘、信息提取等经验者优先;

8.承担较大的工作压力,具有良好的沟通和团队协作能力;有一定的数据基础,工作条理清楚,善于学习。

中教智选教育科技

中教智选(重庆)教育科技有限公司

中国教育在线-中国最大教育门户网站
  • 行业教育培训
  • 性质民营
  • 规模50人以下