到岗时间:1个月之内
婚况要求:不限婚况
岗位职责:1、负责大规模爬虫系统的核心技术研究和开发2、负责优化链接质量模型,区分全网资源的价值,优化链接库质量、抓取调度算法策略3、负责研究各种网站、网页、链接的形态属性,发现它们的特点和规律4、负责时效性网页、无效等页面识别以及死链接探测等工作任职要求:1、精通C 、Java或者python编程语言,熟悉linux平台、shell编程3、有海量数据处理工作经验,熟悉hadoop/spark等经验者优先4、有网页抓取、新链接重要度分析、时效性网页挖掘工作经验者优先5、有机器学习、深度学习经验者优先base:深圳宝安/北京朝阳
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。