御风破冰

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2017年12月15日

摘要: 背景:为从海量公司招聘信息中提取有用信息,为精准推荐做准备,需要对发布招聘信息的各公司所属的行业进行自动分类,使得给定公司文本基本信息,实现所属行业的自动分类预测。 方法:利用爬虫爬取各行业下公司的名称,以公司名称为索引,检索包含各公司基本信息的数据库文件,提取各公司文本数据信息,生成原始训练数据集 阅读全文
posted @ 2017-12-15 16:48 御风破冰 阅读(198) 评论(0) 推荐(0)