摘要:背景:为从海量公司招聘信息中提取有用信息,为精准推荐做准备,需要对发布招聘信息的各公司所属的行业进行自动分类,使得给定公司文本基本信息,实现所属行业的自动分类预测。 方法:利用爬虫爬取各行业下公司的名称,以公司名称为索引,检索包含各公司基本信息的数据库文件,提取各公司文本数据信息,生成原始训练数据集
阅读全文
文章分类 - Machine Learning
摘要:背景:为从海量公司招聘信息中提取有用信息,为精准推荐做准备,需要对发布招聘信息的各公司所属的行业进行自动分类,使得给定公司文本基本信息,实现所属行业的自动分类预测。 方法:利用爬虫爬取各行业下公司的名称,以公司名称为索引,检索包含各公司基本信息的数据库文件,提取各公司文本数据信息,生成原始训练数据集
阅读全文
|