摘要: 用于mongodb中“标准”数据的清洗,数据为网页源代码,须从中提取: 标准名称,标准外文名称,标准编号,发布单位,发布日期,状态,实施日期,开本页数,采用关系,中图分类号,中国标准分类号,国际标准分类号,国别,关键词,摘要,替代标准。 提取后组成字典存入另一集合。 阅读全文
posted @ 2017-06-27 17:01 右介 阅读(444) 评论(0) 推荐(0)