会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
右介
博客园
首页
新随笔
联系
订阅
管理
2017年6月27日
Python 自用代码(某方标准类网页源代码清洗)
摘要: 用于mongodb中“标准”数据的清洗,数据为网页源代码,须从中提取: 标准名称,标准外文名称,标准编号,发布单位,发布日期,状态,实施日期,开本页数,采用关系,中图分类号,中国标准分类号,国际标准分类号,国别,关键词,摘要,替代标准。 提取后组成字典存入另一集合。
阅读全文
posted @ 2017-06-27 17:01 右介
阅读(444)
评论(0)
推荐(0)
公告