摘要: 一、地址分词 将地址字符串中的省市区县、街道、道路、小区、楼栋、单元、户室的等地理要素解析出来。并且对书写不规范的行政区进行修正,如“北京”会修正为“北京市” 二、自定义词库加载 每个单位都有一套自己的地理词库,为了在使用中让程序使用自己标准地址词库可以在初始化时加载自定义词库。完成自定义词库后,不论是地址分词还是地址关联都是依据自定义词库进行计算,完美匹配各单位自定义地址标准不一致的问题。 三、构建中文标准地址库 对于一些质量不高的标准化地址,为了节省人工构建标准地址库的成本,可以对低质量的标准地址进行自动化的分析和建库,提高标准地址质量。 四、普通地址关联标准地址算法 现实世界中,每个人或者每个单位对地址的书写或规范不一致,导致同一个地址会有多种不同的书写方法。将各种不同的写法统一到一条标准地址中。 五、快递地址自动解析省市区县以及名称电话和邮编等 随着快递行业的兴起,有大量读取快递地址面单的需求,需要自动化识别上面的人名、电话、地址等信息。自动化识别文本中的地址、人名、电话、邮编等。并且对地址的行政区进行修正和补充。 六、自动补充行政区划 阅读全文
posted @ 2024-03-28 21:17 addresstool 阅读(9) 评论(0) 推荐(0) 编辑
摘要: 一、地址分词 将地址字符串中的省市区县、街道、道路、小区、楼栋、单元、户室的等地理要素解析出来。并且对书写不规范的行政区进行修正,如“北京”会修正为“北京市” 二、自定义词库加载 每个单位都有一套自己的地理词库,为了在使用中让程序使用自己标准地址词库可以在初始化时加载自定义词库。完成自定义词库后,不论是地址分词还是地址关联都是依据自定义词库进行计算,完美匹配各单位自定义地址标准不一致的问题。 三、构建中文标准地址库 对于一些质量不高的标准化地址,为了节省人工构建标准地址库的成本,可以对低质量的标准地址进行自动化的分析和建库,提高标准地址质量。 四、普通地址关联标准地址算法 现实世界中,每个人或者每个单位对地址的书写或规范不一致,导致同一个地址会有多种不同的书写方法。将各种不同的写法统一到一条标准地址中。 五、快递地址自动解析省市区县以及名称电话和邮编等 随着快递行业的兴起,有大量读取快递地址面单的需求,需要自动化识别上面的人名、电话、地址等信息。自动化识别文本中的地址、人名、电话、邮编等。并且对地址的行政区进行修正和补充。 六、自动补充行政区划 阅读全文
posted @ 2024-03-28 21:12 addresstool 阅读(151) 评论(0) 推荐(0) 编辑