如何进行地址标准化建库和地址关联?
地址标准化工具(addresstool)以超强的NLP算法实力所沉淀出的高性能及高准确率的标准地址算法服务。该地址算法服务能解决一地多名,地址识别等多种问题,为企业,政府机关以及开发者提供地址数据清洗,地址标准化能力,使地址数据更好的为业务提供支持。
addresstool特点
准确率高:持续优化迭代,算法准确率高
超强性能:即可以单机服务部署,也可以大数据环境部署,稳定承载海量数据。
部署灵活:所有Java环境都可以进行安装部署。
基础服务
1.快递地址识别
从快递地址文本中提取出地址片段。将碎片化的地址信息提取归类。去除地址信息以外的信息杂质,抽取后的地址规范标准。
例如从文章文本,快递物流运单,案件卷宗,客服聊天记录等信息中抽取地址数据,并且纠错之后输出标准化地址数据。
2.姓名抽取
有些业务场景需要从物流单据的地址信息中提取出收件人和寄件人的姓名信息使用,这样的需求可以通过姓名抽取功能完成。
该服务可以从物流运单中精准识别,并且抽取姓名片段,直接剔除除了真人姓名之外的其他地址信息。
3.电话号码抽取
和姓名抽取类似,一些场景中,需要提取收件人和寄件人的联络电话号码,此种需求则可以通过电话号码抽取来满足。
该服务可以从物流运单中精准识别,抽取手机或者固话文本信息。将其他的信息都剔除干净。
电话号码抽取以及姓名抽取两项服务经常会联用,抽取收寄件人名以及联系方式。
4.行政区划解析
该项服务可以根据输入的地址,识别出所对应的行政区划。同时,行政区划识别支持对缺失的行政区划进行补全,最终系统会输出的内容是: 省+ 市 + 区+ 街道等。
5.邮编识别
输入地址,输出地址所对应的邮政编码,默认细化到区县级别。
地址文本标准化
1.地址补全
地址补全是指对用户原始输入地址片段,包括其缺失的行政区划(省/市/区/街道)、路名、路号进行片段信息补充,支持对行政区划的变迁纠正,从而将地址还原成完整地址的服务。
2.标准地址库建设
根据已有的业务地址,进行清洗、标准化、建库等操作,生成高质量的标准地址库。
3.门址标准化
对用户原始地址,包括缺省地址信息进行补全,同时对行政区划(省/市/区/街道)及路名、路号等错误信息,修改成正确结果,从而对标准地名信息的规范标准化的服务。
4.智能匹配标准地址
根据业务地址中的关键信息如门牌号、小区名或关键词,锁定标准地址库中对应的一条标准地址,并附带标准地址相应的属性信息,如坐标、标签等。
如果想了解更多addresstool用法,欢迎关注我的博客
java资源下载
源码学习
https://gitee.com/addresstool/address
使用中有问题或者建议,欢迎联系邮箱addresstool@163.com
浙公网安备 33010602011771号