摘要: 一、数据层融合 通过统一的数据格式来描述各个异构数据源。采用中间件整合的形式,利用轻量级的JSON来描述格式进行数据格式转换,以消除底层数据源之间的异构问题,实现多个数据源的统一访问。多源异构数据融合的关键在于语法异构和语义异构,本文使用JSON Schema来对数据源进行映射,来消除数据类型异构。 阅读全文
posted @ 2023-09-21 22:36 我太想努力了 阅读(349) 评论(0) 推荐(0) 编辑
摘要: 语言:Python 功能: 1、清洗CSV文件中重复数据。 2、保存为CSV文件 大体流程: 1、首先观察CSV文件中的数据布局格式如何? 2、通过csv包读取数据。并根据规则使用continue,来跳过本次循环,并将所需数据保存到列表A中,当列表A中的数据变成len(列表A) == 2时,将此数据 阅读全文
posted @ 2023-09-21 22:33 我太想努力了 阅读(408) 评论(0) 推荐(0) 编辑