2021.10.10 企业发票异常分析

一、今日学习内容

1数据组成

1增值税发票数据,文件名zzsfp

2发票对应货物明细数据,文件名zzsfp_hwmx

3企业信息,文件名nsrxx

2数据字段说明

1zzsfp字典

字段名称

字段含义

数据类型

备注

fp_nid

发票id

String

发票唯一标识

xf_id

销方识别号

String

企业唯一身份标识

gf_id

购方识别号

String

企业唯一身份标识

je

金额

Double

 

se

税额

Double

 

jshj

价税合计

Double

 

kpyf

开票月份

String

 

kprq

开票日期

String

 

zfbz

作废标志

String

‘Y’代表作废

2zzsfp_hwmx

字段名称

字段含义

数据类型

备注

fp_nid

发票id

String

发票唯一标识

date_key

开票月份

String

 

hwmc

货物名称

String

 

ggxh

规格型号

String

 

dw

单位

String

 

sl

数量

Double

 

dj

单价

Double

 

je

金额

Double

 

se

税额

Double

 

spbm

商品编码

String

 

3nsrxx

字段名称

字段含义

数据类型

备注

hydm

行业代码

String

 

nsr_id

纳税人id

String

企业唯一身份标识

djzclx_dm

登记注册类型代码

String

网上可查阅相关代码含义

kydjrq

开业登记日期

String

 

xgrq

修改日期

String

给企业打标签的时间

label

标签

String

‘0’代表正常企业

‘1’代表问题企业

3关联数据的必要说明

1zzsfp表可通过fp_nid进行关联

2zzsfp表可通过xf_id或者gf_idnsrxx中的nsr_id进行关联,分离出销项发票表和进项发票表

一、 测试要求

1、数据导入:

要求三个样表文件中的数据导入HIVE数据仓库中。

2、数据分析

企业异常的判断标准参考:

1)、企业增值税发票进项与出项严重不符即出现只出不进或者只进不出的企业;

2)企业发票数据与详细流水信息不符;

3)个人上网查阅企业异常信息数据标准;

 

 

二、遇到的问题

   出现了很多问题,比如数据分析方法模糊

三、明日计划

  明天继续完成

posted @ 2021-10-10 20:51  小仙女W  阅读(193)  评论(0编辑  收藏  举报