数据采集综合实践

项目介绍:来财 - 县级粒度高精度人口预测与分析系统

项目背景

全球正经历深刻的人口结构转型,核心特征为生育率普遍下降与“人口红利”窗口收窄。发达国家面临老龄化与劳动力萎缩的挑战,而许多发展中国家,包括传统高生育率地区,生育率也出现显著下降趋势。

聚焦福建省福州市,其人口变化呈现总体下降且区域差异显著的特点。2016至2023年间,全市出生人口从10.3万降至9.1万,但不同区县降幅悬殊。例如,核心城区鼓楼区降幅约为30%,而县级市福清市降幅高达42%。这种巨大差异表明,驱动生育行为的社会经济文化因素(如房价、教育压力、职业发展、侨乡经济、文化传统等)具有强烈的空间异质性。

项目目标

开发一套新系统,能够在县级粒度上实现高精度人口预测,并能科学融合多源数据、量化分析各类政策及区域性因素对生育决策的复杂影响。

技术路线

  • 前端: React + React Router + ECharts
  • 后端: Flask + MySQL + Redis
  • 算法: 本地Qwen2.5-7B + LoRA + 4-bit量化
  • 部署: 系统部署在本机

团队成员

学号 姓名
102302124 严涛
102302126 李坤铭
102302138 林楚涵
102302136 林伟杰
102302116 田自豪
102302114 比山布·努尔兰

项目具体目标与成果

1. 出生人口预测

  • 数据: 以2015-2023年福州市13区县为样本。
  • 模型: 构建“出生+政策+GDP”多变量LSTM模型。
  • 指标:
    • 县级出生人口预测平均绝对百分比误差(MAPE)≤ 7%。
    • 单县预测响应时间 < 200ms。

2. 政策强度量化

  • 语料: 以2015-2023年政策文本为语料。
  • 方法: 关键词权重法量化政策强度(0-1区间)。
  • 指标:
    • 政策强度与出生人口的相关系数 ≥ 0.80。
    • 方法可解释、无外部API依赖。

3. 经济-人口双向分析

  • 人口→GDP: 通过线性回归分析,得出每增加1万人,GDP增加1.83亿元。
  • GDP→出生: 分析显示GDP增速每增加1%,下一年出生人口增加1715人(存在滞后1-3年的效应)。

4. 动态阈值警报

  • 阈值设定: 近5年出生人口均值 × 0.8,阈值每年自动刷新。
  • 性能: 警报响应时间 < 200ms。
  • 可访问性: 公网可点击访问。

参考文献

  1. 福州市统计局. (2015-2023). 福州统计年鉴[EB/OL]. https://tjj.fuzhou.gov.cn
  2. 福建省统计局. (2015-2023). 福建省国民经济和社会发展统计公报[EB/OL]. https://tjj.fujian.gov.cn
  3. 福州市卫生健康委员会. (2015-2023). 福州市卫生健康统计公报[EB/OL]. https://wjw.fuzhou.gov.cn

个人分工与职责

  • 担任角色: PPT制作与项目汇报人

  • 核心职责:

    1. 项目PPT制作: 负责将团队的技术文档、数据分析结果和模型指标(如县级预测MAPE≤7%,政策相关系数≥0.80等)进行提炼、整合与可视化,转化为逻辑清晰、重点突出的演讲型PPT。
    2. 最终汇报答辩: 作为项目主讲人,负责在最终答辩环节向老师和同学清晰地阐述项目背景、技术路线和核心成果,并回答相关问题。
  • 工作简述: 我的工作主要位于项目流程的末端,核心任务是将团队成员在技术开发、数据分析和算法建模上的复杂工作,通过PPT和演讲的形式,高效、准确地呈现给听众,确保项目的价值得以充分展示。

posted @ 2025-12-30 20:55  田自豪  阅读(4)  评论(0)    收藏  举报