数据采集综合实践
项目介绍:来财 - 县级粒度高精度人口预测与分析系统
项目背景
全球正经历深刻的人口结构转型,核心特征为生育率普遍下降与“人口红利”窗口收窄。发达国家面临老龄化与劳动力萎缩的挑战,而许多发展中国家,包括传统高生育率地区,生育率也出现显著下降趋势。
聚焦福建省福州市,其人口变化呈现总体下降且区域差异显著的特点。2016至2023年间,全市出生人口从10.3万降至9.1万,但不同区县降幅悬殊。例如,核心城区鼓楼区降幅约为30%,而县级市福清市降幅高达42%。这种巨大差异表明,驱动生育行为的社会经济文化因素(如房价、教育压力、职业发展、侨乡经济、文化传统等)具有强烈的空间异质性。
项目目标
开发一套新系统,能够在县级粒度上实现高精度人口预测,并能科学融合多源数据、量化分析各类政策及区域性因素对生育决策的复杂影响。
技术路线
- 前端: React + React Router + ECharts
- 后端: Flask + MySQL + Redis
- 算法: 本地Qwen2.5-7B + LoRA + 4-bit量化
- 部署: 系统部署在本机
团队成员
| 学号 | 姓名 |
|---|---|
| 102302124 | 严涛 |
| 102302126 | 李坤铭 |
| 102302138 | 林楚涵 |
| 102302136 | 林伟杰 |
| 102302116 | 田自豪 |
| 102302114 | 比山布·努尔兰 |
项目具体目标与成果
1. 出生人口预测
- 数据: 以2015-2023年福州市13区县为样本。
- 模型: 构建“出生+政策+GDP”多变量LSTM模型。
- 指标:
- 县级出生人口预测平均绝对百分比误差(MAPE)≤ 7%。
- 单县预测响应时间 < 200ms。
2. 政策强度量化
- 语料: 以2015-2023年政策文本为语料。
- 方法: 关键词权重法量化政策强度(0-1区间)。
- 指标:
- 政策强度与出生人口的相关系数 ≥ 0.80。
- 方法可解释、无外部API依赖。
3. 经济-人口双向分析
- 人口→GDP: 通过线性回归分析,得出每增加1万人,GDP增加1.83亿元。
- GDP→出生: 分析显示GDP增速每增加1%,下一年出生人口增加1715人(存在滞后1-3年的效应)。
4. 动态阈值警报
- 阈值设定: 近5年出生人口均值 × 0.8,阈值每年自动刷新。
- 性能: 警报响应时间 < 200ms。
- 可访问性: 公网可点击访问。
参考文献
- 福州市统计局. (2015-2023). 福州统计年鉴[EB/OL]. https://tjj.fuzhou.gov.cn
- 福建省统计局. (2015-2023). 福建省国民经济和社会发展统计公报[EB/OL]. https://tjj.fujian.gov.cn
- 福州市卫生健康委员会. (2015-2023). 福州市卫生健康统计公报[EB/OL]. https://wjw.fuzhou.gov.cn
个人分工与职责
-
担任角色: PPT制作与项目汇报人
-
核心职责:
- 项目PPT制作: 负责将团队的技术文档、数据分析结果和模型指标(如县级预测MAPE≤7%,政策相关系数≥0.80等)进行提炼、整合与可视化,转化为逻辑清晰、重点突出的演讲型PPT。
- 最终汇报答辩: 作为项目主讲人,负责在最终答辩环节向老师和同学清晰地阐述项目背景、技术路线和核心成果,并回答相关问题。
-
工作简述: 我的工作主要位于项目流程的末端,核心任务是将团队成员在技术开发、数据分析和算法建模上的复杂工作,通过PPT和演讲的形式,高效、准确地呈现给听众,确保项目的价值得以充分展示。
浙公网安备 33010602011771号