天天看点

拟合平滑曲线图_【2019年第18号】基于曲线拟合模型的总和生育率与出生率关系研究...

拟合平滑曲线图_【2019年第18号】基于曲线拟合模型的总和生育率与出生率关系研究...

作者简介

拟合平滑曲线图_【2019年第18号】基于曲线拟合模型的总和生育率与出生率关系研究...

朱宝生

常州工程职业技术学院

副教授

北京大学高级访问学者

拟合平滑曲线图_【2019年第18号】基于曲线拟合模型的总和生育率与出生率关系研究...

乔晓春

北京大学人口研究所

教授、博士生导师

中国人口学会副会长

拟合平滑曲线图_【2019年第18号】基于曲线拟合模型的总和生育率与出生率关系研究...

引言

一定时期内人口生育水平的高低,是通过一系列生育统计指标来描述的,具体可分为人口出生率和生育率两大系列,出生率和生育率均为人口学最基本的指标。

总和生育率是比出生率更好的指标,因为它不受年龄结构影响,可以用来测量生育水平。然而,在中国官方人口统计中除了每隔10年进行的人口普查和每隔5年进行的“小普查”以外,人们是得不到总和生育率数据的,但官方却可以通过每年一度的人口变动抽样调查估计出历年全国和各省市自治区的出生率数据,而且这一结果会在各地年度“国民经济和社会发展统计公报”中公开发表。

针对这一情况,本文基于总和生育率与出生率的函数关系假设,利用人口统计数据研究总和生育率与出生率的关系系数(K值)的变化情况,从而研究利用出生率来估算总和生育率的可行性。

数据与方法

本研究所使用的数据来源于国家统计局的《中国人口年鉴》、《中国人口统计年鉴》和《中国人口和就业统计年鉴》,共获得了1980年至2015年近三十六年的数据。其中1980年至1985年及1987年提供的是已婚育龄妇女分孩次年龄别生育率数据,其它年份提供了平均总人口数、分年龄别育龄妇女人数和对应的分年龄别出生人口数(活产数)。

1.关系系数K值的计算

根据获取数据的不同情况,分别采用三种方法计算关系系数K值:

(1)根据总和生育率与出生率确定性函数关系推导的公式计算,这是本文的研究重点;

(2)根据获得的分年龄别生育率数据,直接计算得出总和生育率,然后根据相应年份的出生率数据计算求出两者之间的关系系数;

(3)人口统计数据缺失年份,可以通过移动平均算法,利用已知的相邻年份的K值估算出缺失数据年份的K值。

根据总和生育率与出生率确定性函数关系假设推导出的K值计算公式:

拟合平滑曲线图_【2019年第18号】基于曲线拟合模型的总和生育率与出生率关系研究...

上述公式中的变量定义:CX表示分年龄别育龄妇女的结构、hX表示标准生育模式、X表示年龄别、WX表示分年龄别育龄妇女人数、B表示出生人口数(活产数)、BX表示分年龄别出生人口数(分年龄别活产数)、P表示平均总人口数。

2. 缺失K值处理及离散点拟合趋势曲线绘制

对数据缺失年份K值的计算,采用改进的移动平均方法,用已知年份的K值估算缺失的K值,并把已经算出的缺失值作为计算其它未知缺失值的已知值,逐步算出所有的缺失值。

利用三种方法求出各个年份的K值,然后构成K值离散点时序列,通过图表分析软件,采用带平滑的离散点函数拟合曲线绘制K值随着时间变化的趋势曲线图形,并通过该曲线图形变化趋势,观察分析K值随时间的变化规律,通过K值时间序列离散点拟合趋势曲线图的分析,研究K值估算方法的效果。

研究结论

第一,已知某一年某地区平均总人口数、分年龄别妇女人数和对应分年龄别活产数的数据,就可以计算出总和生育率与粗出生率之间的关系因子系数K值,这样就可以通过官方公布的粗出生率数据求出每年的总和生育率数据,而且通过这种方法求出的非普查年份的总和生育率数据比原来用普查年份数据代替求出的要准。

拟合平滑曲线图_【2019年第18号】基于曲线拟合模型的总和生育率与出生率关系研究...

图1  有缺失值的K值趋势图

拟合平滑曲线图_【2019年第18号】基于曲线拟合模型的总和生育率与出生率关系研究...

图2  添加了估算值的K值拟合曲线图

第二,通过EXCEL、MATLAB或SPSS等图表分析软件系统,用带平滑的离散点函数拟合方法,可以绘制出K值随着时间年份变化的曲线趋势图,通过观察分析曲线图形变化趋势,发现拟合曲线始终围绕K值离散数据点上下波动,偏离实际值的距离不大,且无特别的奇异点和大的随机波动出现,K值曲线随着时间规则地平稳变化。

第三,利用移动平均算法可以估算缺失的K值,通过分析K值离散点拟合曲线图,发现K值随着时间年份的变化比较平和稳定,再通过研究K值的计算公式,也发现相邻年份之间K值温和变化的特性,因此可以利用相邻年份的已知K值,通过改进的移动平均算法计算出缺失的K值,可以看出用移动平均算法求出的K值,与原来K值的差在原来K值中的比重很小,这个误差相对于原有K值可以忽略,因此可以认为利用已有的相邻年份的K值,采用移动平均算法估算缺失年份的K值是合理有效的,可以利用已经求出的K值估算时间序列内部缺失的K值。

第四,根据出生率与总和生育率具有确定性函数关系的假定,求出的K值具有相邻年份之间温和变化、K值趋势线稳定变化、具有时间变化规律等特性,这些特性表明本文的假设是合理可行的。

分析讨论

为了研究K值的趋势和变化规律,检验K值估算方法的效果,本文采用带平滑的离散点函数拟合曲线绘制K值随着时间变化的趋势曲线,并通过拟合曲线图形变化趋势,分析K值随着时间变化的趋势和规律。研究发现K值拟合曲线图变化比较平缓,K值计算公式在邻近年份变化相对稳定。因此可以认为利用移动平均算法估算缺失K值是合理有效的,可以利用已经求出的K值估算时间序列内部缺失的K值。

为了保证数据计算的精度,在利用移动平均算法计算缺失的K值时候,应该尽可能地利用已知的相邻年份的K值来计算缺失的K值,避免过多地利用估计值来计算缺失的K值,这样求出的缺失K值更多地依赖于实际数据,求出的缺失数据与相邻年份数据的关联度高,精度也会提高。

由于根据分年龄生育率数据和出生率数据计算K值的方法比较简单,是直接利用总和生育率与出生率确定性函数关系这个假设来计算K值的,缺乏中间的计算推导过程,因此通过这种方法很难发现K值与哪些因素有关,很难分析K值的大小受哪些因素的影响。如果官方的统计数据有漏报情况出现,这种方法计算的K值就会有误差。

根据本文的研究可以看出,如果能够发现K值随着时间年份变化的规律,就能够方便地进行总和生育率与出生率之间的相互转化,因此研究K值的时间变化规律是今后需要进一步研究的方向。

拟合平滑曲线图_【2019年第18号】基于曲线拟合模型的总和生育率与出生率关系研究...

文章来源:朱宝生,乔晓春. 基于曲线拟合模型的总和生育率与出生率关系研究[J].人口与发展,2018,(05):63-71.

本文获原作者授权推介,有删减。

声明:本文仅代表作者观点,不代表人口青专会的立场。

封面图片来源于网络,有修改,版权归原作者所有。

END

往期精彩

【2019年第17号】首都圈流动人口空间分布特征及政策启示

【2019年第16号】完善非京籍随迁子女教育政策的建议

【2019年第15号】改革开放40年我国老龄化的国家治理:成就、问题与现代化路径

【2019年第14号】中国老年人生活自理能力的纵向动态研究

【2019年第13号】延迟退休的适用性矩阵:对不同行业和岗位的分析

拟合平滑曲线图_【2019年第18号】基于曲线拟合模型的总和生育率与出生率关系研究...
拟合平滑曲线图_【2019年第18号】基于曲线拟合模型的总和生育率与出生率关系研究...

编辑:闫萍  石万里  尹德挺

拟合平滑曲线图_【2019年第18号】基于曲线拟合模型的总和生育率与出生率关系研究...

人口青专会

中国人口学会青年学者专业委员会的新媒体平台