地球信息科学学报  2016 , 18 (9): 1167-1173 https://doi.org/10.3724/SP.J.1047.2016.01167

地球信息科学理论与方法

最小二乘法估算Pearson-Ⅲ型分布参数的改进

袁典1, 陈军1**, 卿清涛2, 邓国卫2, 李玉婷1

1. 成都信息工程大学资源与环境学院,成都 610225
2. 四川省局气候中心,成都 610071

The Improvements in Estimating Parameters of Pearson-Ⅲ Distribution Based on the Least Squares Method

YUAN Dian1, CHEN Jun1*, QING Qingtao2, DENG Guowei2, LI Yuting1

1. College of Resources and Environment, Chengdu University of Information Technology, Chengdu 610225, China
2. Climate Center of Sichuan Province, Chengdu 610771, China

通讯作者:  *通讯作者:陈军(1979-),男,四川南充人,博士,副教授,研究方向为遥感与GIS技术。E-mail: 494834920@qq.com

收稿日期: 2015-11-25

修回日期:  2016-02-20

网络出版日期:  2016-09-27

版权声明:  2016 《地球信息科学学报》编辑部 《地球信息科学学报》编辑部 所有

基金资助:  四川省教育厅项目(15ZB0184)四川省国土资源厅科学研究计划(KJ-2015-18)威海市科学技术发展计划项目“威海市暴雨次生灾害预报预警系统研究”(2014GNS014)

作者简介:

作者简介:袁典(1992-),男,湖北荆州人,硕士生,研究方向为3S集成与气象应用。E-mail: 837513724@qq.com

展开

摘要

Pearson-Ⅲ曲线分布在气象、水文和农业等领域有广泛的应用,其概率密度函数包含形状参数(α)、尺度参数(β)和起始值(α0)3个待估计参数。应用Pearson-Ⅲ分布来估算强度的关键在于这3个参数估算的精度。由于原有最小二乘法在估算参数时未考虑各参数的有效区间,参数α0可能小于0,并导致估算强度出现负值,从而使雨强、水速、水位等强度估算出现异常值。经理论推导证明,若Pearson-Ⅲ概率密度函数中的参数α0非负,则估算出的强度值不会出现负值。以该推导为基础,提出了一种改进的Pearson-Ⅲ分布三参数估算算法。首先根据最小二乘法估算迭代计算一系列参数组合;然后按离差平方和的大小排列各组参数;接着利用各组参数分别计算α0值,过滤使α0小于0的参数组合;最后在剩下的参数中选取离差平方和最小的一组作为最优参数。以估算暴雨风险值作算法测试实验,结果表明改进算法模拟得到的α0值始终大于等于0,估算出的暴雨风险值均在合理范围之内。对比改进算法与传统算法的参数分布拟合检验结果,发现改进算法能使更多的气象站点通过了置信度为0.05的分布拟合检验。因此,利用改进后的算法估算出的Pearson-Ⅲ概率密度函数参数更合理,且强度估算结果更准确,对编制城市暴雨强度公式有一定的参考价值。

关键词: Pearson-Ⅲ ; 最小二乘法 ; 暴雨 ; 参数估算

Abstract

Pearson-Ⅲ distribution is widely applied in various fields such as meteorology, hydrology, agriculture and so on. Pearson-Ⅲ probability density equation has three parameters to be estimated, including the shape parameter of alpha, the scale parameter of beta and the initial parameter of alpha-0. The precision of estimating the three parameters is one of the key focuses when using Pearson-Ⅲ distribution to forecast rainstorm intensity in actual applications. Without considering the effective range, the traditional method used in estimating Pearson-Ⅲ distribution's three parameters may cause alpha-0 to be less than zero, thus making the predicted rainstorm intensity to be negative. This is impossible to happen when predicting the real physical quantities such as the rainstorm intensity, flow velocity, water depth and so on. Strict theoretical derivation has proved in this paper that the results of rainstorm intensity estimation would be nonnegative as long as alpha-0 maintained nonnegative. Based on the above conclusion, an improved algorithm aiming at fixing the drawbacks of the traditional estimation algorithm was proposed in this paper. Firstly, a series of parameters are estimated by iterative calculations based on the Least Square Method. Secondly, the sum of the squared deviations was calculated for each parameter group and each group was sorted by its value for the sum of the squared deviations. On that basis, different alpha-0 values are calculated for each group respectively to exclude groups with negative alpha-0 values. Finally, one group of parameters which has the minimum sum of the squared deviations was selected as the optimal combination for the three parameters of Pearson-Ⅲ. In the end, this algorithm was verified by estimating the rainstorm intensity in Sichuan Province. The result shows that the proposed algorithm can assure the alpha-0 to always be greater than or equal to zero and the value of rainstorm intensity to always be in a reasonable range. Furthermore, it makes more weather stations pass the distribution fit test with a 95% confidence level. In short, the improved algorithm is more reasonable and accurate than the traditional algorithm, and it provides a reference to the preparation of city rainstorm intensity formula.

Keywords: Pearson-Ⅲ ; least square method ; rainstorm intensity ; parameter estimation

0

PDF (1591KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

袁典, 陈军, 卿清涛, 邓国卫, 李玉婷. 最小二乘法估算Pearson-Ⅲ型分布参数的改进[J]. , 2016, 18(9): 1167-1173 https://doi.org/10.3724/SP.J.1047.2016.01167

YUAN Dian, CHEN Jun, QING Qingtao, DENG Guowei, LI Yuting. The Improvements in Estimating Parameters of Pearson-Ⅲ Distribution Based on the Least Squares Method[J]. 地球信息科学学报, 2016, 18(9): 1167-1173 https://doi.org/10.3724/SP.J.1047.2016.01167

1 引言

Pearson-Ⅲ曲线分布又称为Gama分布,是水文、气象和农业等领域常用的一种频率分布模式[1-6]。Pearson-Ⅲ曲线概率密度函数包含3个待定参数 αβα0。大量的数值试验表明,在城市暴雨强度公式编制过程中,统计参数 α0(0,xmin),其中 xmin为某一降雨历时下最小暴雨强度值[7]。同时,利用矩法可将3个待估计参数转换为均值 x̅、变差系数 CvCs偏差系数[8-10]。通常利用最小二乘估算法进行这3个参数的估算,根据理论频率强度与经验频率强度的离差平方和来确定最优拟合参数[9-20]。由于传统算法没有考虑雨强的取值范围,利用传统最小二乘法估算暴雨风险值时,模拟得到的最优拟合参数存在 α0<0的情况,当概率大于某一临界值,反推暴雨强度风险值时,其计算结果出现负值[14]。实际上,对于降水过程而言,雨强应始终大于等于零[19]。因此,则用传统最小二乘法估算的参数来编制城市暴雨强度公式,可能得到不准确的结果。

针对传统算法的弊端,本文提出了一种改进的Pearson-Ⅲ型分布三参数估算算法,该算法以原有的最小二乘估算方法为基础,在最优参数的选择上不仅考虑了经验频率强度和理论频率强度的离差平方和最小,而且顾及了参数 α0的非负性,使参数估算结果更合理,暴雨强度估算更准确,对城市暴雨强度公式的编制有一定的参考价值。

2 Pearson-Ⅲ型分布

Pearson-Ⅲ型曲线的密度函数如式(1)所示。

F(x)=βαΓ(α)(x-α0)α-1e-β(x-α0)xα00x<α0(1)

式中: α为形状参数; β为尺度参数; α0为位置参数[6]。当 x< α0时, F(x)恒为0。 Γ(α)α的伽马函数值[15]。利用矩法可将以上3个原始参数分别变换为统计参数均值 x̅、变差系数 Cv和偏态系数 Cs来表示[11],其变换公式如式(2)[8,11]所示。

α=4Cs2β=2CvCsx̅α0=x̅1-2CvCs(2)

对式(1)两端求积分,得到Pearson-Ⅲ型曲线的概率密度函数,如式(3)所示。

(3)

t=β(x-α0),t0,代式入(3)得式(4)。

(4)

式中: αβα0都为待定参数。其中, tp=β(xp-α0)由式(2)可知,这3个参数的估算可以转化为对 x̅CvCs的估算。引入式(5):

xp=(1+ΦCv)x̅(5)

式中: Φ为离均系数,可由 (P,Cs)-Φ表获得。已知 x̅CvCs后,根据式(5)即可以求出频率强度值。

3 传统最小二乘估算方法及其问题 探讨

3.1 传统最小二乘估算方法

最小二乘法估算Pearson-Ⅲ分布参数的原理为:使实测暴雨强度值 xii=1,2,3,,n,其中 n为某一暴雨历时实测样本总数)与理论暴雨强值 xp的离差平方总和最小[11],即 R=i=1n(xi-xp)2=i=1n(xi-x̅-x̅ΦiCv)2取最小值,对该式求偏导数则有式(6)。依据式(6)便可计算出参数 x̅Cv的解。

Rx̅=0RCv=0(6)

图1(a)为典型的Pearson-Ⅲ型分布的概率密度曲线。图中阴影部分的面积表示频率强度 xxp出现的概率。曲线与坐标轴围成图形的面积为1,也是概率 P(%)的最大值。其中强度值 xp[0,α0]。根据该曲线的分布规律,已知概率 P(%),便可估算出强度值 xp

图1   典型的Pearson-Ⅲ型分布曲线图

Fig.1   Typical Pearson-Ⅲ probability density function curve

传统最小二乘参数估算的过程如图2所示,输入经验频率 P,将 Cs从0开始按一定步长(0.01)增加,然后利用 (P,Cs)-Φ表插值求出离均系数 Φ,再根据式(6)求解出参数 x̅Cv,并根据式(5)计算出理论强度值 xp和离差平方和 R0,最后将 Cs增加一个步长并迭代计算,得出离差平方和 Rii为当前迭代计算的次数),输出最小离差平方和 Rmin所对应的参数 x̅CvCs,该组参数即为Pearson-Ⅲ曲线的最优拟合参数。

图2   传统最小二乘法估算流程图

Fig.2   Parameter estimation flowchart of the traditional method

3.2 传统最小二乘法估算方法问题探讨

图1(b)的Pearson-Ⅲ型分布曲线可看出,当 α0为负,随着 P的增加,阴影部分延伸到 y轴左侧时,其对应的强度值小于0,当暴雨估算概率较大时,估算出的暴雨强度值可能小于0。

本文以四川省156个区域气象站50年的日降水数据为计算样本,利用传统最小二乘参数估算算法,分别估算参数 CvCsx̅(样本均值)和 α0,并以频率99.9%、90%和80%反向推算站点的暴雨极值。结果显示不同的估算概率中,分别有12、4和1个站点计算出的强度超出了正常区间(表1)。从该实验可看出,在估算概率较大时,传统算法估算出的参数 α0可能为负,此时推算的暴雨强度值结果也可能为负值,说明传统算法存在一定的弊端。

表1   传统算法估算降水强度值为负的站点

Tab.1   Sites with negative values estimated by the traditional algorithms

P/(%)站名降水强度/mmCvCsx̅α0
99.9蒲江-27.550.390.15124.32-521.06
龙泉-27.741.071.4461.84-29.86
彭山-6.120.550.8689.35-24.68
99.9丹棱-26.640.510.51116.16-118.36
青神-16.980.470.0698.65-1462.47
屏山-98.740.790.1567.39-638.65
筠连-60.640.650.0875.76-1161.45
攀枝花-15.751.231.6935.59-16.05
仁和-45.370.900.5842.47-89.40
东兴区-13.411.852.4124.92-13.43
泸县-89.880.770.1563.74-589.11
江安-9.470.450.0687.05-1215.97
90.0龙泉-6.311.071.4461.84-29.86
攀枝花-6.851.231.6935.59-16.05
仁和-3.580.900.5842.47-89.40
东兴区-11.711.852.4124.92-13.43
80.0东兴区-8.281.852.4124.92-13.43

新窗口打开

估算出的参数 α0为负值时,根据式(2)可知,必有 Cs<2Cv,即 α0的正负由参数 CsCv共同决定。传统算法中参数 Cv由训练样本根据最小二乘法统计得出,其与参数 Cs之间无显著相关性,即在估算参数前 α0的正负性无法判定,其只与所选的训练样本有关。但根据实例计算结果(表1)可以证明,参数 α0存在负值的情况。王正发[14]利用MATLAB估算离均系数时指出“多数水文资料的最小值大于零,此时一定要: Cs2Cv”,这表明在水文计算中,参数 α0为负值有普遍存在性。故有必要对传统算法作适当的改进,使估算参数 α0均为非负值。

4 最小二乘估算方法的改进方法

综上所述使用Pearson-Ⅲ型分布估算时应使 Cs2Cv,否则估算出的强度可能为负值[14]。根据Pearson-Ⅲ的概率密度函数特征和曲线分布特征(图1)可知,当且仅当 α0<0时( α0为初值), xp才可能出现负值 (xp(α0,+))。因此,算法改进的关键在于对参数 α0的控制,由于 xpα0,若 α00,整个曲线均在 y轴右侧,则必然有 xp0。同时,通过严格的数学推导也证明了上述观点的正确性,具体推导过程如下:

为了证明“当 α00时,必有 xp0”,可以先证明其逆否命题是否成立,即“当 xp<0时,必有 α0<0”。

已知: Cv>0, Cs>0,且均值 x̅>0。由式(2)可推测出参数 α>0β>0

tp=β(xp-α0),由于 xpα0,由于当估算概率 P=100%时,才有 xp=α0,而在实际暴雨估算时概率 P一般取小于100%的值,故可认为 xp>α0。此时可推出 tp>0

已知:离均系数 Φ=xp-x̅x̅Cv=Cs2tp-2Cs,由 Cs>0, tp>0Φ>-2Cs

若存在 xp<0,由式(5)可知 ΦCv<-1,由于 Cv>0Φ<-1Cv,又由于 Φ>-2Cs,故有 -1Cv>-2Cs1-2CvCs<0,由式(2)可推出 α0=x̅1-2CvCs<0

上述论证过程证明,在Pearson-Ⅲ参数的估算中,若使参数 α00,则暴雨风险值估算结果便不会出现负值。故算法主要改进方式为:先过滤 α0<0的部分,然后再根据离差平方和的大小选取最优参数。算法过程描述为:

(1)如图3所示,利用原有最小二乘估算算法,将 Cs从0增加到2.5,步长为0.01,共输出250次迭代计算的拟合参数组合并保存。其中迭代次数250次可根据实际样本数据进行调整,在对四川省所有区域气象站点进行估算时,发现 Cs增加至2.5后离差平方和开始逐渐增加且没有下降趋势,为使得算法计算更高效快捷,迭代次数选取250次。

图3   最小二乘估算方法改进算法

Fig.3   Parameter estimation flowchart of the improved method

(2)对步骤(1)中保存的拟合参数按照离差平方和 RLL=0,1,2,3,,250)由小到大进行排序,排序后由式(2)计算出各组参数对应的 α0ii=0,1,2,,250),比较各组参数中 α0的大小,输出 α0非负且离差平方和 R最小的一组参数 x̅,将 CvCs作为最优拟合参数。

5 改进算法验证

为了作对比验证分析,利用改进后的算法估算出最优参数 CvCsx̅后,依据式(5)分别估算指定频率 P为99.9%、90%和80%的降水强度值,估算结果如表2所示。由表2可知,改进算法估算出的参数 α0均为正值,且降雨强度估算结果均为正,与传统算法相比,改进后算法未出现有异常的站点,故其估算结果更加合理。利用改进后的算对四川省156个区域气象站数据进行估算,同样没有出现异常值的站点,进一步证明了改进后算法的有效性。

表2   改进算法估算指定频率下降水强度结果

Tab.2   Results estimated by the improved algorithm with respect to different frequencies

P/(%)站名降水强度/mmCvCsx̅α0
99.9蒲江26.150.380.77125.180.10
龙泉0.251.092.1862.820.24
彭山7.220.551.1189.720.68
丹棱11.640.521.04116.830.98
青神12.710.470.9599.290.44
屏山1.250.771.5469.180.30
筠连3.300.641.2976.950.29
攀枝花0.301.222.4735.010.30
仁和1.570.921.9144.231.45
东兴区2.000.851.8621.751.95
泸县1.390.741.4965.350.18
江安13.090.450.9187.560.90
90.0龙泉4.911.092.1862.820.23
攀枝花1.611.222.4735.010.30
仁和6.740.921.9144.231.45
东兴区4.650.851.8621.751.95
80.0东兴区7.130.851.8621.751.95

新窗口打开

为了进一步验证算法的改进效果,选取表2中彭山站和丹宁站2个站点,分别绘制算法改进前后的概率密度曲线图(图4)。对比图4中红蓝2条曲线可看出,由于传统算法估算出的初始值为负,故蓝色曲线的开始部分在Y轴左侧。而改进后的算法修正了这些异常,故红色曲线的开始部分均在Y轴右侧。利用改进后算法估算一定频率 P下的暴雨强度时,不会出现负值。

图4   算法改进前后Pearson-Ⅲ概率密度曲线对比图

Fig.4   Comparison of the Pearson-Ⅲ probability density curves between the traditional and the improved algorithms

同样选取四川省156个区域气象站的降水数据作为样本,分别利用传统算法和改进后的算法来估算最优参数。再对2种方法估算的参数结果进行分布拟合检验,其中检验方式为 χ2检验,置信度为0.05,检验公式如式(7)所示。

χ2=i=1k(Z0i-Zi)2Zi(7)

式中: k表示组数; Z0i表示第 i组的观测频数; Zi表示第 i组的理论频数, i=1,2,3,,k

检验结果显示改进算法后共有91个站点通过了检验,传统算法共有85个站点通过了检验,说明改进后的算法在修正了异常值的基础上,并未降低模拟结果的精度,而能使得更多的站点通过置信度为0.05的分布拟合检验。

6 结论

对于Pearson-Ⅲ型分布参数的估算,本文以传统最小二乘估算算法为基础,在结果输出时剔除了使 α0为负值的参数组合,通过对四川省区气象域站年24 h降水最大值估算实例的验证,得出如下结论:

(1)传统算法没有考虑参数本身的取值范围,可能导致暴雨强度推算中出现负值。

(2)若估算参数 α0为非负值,则暴雨强度的推算结果也为非负值,与实际情况相符。

(3)通过实例验证得出,改进后算法估算出的最优参数 α0均为非负值,暴雨推算结果也均为非负值,且改进后的算法能使更多的站点通过置信度为0.05的分布拟合检验。

The authors have declared that no competing interests exist.


参考文献

[1] 陆佳政,张红先,彭继文,.

基于皮尔逊Ⅲ型概率分布的湖南电网覆冰重现期计算

[J].电工技术学报,2013,1(1):80-86.

https://doi.org/10.3969/j.issn.1000-6753.2013.01.012      URL      [本文引用: 1]      摘要

电网覆冰重现期表征了特定覆冰出现的频率,掌握准确的电网覆冰重现期对于电网抗冰工作具有重要作用。利用湖南气象台97个观测站57年的覆冰观测数据,提出了基于皮尔逊Ⅲ型分布的电网覆冰计算方法,计算了湖南地区97个观测站15年一遇、30年一遇、50年一遇和100年一遇冰灾的覆冰日数。结合采用插值法,绘制了全省覆冰日数重现期分布图,该分布图为电网抗冰工作提供了重要技术指导。利用全省的平均覆冰日数,以覆冰日数大于11天为特别严重覆冰的划分方法,开展了特别严重覆冰重现期计算。计算结果表明,湖南地区类似2008年的特别严重覆冰重现期为12.4年,这与过去57年上曾经出现了四次类似特别严重覆冰情况吻合。特别严重覆冰重现期的计算,提升了对电网抵御冰灾重要性的认识。

[ Lu J Z, Zhang H X, Peng J W, et al.

Calculation of hunan power grid icing recurrence interval based on Pearson III type probability distribution

[J]. Transactions of China Electrotechnical Society, 2013,1(1):80-86. ]

https://doi.org/10.3969/j.issn.1000-6753.2013.01.012      URL      [本文引用: 1]      摘要

电网覆冰重现期表征了特定覆冰出现的频率,掌握准确的电网覆冰重现期对于电网抗冰工作具有重要作用。利用湖南气象台97个观测站57年的覆冰观测数据,提出了基于皮尔逊Ⅲ型分布的电网覆冰计算方法,计算了湖南地区97个观测站15年一遇、30年一遇、50年一遇和100年一遇冰灾的覆冰日数。结合采用插值法,绘制了全省覆冰日数重现期分布图,该分布图为电网抗冰工作提供了重要技术指导。利用全省的平均覆冰日数,以覆冰日数大于11天为特别严重覆冰的划分方法,开展了特别严重覆冰重现期计算。计算结果表明,湖南地区类似2008年的特别严重覆冰重现期为12.4年,这与过去57年上曾经出现了四次类似特别严重覆冰情况吻合。特别严重覆冰重现期的计算,提升了对电网抵御冰灾重要性的认识。
[2] 林两位,王莉萍.

用Pearson-Ⅲ概率分布推算重现期年最大日雨量

[J].气象科技,2005,33(4):314-317.

https://doi.org/10.3969/j.issn.1671-6345.2005.04.006      URL      摘要

许多工程的设计需依据给定重现期的降水极值,概率推算是其中一种重要的方法.Pearson-Ⅲ型曲线常用于拟合降水频数分布,该文简要介绍了用Pearson-Ⅲ型概率分布推算重现期年最大日雨量的基本方法.采用漳州市10个测站1961~2003年最大日雨量资料,计算给定重现期的最大日雨量.运用常见的办公软件Excel 2000的函数计算功能,构造Pearson-Ⅲ概率分布函数公式,实现软件的快捷计算.初步结果为:在全市10个站的拟合中,有7个站拟合效果较好,3个站拟合效果较差.文中就提高Pearson-Ⅲ概率分布计算精度方面进行了讨论.

[ Lin L W, Wang L P.

Estimation of annual maximum diurnal precipitation for reappearance periods with Pearson-Ⅲ distribution

[J]. Meteorological Science and Technology, 2005,33(4):314-317. ]

https://doi.org/10.3969/j.issn.1671-6345.2005.04.006      URL      摘要

许多工程的设计需依据给定重现期的降水极值,概率推算是其中一种重要的方法.Pearson-Ⅲ型曲线常用于拟合降水频数分布,该文简要介绍了用Pearson-Ⅲ型概率分布推算重现期年最大日雨量的基本方法.采用漳州市10个测站1961~2003年最大日雨量资料,计算给定重现期的最大日雨量.运用常见的办公软件Excel 2000的函数计算功能,构造Pearson-Ⅲ概率分布函数公式,实现软件的快捷计算.初步结果为:在全市10个站的拟合中,有7个站拟合效果较好,3个站拟合效果较差.文中就提高Pearson-Ⅲ概率分布计算精度方面进行了讨论.
[3] 沈爱华,唐启义.

Pearson-Ⅲ型分布在病虫发生程度评估中的应用

[J].植物保护,2006,32(5):106-109.

https://doi.org/10.3969/j.issn.0529-1542.2006.05.033      URL      摘要

介绍了一种对资料适应性较广的Pearson-Ⅲ型分布,并将其应用于病虫发生程度及损失评估。作者以杭州萧山市2005年9月20~21日褐稻虱高峰虫量普查数据为例,介绍了该分布在病虫发生程度评估中的应用。

[ Sheng A H, Tang Q Y.

Estimation of pest occurrence degree based on Pearson-Ⅲ distribution

[J]. Plant Protection, 2006,32(5):106-109. ]

https://doi.org/10.3969/j.issn.0529-1542.2006.05.033      URL      摘要

介绍了一种对资料适应性较广的Pearson-Ⅲ型分布,并将其应用于病虫发生程度及损失评估。作者以杭州萧山市2005年9月20~21日褐稻虱高峰虫量普查数据为例,介绍了该分布在病虫发生程度评估中的应用。
[4] 徐军昶.

基于ArcGIS的陕西省天气气候极值及其重现期值的时空分布特征研究[D]

.西安:陕西师范大学,2009.

[ Xu J C.

Research about the spatial and temporal characteristics of extreme weather and climate in Shaanxi Province based on ArcGIS[D]. Xi' an:

Shaanxi Normal University, 2009. ]

[5] 陈子全,宋松柏,曾智,.

基于模拟退火算法的皮尔逊Ⅲ型分布参数估计

[J].人民黄河,2012,34(5):14-15.

https://doi.org/10.3969/j.issn.1000-1379.2012.05.006      URL      摘要

以渭河流域3个气象站的年降水量资料为例,采用模拟退火算法按照离差平方和最小准则、离差绝 对值和最小准则、相对离差平方和最小准则对皮尔逊Ⅲ型分布进行参数优化,并与矩法、极大似然法、线性矩法3种常规分布参数估计方法计算结果作对比。结果表 明:模拟退火算法是一种可行的水文频率曲线参数估计方法,其估计精度优于3种常规参数估计方法。

[ Chen Z Q, Song S P, Zeng Z, et al.

Pearson type Ⅲ distribution parameters estimation based on simulated annealing

[J]. Yellow River, 2012,34(5):14-15. ]

https://doi.org/10.3969/j.issn.1000-1379.2012.05.006      URL      摘要

以渭河流域3个气象站的年降水量资料为例,采用模拟退火算法按照离差平方和最小准则、离差绝 对值和最小准则、相对离差平方和最小准则对皮尔逊Ⅲ型分布进行参数优化,并与矩法、极大似然法、线性矩法3种常规分布参数估计方法计算结果作对比。结果表 明:模拟退火算法是一种可行的水文频率曲线参数估计方法,其估计精度优于3种常规参数估计方法。
[6] 邱可森.

三参数Pearson-Ⅲ型分布的一种通用模式及其应用

[J].热带海洋学报,1993,1(1):105-551.

https://doi.org/10.1007/BF02677081      URL      [本文引用: 2]      摘要

本文利用Γ函数的递推公式开拓了双Γ函数的展开式的定义域,并引入黄金分割法,给出了一种通用型的三参数Pearson-Ⅱ型分布极大似然估计方法,最后给出了一个应用实例。

[ Qiu K S.

Parameter estimation of the Pearson-Ⅲ distribution of three parameters of universal type and application

[J]. Tropic Oceanology, 1993,1(1):105-551. ]

https://doi.org/10.1007/BF02677081      URL      [本文引用: 2]      摘要

本文利用Γ函数的递推公式开拓了双Γ函数的展开式的定义域,并引入黄金分割法,给出了一种通用型的三参数Pearson-Ⅱ型分布极大似然估计方法,最后给出了一个应用实例。
[7] 宋茂斌,冯宝平,张展羽.基于遗传算法的皮尔逊Ⅲ型曲线参数估计[J].中国农村水利水电,2008(6):52-54.

URL      [本文引用: 1]      摘要

皮尔逊Ⅲ型频率曲线参数估计时,常用方法有矩法、权函数法和适线法等,这些方法各有缺陷。根据遗传算法全局寻优的原理与特点,采用遗传算法计算皮尔逊Ⅲ型频率曲线的三个参数,并和其他方法进行了对比验证。结果表明,遗传算法得到的频率曲线与实测资料误差小,拟合精度高,是一种较好的计算方法,值得推广应用。

[ Song M B, Feng B P, Zhang Z Y.

Pearson type Ⅲ curve parameter estimations based on genetic algorithm

[J]. China Rural Water and Hydropower, 2008,6:52-54. ]

URL      [本文引用: 1]      摘要

皮尔逊Ⅲ型频率曲线参数估计时,常用方法有矩法、权函数法和适线法等,这些方法各有缺陷。根据遗传算法全局寻优的原理与特点,采用遗传算法计算皮尔逊Ⅲ型频率曲线的三个参数,并和其他方法进行了对比验证。结果表明,遗传算法得到的频率曲线与实测资料误差小,拟合精度高,是一种较好的计算方法,值得推广应用。
[8] 朴芬淑,石莹,傅金祥,.

遗传算法估计皮尔逊-Ⅲ型分布统计参数

[J].沈阳建筑大学学报(自然科学版),2006,22(2):299-302.

https://doi.org/10.3321/j.issn:1671-2021.2006.02.028      URL      [本文引用: 2]      摘要

目的为了推求出精度更高的城市暴雨强度参数.方法依据遗传算法全局寻优的原理与特点,提出采用遗传算法对皮尔逊-Ⅲ(P-Ⅲ)型分布的统计参数进行估计的方法.并在编制某城市暴雨强度公式的过程中,利用该城市52年的雨量资料进行了实际验证和与其他方法对比分析.结果计算结果表明,总的绝对误差仅为0.02,远远小于其他推求方法,也远远小于国家标准规定;在相同拟合准则的条件下,由该方法得到的P-Ⅲ型分布曲线与实测暴雨强度资料拟合的精度最高.结论遗传算法用于P-Ⅲ型分布统计参数的估计具有原理直观、方法简便、精度高、通用性强和便于计算机实现等特点,可以作为编制暴雨强度公式的P-Ⅲ型分布理论频率曲线拟合的新方法.

[ Piao F S, Shi Y, Fu J X, et al.

Estimating statistic parameter of Pearson Ⅲ distribution frequency curve on rainstorm by the genetic algorithm method

[J]. Journal of Shenyang Jianzhu University (Natural Science), 2006,22(2):299-302. ]

https://doi.org/10.3321/j.issn:1671-2021.2006.02.028      URL      [本文引用: 2]      摘要

目的为了推求出精度更高的城市暴雨强度参数.方法依据遗传算法全局寻优的原理与特点,提出采用遗传算法对皮尔逊-Ⅲ(P-Ⅲ)型分布的统计参数进行估计的方法.并在编制某城市暴雨强度公式的过程中,利用该城市52年的雨量资料进行了实际验证和与其他方法对比分析.结果计算结果表明,总的绝对误差仅为0.02,远远小于其他推求方法,也远远小于国家标准规定;在相同拟合准则的条件下,由该方法得到的P-Ⅲ型分布曲线与实测暴雨强度资料拟合的精度最高.结论遗传算法用于P-Ⅲ型分布统计参数的估计具有原理直观、方法简便、精度高、通用性强和便于计算机实现等特点,可以作为编制暴雨强度公式的P-Ⅲ型分布理论频率曲线拟合的新方法.
[9] 郭化文.

皮尔逊Ⅲ型分布的参数估计

[J].泰安教育学院学报岱宗学刊,1999,4(4):17-19

URL      [本文引用: 1]      摘要

本文对皮尔逊Ⅲ型(P—Ⅲ型)分布的参数估计进行了研究,讨论了传统矩法和极大似然法。

[ Guo H W.

Estimation parameters of Pearson Ⅲ distribution

[J]. Journal of Taian Institute of Education, 1999,4(4):17-19. ]

URL      [本文引用: 1]      摘要

本文对皮尔逊Ⅲ型(P—Ⅲ型)分布的参数估计进行了研究,讨论了传统矩法和极大似然法。
[10] Pilon P J, Adamowski K.

Asymptotic variance of flood quantile in log Pearson Type III distribution with historical information

[J]. Journal of Hydrology, 1993,143(3):481-503.

https://doi.org/10.1016/0022-1694(93)90205-N      URL      [本文引用: 1]      摘要

Monte Carlo studies to verify the accuracy of the derived asymptotic expression for the standard errors of the 10, 50, 100, and 500 year floods, indicate that these are accurate for both Type I and Type II censored samples, while the bias is less than 2.5%. Subsequently, the Type II censored data were subjected to a random, multiplicative error. Results indicate that historical information contributes greatly to the accuracy of estimation of the quantiles even when the error of its measurement becomes excessive.
[11] Li Y, Song S.

Bayesian estimation of parameters for Pearson III distribution

[C]. 2011 International Symposium on Water Resource and Environmental Protection (ISWREP), 2011:630-632.

[本文引用: 3]     

[12] 任伯帜,许仕荣,王涛.皮尔逊—Ⅲ型分布统计参数的确定[J].中国给水排水,2001(17):40-42.

https://doi.org/10.3321/j.issn:1000-4602.2001.01.011      URL      摘要

在参与长沙市暴雨强度公式的编修实践中,应用二元插值理论细化及扩展离均系数表,用最小二乘法适线确定皮尔逊—Ⅲ型分布统计参数,验证结果表明用该方法获得的皮尔逊—Ⅲ型理论频率曲线与实测暴雨强度统计资料拟合得最好。

[ Ren B Z, Xu S R, Wang T.

Estimation statistical parameters of Pearson-Ⅲ distribution

[J]. China Water and Wastewater, 2001,17:40-42. ]

https://doi.org/10.3321/j.issn:1000-4602.2001.01.011      URL      摘要

在参与长沙市暴雨强度公式的编修实践中,应用二元插值理论细化及扩展离均系数表,用最小二乘法适线确定皮尔逊—Ⅲ型分布统计参数,验证结果表明用该方法获得的皮尔逊—Ⅲ型理论频率曲线与实测暴雨强度统计资料拟合得最好。
[13] 王杰,万程炜,郑敏杰,.

高斯牛顿法在皮尔逊Ⅲ型曲线适线中的应用

[J].人民黄河,2014,9(9):27-30.

https://doi.org/10.3969/j.issn.1000-1379.2014.09.009      URL      摘要

皮尔逊Ⅲ型曲线是水文频率计算的常用曲线,其参数的精确估计是y 个难点.基于复杂非线性拟合的最小二乘法基本思想,通过绝对值准则、平方和准则和期望值公式,采用高斯牛顿法对皮尔逊Ⅲ型曲线进行参数估计,通过matlab2013a 软件编程,实现皮尔逊Ⅲ型曲线的自动优化适线,寻求最优适线结果.实例应用结果表明高斯牛顿法参数估计有较好的拟合效果.

[ Wang J, Wan C W, Zheng M J, et al.

Application of Gauss-Newton method in Pearson type Ⅲ curve

[J]. Yellow River, 2014,9(9):27-30. ]

https://doi.org/10.3969/j.issn.1000-1379.2014.09.009      URL      摘要

皮尔逊Ⅲ型曲线是水文频率计算的常用曲线,其参数的精确估计是y 个难点.基于复杂非线性拟合的最小二乘法基本思想,通过绝对值准则、平方和准则和期望值公式,采用高斯牛顿法对皮尔逊Ⅲ型曲线进行参数估计,通过matlab2013a 软件编程,实现皮尔逊Ⅲ型曲线的自动优化适线,寻求最优适线结果.实例应用结果表明高斯牛顿法参数估计有较好的拟合效果.
[14] 刘钧哲,马兴冠,傅金祥,.皮尔逊Ⅲ型分布曲线的快速简便算法[J].沈阳建筑大学学报:自然科学版,2004(1):60-62.

https://doi.org/10.3321/j.issn:1671-2021.2004.01.019      URL      [本文引用: 3]      摘要

通过对皮尔逊Ⅲ型分布曲线的数学表达式的变换,将其转换为不完全 Γ函数,再对不完全Γ函数进行分部积分得到一个新的数学表达式,采用龙贝格积分法与对分法相结合的算法来求解该数学表达式.通过算法对比和实践验证,该算 法具有简便易懂,收敛速度快,数值稳定性好,精度高等优点.解决了编制城市暴雨强度公式过程中计算繁琐、运算速度慢的难点问题.

[ Liu J Z, Ma X G, Fu J X, et al.

Rapid and convenient algorithm of P-Ⅲ distribution curve

[J]. Journal of Shenyang Architectural and Civil Engineering Institute., 2004,1:60-62. ]

https://doi.org/10.3321/j.issn:1671-2021.2004.01.019      URL      [本文引用: 3]      摘要

通过对皮尔逊Ⅲ型分布曲线的数学表达式的变换,将其转换为不完全 Γ函数,再对不完全Γ函数进行分部积分得到一个新的数学表达式,采用龙贝格积分法与对分法相结合的算法来求解该数学表达式.通过算法对比和实践验证,该算 法具有简便易懂,收敛速度快,数值稳定性好,精度高等优点.解决了编制城市暴雨强度公式过程中计算繁琐、运算速度慢的难点问题.
[15] 王正发. MATLAB在P-Ⅲ型分布离均系数Φ_p值计算及频率适线中的应用[J].西北水电,2007(4):1-4.

https://doi.org/10.3969/j.issn.1006-2610.2007.04.001      URL      [本文引用: 1]      摘要

对近年来国内外在皮尔逊Ⅲ型曲线(P-Ⅲ型)分布离均系数Фp值 的计算方面进行了简要回顾.重点研究了应用MATLAB6.0统计工具箱中的一些专用数学函数如何进行P-Ⅲ型分布离均系数Фp值的计算及频率适线问题. 结果表明,由MATLAB编程所计算的P-Ⅲ型分布离均系数Фp值表计算精度高,没有数值发散区,完全能够满足工程水文科研和设计上的使用需要.利用其绘 图函数可在MALAB系统环境中直接进行P-Ⅲ型分布的目估适线,大大提高了设计功效.

[ Wang Z F,

MATLAB programming language used to calculate variation coefficient Φ_p of the P-distribution and fit a frequency curve

[J]. Northwest Hydropower, 2007,4:1-4. ]

https://doi.org/10.3969/j.issn.1006-2610.2007.04.001      URL      [本文引用: 1]      摘要

对近年来国内外在皮尔逊Ⅲ型曲线(P-Ⅲ型)分布离均系数Фp值 的计算方面进行了简要回顾.重点研究了应用MATLAB6.0统计工具箱中的一些专用数学函数如何进行P-Ⅲ型分布离均系数Фp值的计算及频率适线问题. 结果表明,由MATLAB编程所计算的P-Ⅲ型分布离均系数Фp值表计算精度高,没有数值发散区,完全能够满足工程水文科研和设计上的使用需要.利用其绘 图函数可在MALAB系统环境中直接进行P-Ⅲ型分布的目估适线,大大提高了设计功效.
[16] 任伯帜,周赛军,王云波.

皮尔逊-Ⅲ型分布曲线的快速通用算法研究

[J].交通科学与工程,2002,18(1):65-69.

https://doi.org/10.3969/j.issn.1674-599X.2002.01.015      URL      摘要

在编制城市暴雨强度公式时,频率分布曲线常采用皮尔逊-Ⅲ型分布 曲线,而该曲线的快速通用算法一直是难点问题.目前,在实际工作中应用的各种算法都有一定的缺陷性,因此,为皮尔逊-Ⅲ型分布在编制暴雨强度公式中的应用 带来困难.为此,通过数学表达式的变换,将皮尔逊-Ⅲ型分布转换为不完全Г函数,并给出其快速通用的算法模型.通过算法对比和实践验证,该模型具有算法简 单、求解灵活、通用性强、收敛速度较快、计算精度较高等优点,可推广应用.

[Ren B Z, Zhou S J, Wang Y B.

Study of the rapid and universal arithmetic of P-Ⅲ distribution curve

[J]. Journal of Changsha Communications University, 2002,18(1):65-69. ]

https://doi.org/10.3969/j.issn.1674-599X.2002.01.015      URL      摘要

在编制城市暴雨强度公式时,频率分布曲线常采用皮尔逊-Ⅲ型分布 曲线,而该曲线的快速通用算法一直是难点问题.目前,在实际工作中应用的各种算法都有一定的缺陷性,因此,为皮尔逊-Ⅲ型分布在编制暴雨强度公式中的应用 带来困难.为此,通过数学表达式的变换,将皮尔逊-Ⅲ型分布转换为不完全Г函数,并给出其快速通用的算法模型.通过算法对比和实践验证,该模型具有算法简 单、求解灵活、通用性强、收敛速度较快、计算精度较高等优点,可推广应用.
[17] Li S C, Peng Y Y, Wei W Z.

The new numerical algorithm and its application study for Pearson-Ⅲ type curve

[J]. Guangxi Wateer Resources & Hydropower Engineering, 2001,1:18-23.

URL      摘要

The calculation method of S(t) curve in instantaneous unit hydrograph and Pearson_III type curve in hydrological frequency analysis, can be summed up to evaluate Γ_distribution function and quantile. The exact analytic expressions of Γ(α) and lnΓ(α) and five exact analytic expressions of new numerical for Γ_distribution function are expounded. It is mainly: improving the two_step iteration formula and bisection algorithm to evaluate Γ_distribution quantile, giving the new iteration formula based on Newton's two_step derivative method, and giving the new technology to deal with initial value.The program designed for the mathematical model of the new algorithm has been checked by a large number of numerical experiment analysis and thirty actual projects calculation, and the new algorithm has been proved more superior.
[18] Zhang J M, Chen X H, Ye C Q.

Calculation of negative-skewness hydrological series with Pearson-Ⅲ frequency curve

[J]. Journal of Hydraulic Engineering, 2012,43(11): 1296-1301.

URL      摘要

The common used probability density function of Pearson-Ⅲ distribution only considers the case that the skewness of the distribution is positive. The frequency curve fits unsatisfactory when fitting the series with negative skewness such as water level and tide level. In this paper, a function expression which considers both positive and negative skewness to be the probability density function of Pearson-Ⅲ is suggested. The calculation method both for, positive and negative skewness, was analyzed, which avoids calculation of variation coefficient φ by using common computer software. The records of Lutaizi, Bolo and Lafayette stations are used as examples. The fitting results show that the tail of frequency curve is high when using positive-skewness distribution, whose result is not as good as negative-skewness distribution.
[19] 杨娟.

用Pearson-Ⅲ型概率分布推算贵阳降水量的重现期

[J].贵州气象,2015,39(4):8-11.

https://doi.org/10.3969/j.issn.1003-6598.2015.04.002      URL      [本文引用: 1]      摘要

Pearson—III型概率分布曲线能用来拟合不同时段降水量的分布,进而求得一定重现期下的降水量极值,该文采用该方法分别对贵阳市年雨量、年最大月和日降水量3种变量进行拟合。结果表明,Pearson—III型概率分布能较好拟合贵阳地区的暴雨频数分布,拟合效果良好,估算结果可信。

[ Yang J.

To reckon the recurrence interval of precipitation in Guiyang with Pearson-III-probability distribution

[J]. Journal of Guizhou Meteorology, 2015,39(4):8-11. ]

https://doi.org/10.3969/j.issn.1003-6598.2015.04.002      URL      [本文引用: 1]      摘要

Pearson—III型概率分布曲线能用来拟合不同时段降水量的分布,进而求得一定重现期下的降水量极值,该文采用该方法分别对贵阳市年雨量、年最大月和日降水量3种变量进行拟合。结果表明,Pearson—III型概率分布能较好拟合贵阳地区的暴雨频数分布,拟合效果良好,估算结果可信。
[20] 李娟,陈元芳,王文鹏,.最大熵原理在P-Ⅲ型分布参数估计中的应用研究[J].水电能源科学, 2007(5):31-35.

https://doi.org/10.3969/j.issn.1000-7709.2007.05.009      URL      [本文引用: 1]      摘要

探讨了最大熵原理在P-Ⅲ型分 布参数估计中的应用,提出了一种基于线性矩的新的熵估计方法(POMELM),并对三种不同熵参数估计方法提出了考虑历史洪水信息的计算公式。统计试验结 果表明,熵估计方法明显优于两种传统熵估计方法,考虑历史洪水的计算公式是有效可行的,从而拓宽了熵估计方法应用范围。通过对POM ELM法与传统估计方法包括矩法、线性矩法、适线法、权函数法的比较,新的熵估计法优于传统方法,与线性矩法相当。

[ Li J, Chen Y F, Wang W P, et al.

Application of maximum entropy principle to parameters estimation for Pearson-Ⅲ distribution

[J]. Water Resources and Power, 2007,5:31-35. ]

https://doi.org/10.3969/j.issn.1000-7709.2007.05.009      URL      [本文引用: 1]      摘要

探讨了最大熵原理在P-Ⅲ型分 布参数估计中的应用,提出了一种基于线性矩的新的熵估计方法(POMELM),并对三种不同熵参数估计方法提出了考虑历史洪水信息的计算公式。统计试验结 果表明,熵估计方法明显优于两种传统熵估计方法,考虑历史洪水的计算公式是有效可行的,从而拓宽了熵估计方法应用范围。通过对POM ELM法与传统估计方法包括矩法、线性矩法、适线法、权函数法的比较,新的熵估计法优于传统方法,与线性矩法相当。

/