部分区间删失数据下指数分布中MLE的相合性

2015-02-20 08:09蔡定教易景平
安阳师范学院学报 2015年2期

蔡定教,易景平

(1.北京师范大学 数学科学学院,北京 100875;2.安阳师范学院 数学与统计学院,河南 安阳 455000)



部分区间删失数据下指数分布中MLE的相合性

蔡定教1,2,易景平2

(1.北京师范大学 数学科学学院,北京 100875;2.安阳师范学院 数学与统计学院,河南 安阳 455000)

[摘要]部分区间删失数据包括精确数据以及区间删失数据, 在慢性病研究中有广泛的应用.本文主要考虑在具有1类部分删失数据下指数分布中最大似然估计的相合性,在一定的正则条件下证明了最大似然估计的强相合性.

[关键词]区间删失;相合性;最大似然估计;紧集;生存函数

部分区间删失数据在实际生活中有广泛的应用. 如在慢性病的研究中,有些病人开始患病的年龄是已知的;而另一些人只知道现在已患病,因而只知道患病时刻在当前时刻之前;还有一类未患病的可疑个体,则只知患病时刻在当前时刻之后. 更一般的情形发生在跟踪研究中,如亚类心绞病和冠心病的研究中. 对于一类病人,心绞病或冠心病的发病时刻是清楚的,但是对另一些病人则只在某两个时刻进行临床检测. 此外在丹麦的糖尿病研究中的数据也是既有精确值也包含区间删失数据.

我们知道在仅有精确值的情形,指数模型中未知参数的最大似然估计具有强相合性. 本文中我们考虑在具有1类部分区间删失数据情形下最大似然估计的强相合性. 1类部分删失数据具体描述如下:对于一些研究对象,我们能观察到它们生存时间的精确值T1,…Tn1,然而对其他的对象却只能知道它们的现状. 也就是说对于这些组中的第j个对象,只知道它在检测时刻Uj时是否已失效;因而观测数据为:(δj,Uj),j=1,…,n2. 当未知失效时刻Tj≥Uj时δj=1;否则δj=0.

1生存分析模型

设生存分析模型服从参数为λ的指数分布. 则生存函数为S(x)=exp{-λx},x>0, 相应的密度函数为f(x)=λexp{-λx},x>0.

-exp{-λUj})(1-δj).

对数似然函数为:

+(1-δj)ln(1-exp{-λUj})].

假设1真值λ0为Λ的内点且Λ为紧集.

2Jessen不等式和Hoeffding不等式

Jessen不等式:设X为m维随机向量,f为定义在Rm上的凸函数,EX存在有限,则

Ef(X)≥f(EX).

当f为严凸时,上式中等号当且仅当P(X=EX)=1时才成立.

Hoeffding不等式:设X1,…,Xn是个独立随机变量且P(Xi∈[a,b])=1,1≤i≤n,Sn=X1+…+Xn,则对任意t≥0,有

3相合性

定义1:对指数型分布族,最大似然估计MLE的定义如下:

这里p(x;λ)=(exp{-λUj})δ(1-exp{-λUj})(1-δ).令E为真实参数为λ0时的期望, 则对任意λ≠λ0,0<α<1,由Jessen不等式得

由p(x;λ)关于λ的可识别性知不等号严格成立, 即

(1)

对λ的任一领域N, 定义

则对一列λ的半径为ε的开领域Nε,当ε→0时, 有Nε收缩到λ, 从而有

由(1)式知当n1充分大而ε充分小时,存在ηε>0使得

(2)

通过简单的计算可得

再根据对数函数的凹性得

(3)

右边和事件中每一项的概率为一致有界独立随机变量的平均值非负的概率. 而由(2)知这些随机变量具有负的期望. 利用Hoeffding不等式,每一项的概率具有阶e-εn2,这里ε取为2ρ2/(M-log(1-α))2, 其中M=max(ηλk,1≤K≤m),ρ为某一负数且(2)中的期望n1>N在时小于ρ. 进一步有

利用Borel-Cantelli引理及假设2知以概率1

由N0的任意性即得证.

[参考文献]

[1]Jong S. Kim. Maximum Likelihood estimation for the proportional hazards model with partly interval censored data [J].J.R.Statist.Soc.B,2003,65(2):489-502.

[2]Van der Vaart, A. W. and Wellner, J.A. Existence and consistency of maximum likelihood in upgraded mixture models[J].Multivariate Analysis,1992,43:133-146.

[3]Huang J. Efficient estimation for the proportional hazard model with interval censoring[J].The Annals of Statistics,1996,24(2):540-568.

[4]Huang J. and Wellner, J.A. Asymptotic Normal of the NPMLE of Linear Functionals for Interval Censored Data, Case 1[J]. Statistica Neerlandica,1995,49:153-163.

[5]Van der Vaart, A. W. and Wellner, J.A. Weak convergence and empirical processes[M]. New York:Springer Verlag, 1996.

[6]陈希孺.高等数理统计学[M].合肥:中国科学技术大学出版社,1999:192.

[责任编辑:Z]

[中图分类号]O213.9

[文献标识码]A

[文章编号]1671-5330(2015)02-0006-02

[作者简介]蔡定教(1979—),男,浙江温州人,北京师范大学博士生,讲师,主要从事生物统计的研究。

[收稿日期]2015-02-02