1972年,David Cox 提出Cox 比例风险回归模型。这个模型广泛应用于临床研究、公共卫生研究的数据分析中,距今整整50年! 而2022.1.20,这位英国著名统计学家去世,享年 97 岁。
统计学家David Cox(1924-2022)
戴维·罗斯贝·科克斯爵士,Sir David Roxbee Cox,1924年7月15日-2022),英国著名统计学家,英国皇家学会院士暨英国社会科学院院士,美国科学院、丹麦皇家科学院外籍院士。曾任国际统计协会、伯努利数理统计与概率学会、英国皇家统计学会主席。主要学术贡献包括Cox过程和影响深远且应用广泛的Cox比例风险模型等。
David Cox1924 年出生于英国伯明翰,在剑桥大学圣约翰学院学习数学,并在 Henry Daniels 和 Bernard Welch 的指导下于 1949 年在利兹大学获得博士学位。
1950 年到 1956 年期间,David Cox 在剑桥大学的统计实验室工作。1956 年到 1966 年,他在伦敦大学伯贝克学院担任「Reader」和统计学教授。1966 年,他担任伦敦帝国理工学院统计学系主任,后来成为数学系主任。1988 年,成为纳菲尔德学院的院长和牛津大学统计系的成员,最后于 1994 年正式退休。
David Cox 在统计和应用概率方面做出了开创性的贡献,主要学术贡献包括 Cox 过程,以及影响深远且应用广泛的 Cox 比例风险模型等。
因其做出的重要贡献,David Cox 获得皇家统计学会的盖伊奖章(1961 年)和金奖(1973 年),并于 1985 年被英国女王伊丽莎白二世封为爵士。2010 年,他因「对统计理论和应用的开创性贡献」而被授予英国皇家学会科普利奖章。他也是第一个获得国际统计奖(International Prize in Statistics)的人(2017 年)。
Cox 回归模型介绍
Cox回归是生存分析的重要方法,全称是“Cox比例风险模型”。它主要探讨终点事件发生速度有关的因素。通俗来说,它可以探讨,到底哪类群体的“死亡”速度更快、到底什么因素影响了“死亡”速度。
生存分析的“死亡”指的是,阳性终点事件的发生。死亡速度指的是,t时刻存活的个体在t 时刻的瞬时死亡(阳性事件发生)率,可以理解为一组人群在不同时刻的阳性终点事件发生的速度。这个速度我们称之为“死亡风险”’。
因此,Cox回归是关于“死亡”风险的研究。在1972年,David Cox 提出了一个风险函数,该风险函数分为时间依赖和时间独立两部分,并以此搭建起死亡风险与相关因素的回归方程。
Cox回归的公式如下:
或者
h(t)便是研究对象的风险函数,即“死亡”速度,它随着时间的变化而变化。h0(t)是回归方程的截距,初学者完全可以忽略;x1,x2,…xj是自变量,β1,β2…,βj为回归系数。Cox回归用于探讨自变量x对因变量h(t)的影响,该模型通常用于医学研究中分析一个或多个前定变量对患者生存时间的影响。
据谷歌学术不完全统计,这篇文章的引用率目前超过 56612 次,也是迄今生存分析中应用最多的多因素分析方法。
2014 年 10 月,在《Nature》杂志评出的引用次数最多的 100 篇论文之中,Cox 回归成为「引用率最高的三篇统计学论文」之一。(内容参考:机器之心、医学论文与统计分析等。)