生存関数とハザード関数
式(2)を変形すると、
\[
\begin{align}
\lambda(t)&=\dfrac{f(t)}{S(t)}=\dfrac{1}{S(t)}\cdot\dfrac{d}{dt}F(t)\\&=\dfrac{1}{S(t)}\cdot\dfrac{d}{dt}(1-S(t))\\&=\dfrac{1}{S(t)}\cdot-\,\dfrac{d}{dt}S(t)\tag{3}
\end{align}
\]
式(3)の両辺を積分して、
\[
\begin{align}
\int \lambda(t)dt
& =\int\dfrac{1}{S(t)}\cdot\left(-\,\dfrac{d}{dt}S(t)\right)dt\\
& =-\int\dfrac{1}{S(t)}dS(t)\\
& =-\,\textrm{ln}(S(t))+C\tag{4}
\end{align}
\]
よって
\[
\begin{equation}
S(t)=\textrm{exp}\left(C-\int\lambda(t)\,dt\right)\tag{5}
\end{equation}
\]
さらに
\[
\begin{equation}
S(0)=\exp(C-0)=\textrm{exp}(C)=1\tag{6}
\end{equation}
\]
が成り立つには\(\,C=0\,\)である必要があるため、式(5)に\(\,C=0\,\)を代入して
\[
\begin{equation}
S(t)=\textrm{exp}\left(-\,\int\lambda(t)dt\right)\tag{7}
\end{equation}
\]
となり
\[
\begin{equation}
\textrm{ln}(S(t))=-\,\int\lambda(t)dt\tag{8}
\end{equation}
\]
となる。
つまり、生存関数\(\,S(t)\,\)はハザード関数\(\,\lambda(t)\,\)によって決定される。
そこで、ハザードを目的変数とし、生存率に影響する因子を説明変数とする重回帰分析により、説明変数が生存率に与える影響を求めることが出来る。
しかし、ハザード関数\(\,\lambda(t)\,\)を具体的に規定するのは困難であるため、ハザード関数と基準ハザード関数の比の自然対数を取った対数ハザード比を目的変数とした一般化線形モデル(比例ハザードモデル)を次節の通りに想定する。
なお、基準ハザード関数\(\,\lambda_0(t)\,\)とは全ての説明変数の値が\(\,0\,\)のときのハザード関数である。
比例ハザードモデル
対数ハザード比を目的変数とし、説明変数との間の線形関係を仮定して、リンク関数を式(9)の通りとした一般化線形モデルを考える。
\[
\begin{equation}
\eta=\textrm{ln}\left(\dfrac{\lambda\left(t|x_1,\cdots,x_p\right)}{\lambda_0(t)}\right)=\beta_0+\beta_1x_1+\cdots+\beta_px_p+\epsilon\tag{9}
\end{equation}
\]
あるいは
\[
\begin{align}
\eta_i&=\textrm{ln}\left(\dfrac{\lambda\left(t|x_i\right)}{\lambda_0(t)}\right)\\&=\beta_0+\beta_1x_{i1}+\cdots+\beta_px_{ip}+\epsilon_i=\hat{\eta_i}+\epsilon_i=y_i+\epsilon_i\tag{10}
\end{align}
\]
行列式で表現すると
\[
\begin{equation}
\pmb{\eta}=\textrm{ln}\left(\dfrac{\lambda(t)}{\lambda_0(t)}\right)=\textbf{x}\,\pmb{\beta}+\pmb{\epsilon}=\textbf{y}+\pmb{\epsilon}\tag{11}
\end{equation}
\]
となり、\(\,\textbf{y}\,\)は
\[
\begin{equation}
\begin{bmatrix}y_1\\\vdots\\y_n\end{bmatrix}=\begin{bmatrix}1&x_{11}&\cdots&x_{1p}\\\vdots&\vdots&&\vdots\\1&x_{n1}&\cdots&x_{np}\end{bmatrix}\begin{bmatrix}\beta_0\\\vdots\\\beta_p\end{bmatrix}\tag{12}
\end{equation}
\]
ここで、ハザード関数\(\,\lambda(t)\,\)は\(\,t\,\)とは無関係に一定であるとの仮定を置くと、
\[
\begin{equation}
\lambda(t)=\lambda\tag{13}
\end{equation}
\]
式(7)は
\[
\begin{equation}
S(t)=\textrm{exp}\left(-\,\int\lambda(t)dt\right)=\textrm{exp}(\lambda t)\tag{14}
\end{equation}
\]
となり、生存関数,\(S(t)\,\)は指数関数となって、理論的な生存時間は\(\,\infty\,\)となるが、\(\,S(t)\,\)が微小量\(\,\delta\,\)になったときに死亡すると仮定すると、生存時間とハザードモデルの間には以下の関係が成り立つ。
\[
\begin{equation}
S(t)=\exp(-\lambda t)=\delta\tag{15}
\end{equation}
\]
\[
\begin{equation}
\textrm{ln}(\delta)=-\lambda t\tag{16}
\end{equation}
\]
\[
\begin{equation}
\lambda=-\dfrac{\textrm{ln}(\delta)}{t}\tag{17}
\end{equation}
\]
また、基準ハザード関数\(\,\lambda_0(t)\,\)は
\[
\begin{equation}
\lambda_0=-\dfrac{\textrm{ln}(\delta)}{t_0}\tag{18}
\end{equation}
\]
と表すこととし、式(17)および式(18)を式(11)に代入すると
\[
\begin{align}
\eta&=\textrm{ln}\left(\dfrac{\lambda(t)}{\lambda_0(t)}\right)
\\&=\textrm{ln}\left(\dfrac{-\dfrac{\textrm{ln}(\delta)}{t}}{-\dfrac{\textrm{ln}(\delta)}{t_0}}\right)
\\&=\textrm{ln}\left(\dfrac{t_0}{t}\right)
\\&=\textrm{ln}(t_0)-\textrm{ln}(t)
\\&=\pmb{\beta}\textbf{x}+\pmb{\epsilon}\tag{19}
\end{align}
\]
よって、
\[
\begin{equation}
\textrm{ln}(t)=\textrm{ln}(t_0)-\left(\pmb{\beta}\textbf{x}+\pmb{\epsilon}\right)\tag{20}
\end{equation}
\]
比例ハザードモデルは式(20)を解くことになる。
- そのため推定された\(\,\pmb{\beta}\,\)の符号は反対になる。
- 偏回帰係数のみを推定する。