統計学において、一般化推定方程式(いっぱんかすいていほうていしき、generalized estimation equation, GEE)は、アウトカム間に未知の相関関係がある可能性のある一般化線形モデルのパラメータを推定するのに用いられる[1] [2]

共分散構造が誤って指定された場合でも、穏やかな正則性の条件下では、一般化推定方程式からのパラメータ推定値は一致している。 一般化推定方程式の焦点は、任意の個体に対する1つ以上の共変量を変更した効果の予測を可能にする回帰パラメータではなく、母集団全体の平均応答(「母集団平均」効果)を推定することにある。一般化推定方程式は通常、「ロバスト標準誤差」または「サンドイッチ分散」推定として知られる Huber-White 標準誤差推定とともに使用される。独立分散構造を持つ線形モデルの場合、これらは「不均一分散一致標準誤差」推定量として知られている。実際、一般化推定方程式は、これらの標準誤差推定量のいくつかの独立した定式化を一般的な枠組みに統合したものである。

一般化推定方程式は、最初の2つのモーメントのみの指定に依存するため、セミパラメトリックと呼ばれる回帰手法に属する。一般化推定方程式は分散構造の指定に敏感な尤度ベースの一般化線形混合モデルに対する一般的な代替手段である[3]。セミパラメトリック回帰は、アウトカム間の測定不能な依存関係を扱うことができるため、大規模な疫学研究、特に多施設コホート研究で一般的に使用される。

定式化 編集

被験者   の時刻   に対する平均モデル  (回帰パラメータ   の関数)と分散構造   を用いて、推定方程式を次のように定式化することができる[4]

 

パラメータ    を解くことによって推定され、ニュートン法によってその解を得る。分散構造は、パラメータ推定の効率を向上させるよう選択される。パラメータ空間における一般化推定方程式の解のヘッセ行列を使用して、ロバストな標準誤差推定を計算できる。分散構造 variance structure という用語は、サンプル内のアウトカム Y 間の共分散行列の代数形式を意味する。独立性、交換可能性、自己回帰性、定常m-依存性、非構造性が含まれる。 GEE回帰パラメータに関する最も一般的な推論形式は、ナイーブまたはロバストな標準誤差を使用するWald検定だが、対立仮説の下で情報の推定値を取得することが難しい場合は、スコア検定が望ましい。推定方程式は必ずしも尤度方程式ではないため、尤度比検定は妥当性を欠く。モデル選択には、赤池情報量基準(AIC)に相当する独立モデル基準(QIC)の疑似尤度 Quasilikelihood under the Independence model Criterion (QIC) を用いることができる[5]

一般化モーメント法との関係 編集

一般化推定方程式は、一般化モーメント法(GMM)の特殊なケースである[6]。この関係は、スコア関数が次の方程式を満たすとことから明らかである。 

計算 編集

一般化推定方程式を解くためのソフトウェアとして以下の者が挙げられる。

二項相関データ[15] [16]と順序相関データ[17]について、ソフトウェアパッケージ間の違いが提示されている。

関連項目 編集

脚注 編集

出典 編集

  1. ^ Kung-Yee Liang and Scott Zeger (1986). “Longitudinal data analysis using generalized linear models”. Biometrika 73 (1): 13–22. doi:10.1093/biomet/73.1.13. 
  2. ^ Hardin, James; Hilbe, Joseph (2003). Generalized Estimating Equations. London: Chapman and Hall/CRC. ISBN 978-1-58488-307-4. https://archive.org/details/generalizedestim0000hard 
  3. ^ Fong, Y; Rue, H; Wakefield, J (2010). “Bayesian inference for generalized linear mixed models”. Biostatistics 11 (3): 397–412. doi:10.1093/biostatistics/kxp053. PMC 2883299. PMID 19966070. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2883299/. 
  4. ^ Diggle, Peter J.; Patrick Heagerty; Kung-Yee Liang; Scott L. Zeger (2002). Analysis of Longitudinal Data. Oxford Statistical Science Series. ISBN 978-0-19-852484-7 
  5. ^ Pan, W. (2001), “Akaike's information criterion in generalized estimating equations”, Biometrics 57 (1): 120–125, doi:10.1111/j.0006-341X.2001.00120.x, PMID 11252586 .
  6. ^ Breitung, Jörg; Chaganty, N. Rao; Daniel, Rhian M.; Kenward, Michael G.; Lechner, Michael; Martus, Peter; Sabo, Roy T.; Wang, You-Gan et al. (2010). “Discussion of 'Generalized Estimating Equations: Notes on the Choice of the Working Correlation Matrix'”. Methods of Information in Medicine 49 (5): 426–432. doi:10.1055/s-0038-1625133. 
  7. ^ Sarah J. Ratcliffe and Justine Shults (2008). “GEEQBOX: A MATLAB Toolbox for Generalized Estimating Equations and Quasi-Least Squares”. Journal of Statistical Software 25 (14): 1–14. http://www.jstatsoft.org/v25/i14. 
  8. ^ The GENMOD Procedure”. 2022年10月20日閲覧。
  9. ^ IBM SPSS Advanced Statistics”. 2022年10月20日閲覧。
  10. ^ Stata's implementation of GEE”. 2022年10月20日閲覧。
  11. ^ gee: Generalized Estimation Equation solver” (2019年11月7日). 2022年10月20日閲覧。
  12. ^ geepack: Generalized Estimating Equation Package, CRAN, (18 December 2020), https://cran.r-project.org/web/packages/geepack/index.html 
  13. ^ multgee: GEE solver for correlated nominal or ordinal multinomial responses using a local odds ratios parameterization, CRAN, (13 May 2021), https://cran.r-project.org/web/packages/multgee/index.html 
  14. ^ Generalized Estimating Equations — statsmodels”. 2022年10月20日閲覧。
  15. ^ Andreas Ziegler and Ulrike Grömping (1998). “The generalised estimating equations: a comparison of procedures available in commercial statistical software packages”. Biometrical Journal 40 (3): 245–260. doi:10.1002/(sici)1521-4036(199807)40:3<245::aid-bimj245>3.0.co;2-n. 
  16. ^ Nicholas J. HORTON and Stuart R. LIPSITZ (1999). “Review of software to fit generalized estimating equation regression models”. The American Statistician 53 (2): 160–169. doi:10.1080/00031305.1999.10474451. 
  17. ^ Nazanin Nooraee, Geert Molenberghs, and Edwin R. van den Heuvel (2014). “GEE for longitudinal ordinal data: Comparing R-geepack, R-multgee, R-repolr, SAS-GENMOD, SPSS-GENLIN”. Computational Statistics & Data Analysis 77: 70–83. doi:10.1016/j.csda.2014.03.009. https://pure.rug.nl/ws/files/17588929/Title_and_contents_.pdf. 

参考文献 編集

外部リンク 編集