Моделювання інтервально-цензурованих надмірно дисперсійних даних процесу виживання
DOI:
https://doi.org/10.32782/2786-7684/2024-2-27Ключові слова:
надмірна дисперсія, інтервальне цензурування, дані про виживання, NB2 регресіяАнотація
Вступ. Невідомий точний час подій і можлива неоднорідність розподілу частот подій за часовими інтервалами разом із недоліками профілю створюють проблеми для моделювання даних. Це вимагає або міксту розподілів латентних змінних, або узагальнених розподілів, які враховують неоднорідність. Нашою метою було вивчити здатність негативної біноміальної регресії типу 2 (NB2) справлятися з представленими проблемами. Методи та дані. Ми запропонували застосування регресії NB2 із підтримкою аналізу потужності, реалізованого в пакеті R «ltable». Ми перевірили ефективність на штучно змодельованих даних, щоб продемонструвати здатність до розкриття механізму генерації даних. Результати підтвердили, що частоти гетерогенні, що є звичайною ситуацією. Коваріаційна матриця параметрів моделі була недостатньо стабільною та чутливою через брак профілів, що також характерно. Відповідність даним була гарною, оскільки критерій хі-квадрат був менше 1 на ступінь свободи з фактичним значенням 0,09. Це було підтверджено аналізом залишків моделі. Ефекти регресії мали очікувані напрямки та величини та розкрили механізм генерації даних. Аналіз потужності підтвердив результати моделювання та підтримав справжній механізм генерації інтервально цензурованих даних. Ми припускаємо, що даний приклад підтверджує ефективність моделювання. У свою чергу, аналіз потужності допомагає підтвердити вихідні дані, виявити, та обґрунтувати справжній механізм генерації інтервальних цензурованих даних. Висновки. Моделювання інтервальних цензурованих даних з гетерогенністю все ще є проблемою через наддисперсність і дефіцит профілів, що зменшують потужність тестування гіпотез. Ми пропонуємо NB2 регресію за підтримки аналізу потужності для аналізу таких даних. Результати аналізу штучно згенерованих даних підтримує ефективність моделювання.
Посилання
Klein JP, Moeschberger M. Survival Analysis. New York: Springer Verlag, 1997.
CRAN R package ltable. https://cran.r-project.org/package=ltable
Congdon P. Bayesian models for categorical data. 2005. John Wiley & Sons Ltd, England. 415 p.
Agresti A. Categorical Data Analysis. 3rd ed. (Wiley series in prob. and stat.; 792). 2013.
Consul PC., Famoye F. Generalized poisson regression model. Communications in Statistics – Theory and Methods. 1992;21(1);89-109 https://doi.org/10.1080/03610929208830766
Alan Huan. Mean-parametrized Conway–Maxwell–Poisson regression models for dispersed counts. Statistical Modelling. 2017;17(6):359–380. https://doi.org/10.1177/1471082X176977
Ocheredko OM. MCMC Bootstrap Based Approach to Power and Sample Size Evaluation. /New Developments in Data Science and Analytics. Proceedings of the 2019 Meeting of International Society for Data Science and Analytics. Zhiyong Zhang Ke-Hai Yuan Yong Wen Jiashan Tang. ISDSA Press · Granger, IN. p.67-87
Ocheredko Oleksandr. Library «ltable». The Comprehensive R Archive Network. https://cran.r-project.org/package=ltable