دانشکده بهداشت شیراز
مقایسه مدل رگرسیون لجستیک معمولی با مدل رگرسیون لجستیک فرث
کارگاه بررسی متدولوژی پایان نامه "نجیب اله بااراده" دانشجوی دکتری تخصصی اپیدمیولوژی تحت عنوان " مقایسه مدل رگرسیون لجستیک معمولی با مدل رگرسیون لجستیک فرث" برگزار شد.
بررسی یک پیامد بر اساس چندین متغیر مستقل تحت عنوان پیش بینی کننده از ابزارهای آماری مهم در پژوهش های بالینی می باشد. مدل رگرسیون لجستیک معمولی یک ابزار عمومی و قدرتمند آماری در پیش بینی پیامدهای دوحالتی بر اساس چندین متغیر مستقل پیش بینی کننده است. مدل رگرسیون لجستیک معمولی در پژوهش های بالینی و اپیدمیولوژیک در رابطه با پیامد های دو حالتی جایگاه ویژه ای دارد. از مزایای استفاده از این مدل این است که ورود متغیرهای مستقل به مدل از لحاظ مقیاس (کمی بودن یا کیفی گروه بندی شده) محدودیت ندارد.
در رگرسیون لجستیک معمولی، پارامترهای مدل معمولاً با استفاده از تخمین حداکثر درست نمایی (MLE) برآورد میشوند. هدف MLE یافتن مقادیر پارامتری است که احتمال مشاهده داده های داده شده را تحت مدل فرضی به حداکثر می رساند. با این حال، MLE می تواند در شرایط خاصی مشکل ساز باشد، مانند زمانی که حجم نمونه کوچک است ، رخداد مورد نظر نادر است و یا زمانی که جداسازی کامل یا شبه کامل در داده ها وجود داشته باشد.
جداسازی در رگرسیون زمانی اتفاق میافتد که یک پیشبینیکننده یا ترکیبی از پیشبینیکنندهها، متغیر نتیجه را کاملاً پیشبینی کند. این پدیده به ویژه در رگرسیون لجستیک معمولی رایج است اما می تواند در انواع دیگر مدل های رگرسیون نیز رخ دهد. هنگامی که جداسازی رخ می دهد، مدل رگرسیون لجستیک سعی می کند داده ها را کاملاً برازش دهد، که منجر به تخمین پارامترهای نامحدود برای پیش بینی کنندگان درگیر در جداسازی می شود.
بنابراین در حضور شرایط بالا مدل رگرسیون لجستیک معمولی ضرایبی که برآورد می کند اریب می باشد و دقیق نیست. یکی از روش ها برای برآورد دقیق ضرایب استفاده از مدل رگرسیون لجستیک فرث می باشد. در این مدل در فرمول تخمین حداکثر درستنمایی آن تصحیحی در نظر گرفته شده است که باعث می شود تا ضرایب در حضور رخدادهای نادر، حجم کم نمونه و وجود جداسازی نااریب باشد.