آزمون F (که در تحلیل واریانس (ANOVA) و رگرسیون استفاده میشود) نسبت به مخدوش بودن فرض نرمالبودن و همگنی واریانس تا حدی خدشهناپذیر (Robust) است، اما این مقاومت مطلق نیست و به شرایط خاصی بستگی دارد. در ادامه دلایل این مقاومت و محدودیتهای آن را بررسی میکنیم:
۱. مقاومت آزمون F به نقض نرمالبودن (Robustness to Non-Normality)
- دلیل مقاومت:
آزمون F بر اساس توزیع نمونهگیری میانگینها کار میکند و طبق قضیه حد مرکزی (CLT)، با افزایش حجم نمونه، توزیع میانگینها به نرمال میل میکند—حتی اگر دادههای اصلی نرمال نباشند.
- اگر حجم نمونه در هر گروه به اندازه کافی بزرگ باشد (معمولاً \( n > 30 \))، آزمون F نتایج معتبری ارائه میدهد.
- در نمونههای کوچک، اگر چولگی یا کشیدگی شدید نباشد، معمولاً مشکل جدی ایجاد نمیشود.
- محدودیت:
- اگر دادهها به شدت چوله (Skewed) یا دارای پرت (Outliers) باشند، بهویژه در نمونههای کوچک، آزمون F ممکن است دچار خطای نوع I یا II شود.
- راهحل جایگزین: استفاده از آزمونهای ناپارامتریک مانند کروسکال-والیس یا تبدیل دادهها (مثل تبدیل لگاریتمی).
۲. مقاومت آزمون F به نقض همگنی واریانس (Robustness to Heteroscedasticity)
- دلیل مقاومت:
- اگر حجم نمونه گروهها مساوی یا تقریباً مساوی باشد، آزمون F حتی در صورت نقض همگنی واریانس (نابرابری واریانسها) مقاوم است.
- در این حالت، خطای نوع I (احتمال رد فرض صیحیح) نزدیک به سطح معناداری تعیینشده (مثلاً \( \alpha = 0.05 \)) باقی میماند.
- محدودیت:
- اگر حجم نمونه گروهها نا متوازن باشد (مثلاً یک گروه بسیار بزرگتر از دیگری)، نقض همگنی واریانس میتواند منجر به خطای نوع I یا II شود.
- راهحل جایگزین:
- استفاده از تصحیح ولچ (Welch’s ANOVA) که نیاز به همگنی واریانس ندارد.
- استفاده از آزمونهای مقاوم مانند براون-فورسایت (Brown-Forsythe).
۳. چرا آزمون F در عمل نسبتاً مقاوم است؟
۱. تأثیر حجم نمونه:
- در نمونههای بزرگ، نقض نرمالبودن و همگنی واریانس تأثیر کمتری دارد.
۲. ساختار آزمون F:
- این آزمون تغییرپذیری بین گروهی را نسبت به تغییرپذیری درون گروهی مقایسه میکند، نه مستقیماً توزیع دادهها را.
۳. انعطافپذیری در تحلیلهای واقعی:
- در بسیاری از پژوهشها، اثرات مورد بررسی آنقدر قوی هستند که حتی با نقض جزئی مفروضات، نتایج معتبر باقی میمانند.
۴. چه زمانی آزمون F واقعاً آسیبپذیر میشود؟
- اگر هر دو فرض نرمالبودن و همگنی واریانس به شدت نقض شوند (مثلاً دادههای بسیار چوله با واریانسهای کاملاً نابرابر).
- اگر حجم نمونه کوچک و نامتوازن باشد.
در نتیجه، آزمون F در بسیاری از شرایط واقعی مقاوم است، اما نباید بدون بررسی مفروضات از آن استفاده کرد!