گرسیون یکی از تکنیکهای مهم در تحلیل دادهها است که به بررسی و پیشبینی روابط بین متغیرها میپردازد. در این زمینه، چهار روش اصلی رگرسیون وجود دارد: رگرسیون پیشرو، رگرسیون پسرو، رگرسیون گام به گام و رگرسیون حذفی. در ادامه به توضیح تفاوتهای این روشها میپردازیم.
رگرسیون پیشرو (Forward Selection)
در این روش، مدل از هیچ متغیری شروع میشود و به تدریج متغیرهای مستقل به مدل اضافه میشوند. در هر مرحله، متغیری که بیشترین همبستگی را با متغیر وابسته دارد و به مدل کمک میکند، انتخاب میشود. این روند تا زمانی ادامه مییابد که دیگر هیچ متغیری با همبستگی معنادار باقی نماند.
ویژگیها:
-
شروع بدون هیچ متغیری
-
افزودن تدریجی متغیرها بر اساس همبستگی
-
مناسب برای زمانهایی که تعداد متغیرها زیاد است و نمیدانیم کدام یک مهمتر هستند.
رگرسیون پسرو (Backward Elimination)
این روش برعکس روش پیشرو عمل میکند. در ابتدا تمام متغیرهای مستقل وارد مدل میشوند و سپس به تدریج متغیرهایی که تأثیر کمی بر روی متغیر وابسته دارند، حذف میشوند. این کار ادامه مییابد تا فقط متغیرهای معنادار باقی بمانند.
ویژگیها:
-
شروع با همه متغیرها
-
حذف تدریجی متغیرها بر اساس عدم معناداری
-
مناسب برای زمانی که فرض میکنیم اکثر متغیرها ممکن است تأثیرگذار باشند.
رگرسیون گام به گام (Stepwise Regression)
این روش ترکیبی از دو روش پیشرو و پسرو است. در اینجا، ابتدا یک یا چند متغیر وارد مدل میشوند و سپس در هر مرحله، هم به افزودن متغیرهای جدید و هم به حذف متغیرهای غیرضروری پرداخته میشود. این فرآیند تا زمانی ادامه مییابد که دیگر هیچ تغییر معناداری در مدل ایجاد نشود.
ویژگیها:
-
ترکیبی از روشهای پیشرو و پسرو
-
افزودن و حذف همزمان متغیرها
-
کارآمد برای انتخاب بهترین مدل از میان تعداد زیادی از متغیرها.
رگرسیون حذفی (Remove Regression)
این اصطلاح معمولاً به روشهای مشابه با رگرسیون پسرو اشاره دارد که در آن ابتدا تمام متغیرها وارد مدل شده و سپس بر اساس معیارهای آماری، برخی از آنها حذف میشوند. این روش بیشتر بر روی حذف تأکید دارد تا انتخاب.
ویژگیها:
-
مشابه رگرسیون پسرو
-
تمرکز بر روی حذف غیرضروریها
-
بیشتر در تحلیلهای دقیق و عمیق مورد استفاده قرار میگیرد.