رگرسیون لجستیک
رگرسیون لجستیک
رگرسیون لجستیک یک روش آماری قدرتمند است که برای پیشبینی احتمال وقوع یک رویداد استفاده میشود. این روش به خصوص در مواردی که متغیر وابسته (یا پاسخ) ما یک متغیر دستهای (Categorical Variable) با دو مقدار ممکن است (دو حالته)، کاربرد فراوانی دارد. به عنوان مثال، پیشبینی اینکه آیا یک مشتری محصولی را خریداری میکند یا نه (بله/خیر)، یا اینکه آیا یک ایمیل اسپم است یا خیر (اسپم/غیر اسپم).
مفاهیم اولیه
برای درک رگرسیون لجستیک، ابتدا باید با چند مفهوم اساسی آشنا شویم:
- متغیر وابسته (Dependent Variable): متغیری که میخواهیم پیشبینی کنیم. در رگرسیون لجستیک، این متغیر معمولاً یک متغیر دو حالته است.
- متغیر مستقل (Independent Variable): متغیرهایی که برای پیشبینی متغیر وابسته استفاده میکنیم. این متغیرها میتوانند پیوسته (Continuous) یا دستهای باشند.
- احتمال (Probability): احتمال وقوع یک رویداد، عددی بین 0 و 1 است. 0 به معنای عدم وقوع رویداد و 1 به معنای وقوع قطعی رویداد است.
- تابع لجستیک (Logistic Function): یک تابع ریاضی است که یک مقدار پیوسته را به یک مقدار بین 0 و 1 نگاشت میکند. این تابع در رگرسیون لجستیک برای محاسبه احتمال وقوع رویداد استفاده میشود. فرمول تابع لجستیک به صورت زیر است:
p = 1 / (1 + e-z)
که در آن: * p: احتمال وقوع رویداد * e: عدد نپر (تقریباً 2.71828) * z: ترکیب خطی از متغیرهای مستقل (z = β0 + β1x1 + β2x2 + ... + βnxn) * β0, β1, β2, ..., βn: ضرایب رگرسیون
تفاوت رگرسیون لجستیک با رگرسیون خطی
در رگرسیون خطی، ما سعی میکنیم یک رابطه خطی بین متغیرهای مستقل و وابسته پیدا کنیم. اما در رگرسیون لجستیک، متغیر وابسته دستهای است و نمیتوان از رگرسیون خطی به طور مستقیم استفاده کرد. چرا؟ چون خروجی رگرسیون خطی میتواند هر عدد حقیقی باشد، در حالی که احتمال باید بین 0 و 1 باشد. تابع لجستیک این مشکل را حل میکند و خروجی رگرسیون را در محدوده 0 تا 1 نگه میدارد.
نحوه کار رگرسیون لجستیک
1. جمعآوری دادهها: ابتدا باید دادههای مربوط به متغیرهای مستقل و وابسته را جمعآوری کنیم. 2. آمادهسازی دادهها: دادهها را برای مدلسازی آماده میکنیم. این شامل پاکسازی دادهها، حذف مقادیر گمشده، و تبدیل متغیرهای دستهای به متغیرهای عددی (مثلاً با استفاده از کدگذاری وان-هات (One-Hot Encoding)) میشود. 3. تخمین ضرایب: با استفاده از روشهایی مانند حداکثر درستنمایی (Maximum Likelihood Estimation)، ضرایب رگرسیون (β0, β1, β2, ..., βn) را تخمین میزنیم. 4. پیشبینی: با استفاده از ضرایب تخمین زده شده و تابع لجستیک، احتمال وقوع رویداد را برای دادههای جدید پیشبینی میکنیم. 5. ارزیابی مدل: عملکرد مدل را با استفاده از معیارهایی مانند دقت (Accuracy)، حساسیت (Sensitivity)، ویژگی (Specificity)، منحنی ROC (ROC Curve) و آزمون خی دو (Chi-squared test) ارزیابی میکنیم.
تفسیر ضرایب رگرسیون
ضرایب رگرسیون لجستیک نشان میدهند که چگونه تغییر در هر متغیر مستقل بر احتمال وقوع رویداد تأثیر میگذارد. تفسیر ضرایب معمولاً با استفاده از نسبت شانس (Odds Ratio) انجام میشود. نسبت شانس به صورت زیر محاسبه میشود:
Odds Ratio = eβ
نسبت شانس نشان میدهد که با افزایش یک واحد در متغیر مستقل، احتمال وقوع رویداد چند برابر میشود. برای مثال، اگر نسبت شانس برای یک متغیر مستقل برابر با 2 باشد، به این معنی است که با افزایش یک واحد در آن متغیر، احتمال وقوع رویداد دو برابر میشود.
مثال عملی
فرض کنید میخواهیم احتمال اینکه یک مشتری وام بانکی دریافت کند را بر اساس درآمد و سابقه اعتباری او پیشبینی کنیم.
- متغیر وابسته: دریافت وام (بله/خیر)
- متغیرهای مستقل: درآمد (به هزار تومان) و سابقه اعتباری (امتیاز اعتباری)
پس از جمعآوری دادهها و آمادهسازی آنها، میتوانیم از رگرسیون لجستیک برای تخمین ضرایب استفاده کنیم. فرض کنید ضرایب تخمین زده شده به صورت زیر باشند:
- β0 = -5
- β1 = 0.001 (برای درآمد)
- β2 = 0.1 (برای سابقه اعتباری)
حال میتوانیم احتمال دریافت وام را برای یک مشتری با درآمد 5000 هزار تومان و سابقه اعتباری 700 محاسبه کنیم:
z = -5 + (0.001 * 5000) + (0.1 * 700) = -5 + 5 + 70 = 70
p = 1 / (1 + e-70) ≈ 1
این نتیجه نشان میدهد که احتمال دریافت وام برای این مشتری بسیار بالا است.
ارزیابی مدل رگرسیون لجستیک
برای ارزیابی عملکرد مدل رگرسیون لجستیک، میتوان از معیارهای مختلفی استفاده کرد:
- ماتریس درهمریختگی (Confusion Matrix): جدولی که تعداد پیشبینیهای درست و نادرست را نشان میدهد.
- دقت (Accuracy): نسبت پیشبینیهای درست به کل پیشبینیها.
- حساسیت (Sensitivity): نسبت پیشبینیهای درست مثبت به کل موارد مثبت واقعی.
- ویژگی (Specificity): نسبت پیشبینیهای درست منفی به کل موارد منفی واقعی.
- منحنی ROC (ROC Curve): نموداری که عملکرد مدل را در آستانههای مختلف نشان میدهد.
- AUC (Area Under the Curve): مساحت زیر منحنی ROC که یک معیار کلی از عملکرد مدل است.
- آزمون خی دو (Chi-squared test): برای بررسی معناداری آماری مدل.
کاربردهای رگرسیون لجستیک
رگرسیون لجستیک در زمینههای مختلفی کاربرد دارد، از جمله:
- بازاریابی: پیشبینی اینکه کدام مشتریان احتمالاً یک محصول را خریداری میکنند.
- پزشکی: تشخیص بیماریها بر اساس علائم و نشانهها.
- مالی: ارزیابی ریسک اعتباری مشتریان.
- بیمه: پیشبینی احتمال وقوع حوادث.
- تحلیل وب: پیشبینی اینکه کاربران چه صفحاتی را بازدید میکنند.
- پیشبینی تقلب: شناسایی تراکنشهای تقلبی.
رگرسیون لجستیک چندگانه (Multinomial Logistic Regression)
در صورتی که متغیر وابسته بیش از دو مقدار ممکن داشته باشد (مثلاً رنگ مورد علاقه: قرمز، آبی، سبز)، از رگرسیون لجستیک چندگانه استفاده میشود. در این روش، احتمال وقوع هر مقدار از متغیر وابسته به طور جداگانه محاسبه میشود.
رگرسیون لجستیک مرتبهای (Ordinal Logistic Regression)
اگر متغیر وابسته دارای مقادیر مرتب باشد (مثلاً سطح رضایت: خیلی بد، بد، متوسط، خوب، خیلی خوب)، از رگرسیون لجستیک مرتبهای استفاده میشود.
پیوند به مباحث مرتبط
- آمار توصیفی
- آمار استنباطی
- احتمالات
- توزیع نرمال
- رگرسیون خطی
- رگرسیون چندگانه
- شبکههای عصبی
- ماشین بردار پشتیبان
- درخت تصمیم
- جنگل تصادفی
- یادگیری ماشین
- دادهکاوی
- تحلیل داده
- مدلسازی آماری
- انتخاب ویژگی
- بیشبرازش (Overfitting)
- اعتبارسنجی متقابل (Cross-Validation)
- تحلیل سری زمانی
- تحلیل بقا (Survival Analysis)
- تحلیل عوامل (Factor Analysis)
استراتژیهای مرتبط، تحلیل تکنیکال و تحلیل حجم معاملات
- میانگین متحرک
- شاخص قدرت نسبی (RSI)
- MACD
- باند بولینگر
- فیبوناچی
- الگوهای کندل استیک
- حجم معاملات
- اندیکاتورهای جریان نقدی
- تحلیل بنیادی
- مدیریت ریسک
- تنظیم اندازه موقعیت
- دیورسیفیکیشن
- تحلیل سنتیمنت
- بازارهای مالی
- تحلیل تکنیکال پیشرفته
[[توضیح: دستهبندی آمار به دلیل تمرکز مقاله بر یک روش آماری، مناسبترین گزینه است. این دستهبندی به خوانندگان کمک میکند تا مقاله را در کنار سایر مطالب مرتبط با آمار پیدا کنند.]]
شروع معاملات الآن
ثبتنام در IQ Option (حداقل واریز $10) باز کردن حساب در Pocket Option (حداقل واریز $5)
به جامعه ما بپیوندید
در کانال تلگرام ما عضو شوید @strategybin و دسترسی پیدا کنید به: ✓ سیگنالهای معاملاتی روزانه ✓ تحلیلهای استراتژیک انحصاری ✓ هشدارهای مربوط به روند بازار ✓ مواد آموزشی برای مبتدیان