ضریب همبستگی اسپیرمن

From binaryoption
Jump to navigation Jump to search
Баннер1

ضریب همبستگی اسپیرمن

ضریب همبستگی اسپیرمن (Spearman's rank correlation coefficient) یکی از روش‌های آماری غیرپارامتری است که برای اندازه‌گیری قدرت و جهت رابطه یکنواخت بین دو متغیر رتبه‌بندی شده استفاده می‌شود. این ضریب، بر خلاف ضریب همبستگی پیرسون (Pearson correlation coefficient) که بر اساس مقادیر واقعی متغیرها محاسبه می‌شود، بر اساس رتبه‌های متغیرها عمل می‌کند. به عبارت دیگر، اسپیرمن به جای اینکه به تفاوت در مقادیر توجه کند، به تفاوت در رتبه‌ها توجه می‌کند. این ویژگی، ضریب اسپیرمن را به گزینه‌ای مناسب در مواردی تبدیل می‌کند که داده‌ها دارای توزیع نرمال نیستند یا داده‌ها به صورت رتبه‌ای (مانند رتبه‌بندی ترجیحات) در دسترس هستند.

تاریخچه

ضریب همبستگی اسپیرمن توسط چالز اسپیرمن (Charles Spearman) در سال 1904 معرفی شد. اسپیرمن در تحقیقات خود در زمینه هوش (Intelligence) به دنبال روشی بود تا رابطه بین نمرات آزمون‌های مختلف را بررسی کند، بدون اینکه فرض نرمال بودن توزیع داده‌ها را داشته باشد. این امر منجر به توسعه ضریب همبستگی رتبه‌ای شد که امروزه به نام او شناخته می‌شود.

مفاهیم کلیدی

  • رتبه‌بندی (Ranking): پیش از محاسبه ضریب اسپیرمن، باید رتبه‌های هر یک از متغیرها تعیین شود. رتبه‌بندی به معنای مرتب‌سازی داده‌ها از کوچک‌ترین به بزرگ‌ترین (یا برعکس) و اختصاص دادن یک عدد به هر داده بر اساس جایگاه آن در این ترتیب است.
  • رابطه یکنواخت (Monotonic Relationship): رابطه یکنواخت به رابطه‌ای گفته می‌شود که در آن با افزایش یک متغیر، متغیر دیگر به‌طور پیوسته افزایش یا کاهش می‌یابد. این رابطه می‌تواند خطی یا غیرخطی باشد.
  • غیرپارامتری (Nonparametric): روش‌های غیرپارامتری، روش‌هایی هستند که نیازی به فرض‌های خاصی در مورد توزیع داده‌ها ندارند. ضریب اسپیرمن یک روش غیرپارامتری است و به همین دلیل، در مواردی که داده‌ها دارای توزیع نرمال نیستند، گزینه مناسبی محسوب می‌شود.

فرمول محاسبه

ضریب همبستگی اسپیرمن (ρ) با استفاده از فرمول زیر محاسبه می‌شود:

ρ = 1 - (6 Σ di2) / (n (n2 - 1))

که در آن:

  • ρ: ضریب همبستگی اسپیرمن
  • di: تفاوت بین رتبه‌های متغیر اول و متغیر دوم برای هر جفت داده
  • n: تعداد جفت داده‌ها

نحوه محاسبه گام به گام

1. **رتبه‌بندی داده‌ها:** ابتدا رتبه‌های هر یک از متغیرها را به صورت جداگانه تعیین کنید. به عبارت دیگر، داده‌های هر متغیر را از کوچک‌ترین به بزرگ‌ترین (یا برعکس) مرتب کنید و به هر داده یک رتبه اختصاص دهید. در صورت وجود داده‌های تکراری، از میانگین رتبه‌ها استفاده کنید. 2. **محاسبه تفاوت رتبه‌ها (di):** برای هر جفت داده، تفاوت بین رتبه‌های متغیر اول و متغیر دوم را محاسبه کنید. 3. **مجذور تفاوت رتبه‌ها (di2):** مجذور هر یک از تفاوت‌های رتبه‌ها را محاسبه کنید. 4. **جمع مجذور تفاوت رتبه‌ها (Σ di2):** مجموع تمام مجذور تفاوت‌های رتبه‌ها را محاسبه کنید. 5. **محاسبه ضریب همبستگی اسپیرمن (ρ):** با استفاده از فرمول فوق، ضریب همبستگی اسپیرمن را محاسبه کنید.

تفسیر ضریب همبستگی اسپیرمن

مقدار ضریب همبستگی اسپیرمن بین -1 و +1 متغیر است:

  • ρ = +1: نشان‌دهنده یک رابطه یکنواخت مثبت کامل است. به این معنا که با افزایش یک متغیر، متغیر دیگر نیز به‌طور پیوسته افزایش می‌یابد.
  • ρ = -1: نشان‌دهنده یک رابطه یکنواخت منفی کامل است. به این معنا که با افزایش یک متغیر، متغیر دیگر به‌طور پیوسته کاهش می‌یابد.
  • ρ = 0: نشان‌دهنده عدم وجود رابطه یکنواخت بین دو متغیر است.
  • مقادیر بین -1 و +1: نشان‌دهنده درجه‌ای از رابطه یکنواخت هستند. هرچه مقدار ضریب به +1 یا -1 نزدیک‌تر باشد، رابطه قوی‌تر است.

مثال

فرض کنید می‌خواهیم رابطه بین نمرات دو آزمون مختلف را بررسی کنیم. داده‌های مربوط به نمرات 5 دانش‌آموز در جدول زیر آمده است:

نمرات آزمون
آزمون 1 | آزمون 2 | 75 | 80 | 60 | 55 | 85 | 90 | 90 | 85 | 50 | 45 |

1. **رتبه‌بندی داده‌ها:**

رتبه‌بندی نمرات
آزمون 1 (رتبه) | آزمون 2 (رتبه) | 3 | 3 | 1 | 1 | 5 | 5 | 4 | 4 | 2 | 2 |

2. **محاسبه تفاوت رتبه‌ها (di):**

تفاوت رتبه‌ها
آزمون 1 (رتبه) | آزمون 2 (رتبه) | di | 3 | 3 | 0 | 1 | 1 | 0 | 5 | 5 | 0 | 4 | 4 | 0 | 2 | 2 | 0 |

3. **مجذور تفاوت رتبه‌ها (di2):**

مجذور تفاوت رتبه‌ها
آزمون 1 (رتبه) | آزمون 2 (رتبه) | di | di2 | 3 | 3 | 0 | 0 | 1 | 1 | 0 | 0 | 5 | 5 | 0 | 0 | 4 | 4 | 0 | 0 | 2 | 2 | 0 | 0 |

4. **جمع مجذور تفاوت رتبه‌ها (Σ di2):**

Σ di2 = 0 + 0 + 0 + 0 + 0 = 0

5. **محاسبه ضریب همبستگی اسپیرمن (ρ):**

ρ = 1 - (6 * 0) / (5 * (52 - 1)) = 1 - 0 = 1

در این مثال، ضریب همبستگی اسپیرمن برابر با 1 است که نشان‌دهنده یک رابطه یکنواخت مثبت کامل بین نمرات دو آزمون است.

کاربردها

  • تحلیل داده‌های مالی (Financial Data Analysis): بررسی رابطه بین بازده سهام مختلف، شاخص‌های اقتصادی و سایر متغیرهای مالی.
  • تحقیقات بازار (Market Research): بررسی رابطه بین ترجیحات مصرف‌کنندگان و ویژگی‌های محصولات.
  • روانشناسی (Psychology): بررسی رابطه بین نمرات آزمون‌های مختلف، ویژگی‌های شخصیتی و سایر متغیرهای روانشناختی.
  • علوم اجتماعی (Social Sciences): بررسی رابطه بین متغیرهای اجتماعی مختلف، مانند سطح تحصیلات و درآمد.
  • تحلیل تکنیکال (Technical Analysis): بررسی همبستگی بین قیمت‌ها و اندیکاتورهای مختلف در بازارهای مالی (Financial Markets).
  • تحلیل حجم معاملات (Volume Analysis): بررسی رابطه بین حجم معاملات و تغییرات قیمت.

مزایا و معایب

مزایا:

  • نیازی به فرض نرمال بودن توزیع داده‌ها ندارد.
  • در برابر داده‌های پرت (outliers) مقاوم‌تر است.
  • برای داده‌های رتبه‌ای مناسب است.

معایب:

  • اطلاعات مربوط به مقدار واقعی داده‌ها را در نظر نمی‌گیرد.
  • در صورتی که داده‌ها دارای رابطه غیریکنواخت باشند، ممکن است نتایج نادرستی ارائه دهد.

تفاوت با ضریب همبستگی پیرسون

ضریب همبستگی پیرسون (Pearson correlation coefficient) و ضریب همبستگی اسپیرمن (Spearman's rank correlation coefficient) هر دو برای اندازه‌گیری رابطه بین دو متغیر استفاده می‌شوند، اما تفاوت‌های مهمی بین آن‌ها وجود دارد:

  • ضریب پیرسون بر اساس مقادیر واقعی متغیرها محاسبه می‌شود، در حالی که ضریب اسپیرمن بر اساس رتبه‌های متغیرها محاسبه می‌شود.
  • ضریب پیرسون فرض می‌کند که داده‌ها دارای توزیع نرمال هستند، در حالی که ضریب اسپیرمن این فرض را ندارد.
  • ضریب پیرسون به داده‌های پرت حساس‌تر است، در حالی که ضریب اسپیرمن مقاوم‌تر است.
  • ضریب پیرسون برای اندازه‌گیری روابط خطی مناسب است، در حالی که ضریب اسپیرمن برای اندازه‌گیری روابط یکنواخت (خطی یا غیرخطی) مناسب است.

نرم‌افزارهای محاسبه

ضریب همبستگی اسپیرمن را می‌توان با استفاده از نرم‌افزارهای آماری مختلفی مانند SPSS (Statistical Package for the Social Sciences)، R (a programming language and free software environment for statistical computing and graphics)، Excel (a spreadsheet developed by Microsoft) و Python (a high-level, general-purpose programming language) محاسبه کرد.

منابع بیشتر

  • رگرسیون خطی (Linear Regression)
  • آمار توصیفی (Descriptive Statistics)
  • آمار استنباطی (Inferential Statistics)
  • توزیع نرمال (Normal Distribution)
  • داده‌های پرت (Outliers)
  • اندیکاتورهای تکنیکال (Technical Indicators)
  • الگوهای کندل استیک (Candlestick Patterns)
  • میانگین متحرک (Moving Average)
  • شاخص قدرت نسبی (Relative Strength Index - RSI)
  • باندهای بولینگر (Bollinger Bands)
  • MACD (Moving Average Convergence Divergence)
  • تحلیل فیبوناچی (Fibonacci Analysis)
  • حجم معاملات (Trading Volume)
  • نقدینگی (Liquidity)
  • نوسانات (Volatility)

شروع معاملات الآن

ثبت‌نام در IQ Option (حداقل واریز $10) باز کردن حساب در Pocket Option (حداقل واریز $5)

به جامعه ما بپیوندید

در کانال تلگرام ما عضو شوید @strategybin و دسترسی پیدا کنید به: ✓ سیگنال‌های معاملاتی روزانه ✓ تحلیل‌های استراتژیک انحصاری ✓ هشدارهای مربوط به روند بازار ✓ مواد آموزشی برای مبتدیان

Баннер