ضریب همبستگی اسپیرمن
ضریب همبستگی اسپیرمن
ضریب همبستگی اسپیرمن (Spearman's rank correlation coefficient) یکی از روشهای آماری غیرپارامتری است که برای اندازهگیری قدرت و جهت رابطه یکنواخت بین دو متغیر رتبهبندی شده استفاده میشود. این ضریب، بر خلاف ضریب همبستگی پیرسون (Pearson correlation coefficient) که بر اساس مقادیر واقعی متغیرها محاسبه میشود، بر اساس رتبههای متغیرها عمل میکند. به عبارت دیگر، اسپیرمن به جای اینکه به تفاوت در مقادیر توجه کند، به تفاوت در رتبهها توجه میکند. این ویژگی، ضریب اسپیرمن را به گزینهای مناسب در مواردی تبدیل میکند که دادهها دارای توزیع نرمال نیستند یا دادهها به صورت رتبهای (مانند رتبهبندی ترجیحات) در دسترس هستند.
تاریخچه
ضریب همبستگی اسپیرمن توسط چالز اسپیرمن (Charles Spearman) در سال 1904 معرفی شد. اسپیرمن در تحقیقات خود در زمینه هوش (Intelligence) به دنبال روشی بود تا رابطه بین نمرات آزمونهای مختلف را بررسی کند، بدون اینکه فرض نرمال بودن توزیع دادهها را داشته باشد. این امر منجر به توسعه ضریب همبستگی رتبهای شد که امروزه به نام او شناخته میشود.
مفاهیم کلیدی
- رتبهبندی (Ranking): پیش از محاسبه ضریب اسپیرمن، باید رتبههای هر یک از متغیرها تعیین شود. رتبهبندی به معنای مرتبسازی دادهها از کوچکترین به بزرگترین (یا برعکس) و اختصاص دادن یک عدد به هر داده بر اساس جایگاه آن در این ترتیب است.
- رابطه یکنواخت (Monotonic Relationship): رابطه یکنواخت به رابطهای گفته میشود که در آن با افزایش یک متغیر، متغیر دیگر بهطور پیوسته افزایش یا کاهش مییابد. این رابطه میتواند خطی یا غیرخطی باشد.
- غیرپارامتری (Nonparametric): روشهای غیرپارامتری، روشهایی هستند که نیازی به فرضهای خاصی در مورد توزیع دادهها ندارند. ضریب اسپیرمن یک روش غیرپارامتری است و به همین دلیل، در مواردی که دادهها دارای توزیع نرمال نیستند، گزینه مناسبی محسوب میشود.
فرمول محاسبه
ضریب همبستگی اسپیرمن (ρ) با استفاده از فرمول زیر محاسبه میشود:
ρ = 1 - (6 Σ di2) / (n (n2 - 1))
که در آن:
- ρ: ضریب همبستگی اسپیرمن
- di: تفاوت بین رتبههای متغیر اول و متغیر دوم برای هر جفت داده
- n: تعداد جفت دادهها
نحوه محاسبه گام به گام
1. **رتبهبندی دادهها:** ابتدا رتبههای هر یک از متغیرها را به صورت جداگانه تعیین کنید. به عبارت دیگر، دادههای هر متغیر را از کوچکترین به بزرگترین (یا برعکس) مرتب کنید و به هر داده یک رتبه اختصاص دهید. در صورت وجود دادههای تکراری، از میانگین رتبهها استفاده کنید. 2. **محاسبه تفاوت رتبهها (di):** برای هر جفت داده، تفاوت بین رتبههای متغیر اول و متغیر دوم را محاسبه کنید. 3. **مجذور تفاوت رتبهها (di2):** مجذور هر یک از تفاوتهای رتبهها را محاسبه کنید. 4. **جمع مجذور تفاوت رتبهها (Σ di2):** مجموع تمام مجذور تفاوتهای رتبهها را محاسبه کنید. 5. **محاسبه ضریب همبستگی اسپیرمن (ρ):** با استفاده از فرمول فوق، ضریب همبستگی اسپیرمن را محاسبه کنید.
تفسیر ضریب همبستگی اسپیرمن
مقدار ضریب همبستگی اسپیرمن بین -1 و +1 متغیر است:
- ρ = +1: نشاندهنده یک رابطه یکنواخت مثبت کامل است. به این معنا که با افزایش یک متغیر، متغیر دیگر نیز بهطور پیوسته افزایش مییابد.
- ρ = -1: نشاندهنده یک رابطه یکنواخت منفی کامل است. به این معنا که با افزایش یک متغیر، متغیر دیگر بهطور پیوسته کاهش مییابد.
- ρ = 0: نشاندهنده عدم وجود رابطه یکنواخت بین دو متغیر است.
- مقادیر بین -1 و +1: نشاندهنده درجهای از رابطه یکنواخت هستند. هرچه مقدار ضریب به +1 یا -1 نزدیکتر باشد، رابطه قویتر است.
مثال
فرض کنید میخواهیم رابطه بین نمرات دو آزمون مختلف را بررسی کنیم. دادههای مربوط به نمرات 5 دانشآموز در جدول زیر آمده است:
آزمون 1 | آزمون 2 | | 75 | 80 | | 60 | 55 | | 85 | 90 | | 90 | 85 | | 50 | 45 | |
1. **رتبهبندی دادهها:**
آزمون 1 (رتبه) | آزمون 2 (رتبه) | | 3 | 3 | | 1 | 1 | | 5 | 5 | | 4 | 4 | | 2 | 2 | |
2. **محاسبه تفاوت رتبهها (di):**
آزمون 1 (رتبه) | آزمون 2 (رتبه) | di | | 3 | 3 | 0 | | 1 | 1 | 0 | | 5 | 5 | 0 | | 4 | 4 | 0 | | 2 | 2 | 0 | |
3. **مجذور تفاوت رتبهها (di2):**
آزمون 1 (رتبه) | آزمون 2 (رتبه) | di | di2 | | 3 | 3 | 0 | 0 | | 1 | 1 | 0 | 0 | | 5 | 5 | 0 | 0 | | 4 | 4 | 0 | 0 | | 2 | 2 | 0 | 0 | |
4. **جمع مجذور تفاوت رتبهها (Σ di2):**
Σ di2 = 0 + 0 + 0 + 0 + 0 = 0
5. **محاسبه ضریب همبستگی اسپیرمن (ρ):**
ρ = 1 - (6 * 0) / (5 * (52 - 1)) = 1 - 0 = 1
در این مثال، ضریب همبستگی اسپیرمن برابر با 1 است که نشاندهنده یک رابطه یکنواخت مثبت کامل بین نمرات دو آزمون است.
کاربردها
- تحلیل دادههای مالی (Financial Data Analysis): بررسی رابطه بین بازده سهام مختلف، شاخصهای اقتصادی و سایر متغیرهای مالی.
- تحقیقات بازار (Market Research): بررسی رابطه بین ترجیحات مصرفکنندگان و ویژگیهای محصولات.
- روانشناسی (Psychology): بررسی رابطه بین نمرات آزمونهای مختلف، ویژگیهای شخصیتی و سایر متغیرهای روانشناختی.
- علوم اجتماعی (Social Sciences): بررسی رابطه بین متغیرهای اجتماعی مختلف، مانند سطح تحصیلات و درآمد.
- تحلیل تکنیکال (Technical Analysis): بررسی همبستگی بین قیمتها و اندیکاتورهای مختلف در بازارهای مالی (Financial Markets).
- تحلیل حجم معاملات (Volume Analysis): بررسی رابطه بین حجم معاملات و تغییرات قیمت.
مزایا و معایب
مزایا:
- نیازی به فرض نرمال بودن توزیع دادهها ندارد.
- در برابر دادههای پرت (outliers) مقاومتر است.
- برای دادههای رتبهای مناسب است.
معایب:
- اطلاعات مربوط به مقدار واقعی دادهها را در نظر نمیگیرد.
- در صورتی که دادهها دارای رابطه غیریکنواخت باشند، ممکن است نتایج نادرستی ارائه دهد.
تفاوت با ضریب همبستگی پیرسون
ضریب همبستگی پیرسون (Pearson correlation coefficient) و ضریب همبستگی اسپیرمن (Spearman's rank correlation coefficient) هر دو برای اندازهگیری رابطه بین دو متغیر استفاده میشوند، اما تفاوتهای مهمی بین آنها وجود دارد:
- ضریب پیرسون بر اساس مقادیر واقعی متغیرها محاسبه میشود، در حالی که ضریب اسپیرمن بر اساس رتبههای متغیرها محاسبه میشود.
- ضریب پیرسون فرض میکند که دادهها دارای توزیع نرمال هستند، در حالی که ضریب اسپیرمن این فرض را ندارد.
- ضریب پیرسون به دادههای پرت حساستر است، در حالی که ضریب اسپیرمن مقاومتر است.
- ضریب پیرسون برای اندازهگیری روابط خطی مناسب است، در حالی که ضریب اسپیرمن برای اندازهگیری روابط یکنواخت (خطی یا غیرخطی) مناسب است.
نرمافزارهای محاسبه
ضریب همبستگی اسپیرمن را میتوان با استفاده از نرمافزارهای آماری مختلفی مانند SPSS (Statistical Package for the Social Sciences)، R (a programming language and free software environment for statistical computing and graphics)، Excel (a spreadsheet developed by Microsoft) و Python (a high-level, general-purpose programming language) محاسبه کرد.
منابع بیشتر
- رگرسیون خطی (Linear Regression)
- آمار توصیفی (Descriptive Statistics)
- آمار استنباطی (Inferential Statistics)
- توزیع نرمال (Normal Distribution)
- دادههای پرت (Outliers)
- اندیکاتورهای تکنیکال (Technical Indicators)
- الگوهای کندل استیک (Candlestick Patterns)
- میانگین متحرک (Moving Average)
- شاخص قدرت نسبی (Relative Strength Index - RSI)
- باندهای بولینگر (Bollinger Bands)
- MACD (Moving Average Convergence Divergence)
- تحلیل فیبوناچی (Fibonacci Analysis)
- حجم معاملات (Trading Volume)
- نقدینگی (Liquidity)
- نوسانات (Volatility)
شروع معاملات الآن
ثبتنام در IQ Option (حداقل واریز $10) باز کردن حساب در Pocket Option (حداقل واریز $5)
به جامعه ما بپیوندید
در کانال تلگرام ما عضو شوید @strategybin و دسترسی پیدا کنید به: ✓ سیگنالهای معاملاتی روزانه ✓ تحلیلهای استراتژیک انحصاری ✓ هشدارهای مربوط به روند بازار ✓ مواد آموزشی برای مبتدیان