ग्रबब्स टेस्ट

From binaryoption
Jump to navigation Jump to search
Баннер1

ग्रबब्स परीक्षण: आउटलायर्स की पहचान के लिए एक विस्तृत गाइड

परिचय

सांख्यिकी में, डेटा का विश्लेषण करते समय हम अक्सर ऐसे मानों का सामना करते हैं जो बाकी डेटा से बहुत अलग होते हैं। इन मानों को आउटलायर कहा जाता है। आउटलायर्स कई कारणों से उत्पन्न हो सकते हैं, जैसे कि माप त्रुटियां, डेटा प्रविष्टि में गलतियां, या डेटा में वास्तविक भिन्नता। आउटलायर्स का विश्लेषण के परिणामों पर महत्वपूर्ण प्रभाव पड़ सकता है, इसलिए उन्हें पहचानना और उचित रूप से संभालना महत्वपूर्ण है।

ग्रबब्स परीक्षण एक सांख्यिकीय परीक्षण है जिसका उपयोग यह निर्धारित करने के लिए किया जाता है कि किसी डेटासेट में एक एकल आउटलायर है या नहीं। यह परीक्षण मानता है कि डेटा सामान्य रूप से वितरित (normally distributed) है। यह परीक्षण विशेष रूप से तब उपयोगी होता है जब हम यह जांचना चाहते हैं कि क्या डेटासेट में कोई स्पष्ट रूप से विषम मान मौजूद है जो समग्र पैटर्न से अलग है। बाइनरी ऑप्शन ट्रेडिंग में, आउटलायर्स को बाजार अस्थिरता या अप्रत्याशित घटनाओं के कारण देखा जा सकता है, और इनका विश्लेषण जोखिम प्रबंधन के लिए महत्वपूर्ण हो सकता है।

ग्रबब्स परीक्षण का सिद्धांत

ग्रबब्स परीक्षण इस विचार पर आधारित है कि सामान्य वितरण में, चरम मानों की संभावना कम होती है। परीक्षण एक शून्य परिकल्पना (null hypothesis) स्थापित करता है कि डेटासेट में कोई आउटलायर नहीं है। फिर यह परीक्षण डेटासेट में सबसे चरम मान की पहचान करता है और इसकी संभावना की गणना करता है कि यह मान सामान्य वितरण से उत्पन्न हो। यदि यह संभावना एक पूर्व निर्धारित महत्व स्तर (significance level) से कम है, तो शून्य परिकल्पना को अस्वीकार कर दिया जाता है, और निष्कर्ष निकाला जाता है कि डेटासेट में एक आउटलायर है।

यह परीक्षण मानक विचलन (standard deviation) और औसत (mean) का उपयोग करके आउटलायर का निर्धारण करता है। सबसे पहले, डेटासेट का औसत और मानक विचलन ज्ञात किया जाता है। फिर, प्रत्येक डेटा बिंदु के लिए एक जी-स्कोर (G-score) की गणना की जाती है, जो डेटा बिंदु और औसत के बीच के अंतर को मानक विचलन से विभाजित करके प्राप्त किया जाता है।

G = |xᵢ - μ| / σ

जहाँ:

  • xᵢ डेटासेट में एक डेटा बिंदु है
  • μ डेटासेट का औसत है
  • σ डेटासेट का मानक विचलन है

सबसे बड़ा जी-स्कोर वाला डेटा बिंदु संभावित आउटलायर है।

ग्रबब्स परीक्षण की प्रक्रिया

ग्रबब्स परीक्षण करने के लिए निम्नलिखित चरण शामिल हैं:

1. **शून्य परिकल्पना स्थापित करें:** शून्य परिकल्पना यह है कि डेटासेट में कोई आउटलायर नहीं है। 2. **महत्व स्तर का चयन करें:** महत्व स्तर (α) वह संभावना है जिसके नीचे शून्य परिकल्पना को अस्वीकार कर दिया जाएगा। सामान्यतः, α = 0.05 का उपयोग किया जाता है, जिसका अर्थ है कि 5% संभावना है कि हम गलती से एक आउटलायर की पहचान करेंगे। 3. **डेटासेट का औसत और मानक विचलन ज्ञात करें:** डेटासेट के सभी मानों का योग करके औसत ज्ञात किया जाता है, और फिर मानों की संख्या से विभाजित किया जाता है। मानक विचलन डेटासेट में मानों के फैलाव का माप है। 4. **जी-स्कोर की गणना करें:** प्रत्येक डेटा बिंदु के लिए जी-स्कोर की गणना करें। 5. **सबसे बड़ा जी-स्कोर ज्ञात करें:** डेटासेट में सबसे बड़ा जी-स्कोर ज्ञात करें। 6. **महत्वपूर्ण मान (critical value) ज्ञात करें:** ग्रबब्स परीक्षण के लिए महत्वपूर्ण मान की गणना निम्नलिखित सूत्र का उपयोग करके की जा सकती है:

Gcritical = (n - 1) / √(n)

जहाँ n डेटासेट में डेटा बिंदुओं की संख्या है।

7. **निर्णय लें:** यदि सबसे बड़ा जी-स्कोर महत्वपूर्ण मान से अधिक है, तो शून्य परिकल्पना को अस्वीकार कर दिया जाता है, और निष्कर्ष निकाला जाता है कि डेटासेट में एक आउटलायर है। अन्यथा, शून्य परिकल्पना को स्वीकार कर लिया जाता है, और निष्कर्ष निकाला जाता है कि डेटासेट में कोई आउटलायर नहीं है।

ग्रबब्स परीक्षण की सीमाएं

ग्रबब्स परीक्षण की कुछ सीमाएं हैं:

  • यह परीक्षण मानता है कि डेटा सामान्य रूप से वितरित है। यदि डेटा सामान्य रूप से वितरित नहीं है, तो परीक्षण के परिणाम अविश्वसनीय हो सकते हैं।
  • यह परीक्षण केवल एक आउटलायर का पता लगा सकता है। यदि डेटासेट में एक से अधिक आउटलायर हैं, तो परीक्षण उन्हें पहचानने में सक्षम नहीं हो सकता है।
  • यह परीक्षण आउटलायर के कारण को नहीं बताता है। यह केवल यह बताता है कि डेटासेट में एक आउटलायर मौजूद है या नहीं।

गैर-पैरामीट्रिक परीक्षण (non-parametric tests) जैसे बॉक्स प्लॉट (box plot) और इंटरक्वाटाइल रेंज (interquartile range) का उपयोग उन स्थितियों में किया जा सकता है जहां डेटा सामान्य रूप से वितरित नहीं है।

बाइनरी ऑप्शन ट्रेडिंग में ग्रबब्स परीक्षण का अनुप्रयोग

बाइनरी ऑप्शन ट्रेडिंग में, ग्रबब्स परीक्षण का उपयोग कई तरीकों से किया जा सकता है:

  • **असामान्य मूल्य आंदोलनों की पहचान:** ग्रबब्स परीक्षण का उपयोग असामान्य मूल्य आंदोलनों की पहचान करने के लिए किया जा सकता है जो तकनीकी संकेतकों (technical indicators) में गलत संकेत उत्पन्न कर सकते हैं।
  • **जोखिम प्रबंधन:** आउटलायर्स की पहचान करके, ट्रेडर्स अपने जोखिम को कम करने के लिए उचित कदम उठा सकते हैं। उदाहरण के लिए, वे आउटलायर के आसपास के ट्रेडों से बच सकते हैं या अपने स्टॉप-लॉस ऑर्डर (stop-loss orders) को समायोजित कर सकते हैं।
  • **डेटा की गुणवत्ता नियंत्रण:** डेटासेट में त्रुटियों या विसंगतियों की पहचान करने के लिए।
  • **एल्गोरिथम ट्रेडिंग:** स्वचालित ट्रेडिंग सिस्टम में, ग्रबब्स परीक्षण का उपयोग असामान्य बाजार स्थितियों का पता लगाने और तदनुसार ट्रेडिंग रणनीतियों को समायोजित करने के लिए किया जा सकता है।

उदाहरण के लिए, यदि किसी विशेष एसेट (asset) की कीमत में अचानक और अप्रत्याशित रूप से वृद्धि होती है, तो यह एक आउटलायर हो सकता है। ग्रबब्स परीक्षण का उपयोग यह निर्धारित करने के लिए किया जा सकता है कि यह मूल्य आंदोलन वास्तविक है या माप त्रुटि या अन्य कारक के कारण है। यदि परीक्षण से पता चलता है कि यह एक आउटलायर है, तो ट्रेडर इस मूल्य आंदोलन के आधार पर कोई भी ट्रेड करने से बच सकता है।

वॉल्यूम विश्लेषण (volume analysis) के साथ ग्रबब्स परीक्षण का संयोजन असामान्य मूल्य आंदोलनों की पुष्टि करने में मदद कर सकता है। यदि एक आउटलायर उच्च वॉल्यूम के साथ होता है, तो यह अधिक संभावना है कि यह एक वास्तविक बाजार घटना है।

ग्रबब्स परीक्षण का उदाहरण

मान लीजिए कि हमारे पास 10 डेटा बिंदुओं का एक डेटासेट है: 10, 12, 11, 13, 14, 12, 11, 12, 13, 50।

1. **शून्य परिकल्पना:** डेटासेट में कोई आउटलायर नहीं है। 2. **महत्व स्तर:** α = 0.05 3. **औसत:** μ = 16.1 4. **मानक विचलन:** σ = 12.67 5. **जी-स्कोर:**

| डेटा बिंदु | जी-स्कोर | |---|---| | 10 | 0.47 | | 12 | 0.31 | | 11 | 0.39 | | 13 | 0.23 | | 14 | 0.15 | | 12 | 0.31 | | 11 | 0.39 | | 12 | 0.31 | | 13 | 0.23 | | 50 | 2.86 |

6. **सबसे बड़ा जी-स्कोर:** 2.86 7. **महत्वपूर्ण मान:** Gcritical = (10 - 1) / √(10) = 2.69

चूंकि सबसे बड़ा जी-स्कोर (2.86) महत्वपूर्ण मान (2.69) से अधिक है, इसलिए हम शून्य परिकल्पना को अस्वीकार करते हैं और निष्कर्ष निकालते हैं कि डेटासेट में एक आउटलायर है। इस मामले में, डेटा बिंदु 50 एक आउटलायर है।

अन्य आउटलायर डिटेक्शन विधियां

ग्रबब्स परीक्षण के अलावा, आउटलायर्स का पता लगाने के लिए कई अन्य विधियां उपलब्ध हैं:

  • **बॉक्स प्लॉट:** बॉक्स प्लॉट डेटा के वितरण का एक दृश्य प्रतिनिधित्व है जो संभावित आउटलायर्स को दर्शाता है।
  • **इंटरक्वाटाइल रेंज (IQR):** IQR डेटा के मध्य 50% का दायरा है। आउटलायर्स को अक्सर उन मानों के रूप में परिभाषित किया जाता है जो IQR से 1.5 गुना से कम या अधिक होते हैं।
  • **ज़ेड-स्कोर:** ज़ेड-स्कोर डेटा बिंदु और औसत के बीच के अंतर को मानक विचलन से विभाजित करके प्राप्त किया जाता है।
  • **महान दूरी (Mahalanobis distance):** यह विधि बहुभिन्नरूपी डेटा में आउटलायर्स का पता लगाने के लिए उपयोग की जाती है।
  • **डीबीएससीएएन (DBSCAN):** यह एक घनत्व-आधारित क्लस्टरिंग एल्गोरिथ्म है जो आउटलायर्स को शोर के रूप में पहचानता है।

टाइम सीरीज़ विश्लेषण (time series analysis) में, आउटलायर्स को एआरआईएमए मॉडल (ARIMA models) जैसे मॉडलों का उपयोग करके पहचाना जा सकता है।

निष्कर्ष

ग्रबब्स परीक्षण एक सरल और प्रभावी सांख्यिकीय परीक्षण है जिसका उपयोग डेटासेट में आउटलायर्स की पहचान करने के लिए किया जा सकता है। यह परीक्षण विशेष रूप से तब उपयोगी होता है जब डेटा सामान्य रूप से वितरित होता है और हमें यह जांचना होता है कि क्या डेटासेट में एक एकल आउटलायर मौजूद है। बाइनरी ऑप्शन ट्रेडिंग में, ग्रबब्स परीक्षण का उपयोग असामान्य मूल्य आंदोलनों की पहचान करने, जोखिम का प्रबंधन करने और डेटा की गुणवत्ता को नियंत्रित करने के लिए किया जा सकता है। हालांकि, ग्रबब्स परीक्षण की सीमाओं के बारे में जागरूक होना और अन्य आउटलायर डिटेक्शन विधियों का उपयोग करने पर विचार करना महत्वपूर्ण है जब डेटा सामान्य रूप से वितरित नहीं होता है या जब डेटासेट में एक से अधिक आउटलायर होने की संभावना होती है।

तकनीकी विश्लेषण (technical analysis), मौलिक विश्लेषण (fundamental analysis), चार्ट पैटर्न (chart patterns), संभावना सिद्धांत (probability theory), जोखिम मूल्यांकन (risk assessment), धन प्रबंधन (money management), ट्रेडिंग मनोविज्ञान (trading psychology), मार्केट सेंटीमेंट (market sentiment), लिक्विडिटी (liquidity), वोलैटिलिटी (volatility), फ्रेम विश्लेषण (frame analysis), कैंडलस्टिक पैटर्न (candlestick patterns), फिबोनाची रिट्रेसमेंट (Fibonacci retracement), मूविंग एवरेज (moving average), आरएसआई (RSI)।

[[Category:श्रेणी: सांख्यिकीय परीक्षण (Category:Statistical tests)]

अभी ट्रेडिंग शुरू करें

IQ Option पर रजिस्टर करें (न्यूनतम जमा $10) Pocket Option में खाता खोलें (न्यूनतम जमा $5)

हमारे समुदाय में शामिल हों

हमारे Telegram चैनल @strategybin से जुड़ें और प्राप्त करें: ✓ दैनिक ट्रेडिंग सिग्नल ✓ विशेष रणनीति विश्लेषण ✓ बाजार की प्रवृत्ति पर अलर्ट ✓ शुरुआती के लिए शिक्षण सामग्री

Баннер