गैर-पर्यवेक्षित शिक्षण (Unsupervised Learning)
गैर पर्यवेक्षित शिक्षण (Unsupervised Learning)
परिचय
गैर पर्यवेक्षित शिक्षण, मशीन लर्निंग का एक महत्वपूर्ण हिस्सा है, जहाँ एल्गोरिदम को लेबल किए गए डेटा के बिना डेटा में पैटर्न खोजने के लिए प्रशिक्षित किया जाता है। इसका अर्थ है कि एल्गोरिदम को यह नहीं बताया जाता है कि सही उत्तर क्या है; इसके बजाय, इसे स्वयं डेटा में संरचना और संबंध ढूंढने होते हैं। यह पर्यवेक्षित शिक्षण (Supervised Learning) से अलग है, जिसमें एल्गोरिदम को लेबल किए गए डेटा पर प्रशिक्षित किया जाता है, जहाँ प्रत्येक इनपुट के लिए सही आउटपुट ज्ञात होता है।
गैर पर्यवेक्षित शिक्षण का उपयोग विभिन्न प्रकार के अनुप्रयोगों में किया जाता है, जिनमें शामिल हैं: ग्राहक विभाजन, विसंगति का पता लगाना, और डेटा विज़ुअलाइज़ेशन। डेटा माइनिंग में यह एक शक्तिशाली उपकरण है। यह वित्तीय बाजारों में भी उपयोगी हो सकता है, विशेष रूप से तकनीकी विश्लेषण और वॉल्यूम विश्लेषण में, जहाँ छिपे हुए रुझानों और पैटर्नों को उजागर किया जा सकता है।
गैर पर्यवेक्षित शिक्षण के प्रकार
गैर पर्यवेक्षित शिक्षण के मुख्य प्रकार निम्नलिखित हैं:
- **क्लस्टरिंग (Clustering):** इस तकनीक में, डेटा को समान विशेषताओं के आधार पर समूहों (Clusters) में विभाजित किया जाता है। एक ही समूह के डेटा बिंदु एक-दूसरे के समान होते हैं, जबकि विभिन्न समूहों के डेटा बिंदु भिन्न होते हैं। के-मीन्स क्लस्टरिंग और पदानुक्रमित क्लस्टरिंग दो सामान्य क्लस्टरिंग एल्गोरिदम हैं।
- **डायमेंशनलिटी रिडक्शन (Dimensionality Reduction):** उच्च-आयामी डेटा को कम-आयामी डेटा में बदलने की प्रक्रिया को डायमेंशनलिटी रिडक्शन कहा जाता है। इसका उद्देश्य डेटा की महत्वपूर्ण जानकारी को बनाए रखते हुए डेटा की जटिलता को कम करना है। प्रिंसिपल कंपोनेंट एनालिसिस (PCA) और टी-वितरित स्टोकेस्टिक पड़ोसी एम्बेडिंग (t-SNE) दो लोकप्रिय डायमेंशनलिटी रिडक्शन तकनीकें हैं।
- **एसोसिएशन रूल लर्निंग (Association Rule Learning):** यह तकनीक डेटा में आइटमों के बीच संबंधों की खोज करती है। उदाहरण के लिए, यह पता लगा सकता है कि ग्राहक जो उत्पाद A खरीदते हैं, वे अक्सर उत्पाद B भी खरीदते हैं। एप्रियोरी एल्गोरिदम और इक्लेट एल्गोरिदम एसोसिएशन रूल लर्निंग के लिए सामान्य एल्गोरिदम हैं।
- **विसंगति का पता लगाना (Anomaly Detection):** यह तकनीक डेटा में असामान्य डेटा बिंदुओं की पहचान करती है जो सामान्य पैटर्न से विचलित होते हैं। इसका उपयोग धोखाधड़ी का पता लगाने, दोषपूर्ण उत्पादों की पहचान करने और असामान्य घटनाओं का पता लगाने के लिए किया जा सकता है। आइसोलेशन फ़ॉरेस्ट और वन-क्लास एसवीएम विसंगति का पता लगाने के लिए उपयोग किए जाने वाले एल्गोरिदम हैं।
क्लस्टरिंग (Clustering)
क्लस्टरिंग एक शक्तिशाली तकनीक है जिसका उपयोग डेटा को सार्थक समूहों में विभाजित करने के लिए किया जा सकता है। यह तब उपयोगी होता है जब डेटा में कोई स्पष्ट लेबल नहीं होता है और हम डेटा की अंतर्निहित संरचना को समझना चाहते हैं।
- **के-मीन्स क्लस्टरिंग:** यह एक लोकप्रिय क्लस्टरिंग एल्गोरिदम है जो डेटा बिंदुओं को k समूहों में विभाजित करता है, जहाँ प्रत्येक डेटा बिंदु उस समूह से संबंधित होता है जिसके केंद्र (मीन) के सबसे करीब होता है। के-मीन्स एल्गोरिदम की जटिलता O(n * k * i) है, जहाँ n डेटा बिंदुओं की संख्या है, k समूहों की संख्या है, और i पुनरावृत्तियों की संख्या है।
- **पदानुक्रमित क्लस्टरिंग:** यह एल्गोरिदम डेटा बिंदुओं का एक पदानुक्रमित क्लस्टर बनाता है। यह डेटा बिंदुओं को व्यक्तिगत समूहों के रूप में शुरू करता है और फिर धीरे-धीरे सबसे करीब के समूहों को मर्ज करता है जब तक कि सभी डेटा बिंदु एक ही समूह में न हों। एग्लोमेरेटिव क्लस्टरिंग और विभाजनशील क्लस्टरिंग दो प्रकार के पदानुक्रमित क्लस्टरिंग हैं।
डायमेंशनलिटी रिडक्शन (Dimensionality Reduction)
उच्च-आयामी डेटा के साथ काम करना मुश्किल हो सकता है, क्योंकि यह कंप्यूटेशनली महंगा हो सकता है और ओवरफिटिंग का कारण बन सकता है। डायमेंशनलिटी रिडक्शन तकनीकों का उपयोग डेटा की जटिलता को कम करने और महत्वपूर्ण जानकारी को बनाए रखने के लिए किया जा सकता है।
- **प्रिंसिपल कंपोनेंट एनालिसिस (PCA):** यह एक लोकप्रिय डायमेंशनलिटी रिडक्शन तकनीक है जो डेटा में सबसे महत्वपूर्ण दिशाओं (प्रिंसिपल कंपोनेंट्स) की पहचान करती है। फिर, डेटा को इन प्रिंसिपल कंपोनेंट्स पर प्रोजेक्ट किया जाता है, जिससे डेटा की डायमेंशनलिटी कम हो जाती है।
- **टी-वितरित स्टोकेस्टिक पड़ोसी एम्बेडिंग (t-SNE):** यह एक गैर-रैखिक डायमेंशनलिटी रिडक्शन तकनीक है जो उच्च-आयामी डेटा को निम्न-आयामी स्थान में विज़ुअलाइज़ करने के लिए विशेष रूप से उपयोगी है।
एसोसिएशन रूल लर्निंग (Association Rule Learning)
एसोसिएशन रूल लर्निंग का उपयोग डेटा में आइटमों के बीच संबंधों की खोज के लिए किया जाता है। यह तब उपयोगी होता है जब हम यह जानना चाहते हैं कि कौन से आइटम एक साथ होने की संभावना रखते हैं।
- **एप्रियोरी एल्गोरिदम:** यह एक लोकप्रिय एसोसिएशन रूल लर्निंग एल्गोरिदम है जो डेटा में बार-बार होने वाले आइटमसेट की पहचान करता है। फिर, इन आइटमसेट का उपयोग एसोसिएशन नियमों को उत्पन्न करने के लिए किया जाता है।
- **इक्लेट एल्गोरिदम:** यह एप्रियोरी एल्गोरिदम का एक विकल्प है जो डेटा को ऊर्ध्वाधर रूप से संग्रहीत करके बेहतर प्रदर्शन प्रदान करता है।
विसंगति का पता लगाना (Anomaly Detection)
विसंगति का पता लगाना डेटा में असामान्य डेटा बिंदुओं की पहचान करने की प्रक्रिया है। इसका उपयोग विभिन्न प्रकार के अनुप्रयोगों में किया जा सकता है, जिनमें शामिल हैं: धोखाधड़ी का पता लगाना, दोषपूर्ण उत्पादों की पहचान करना और असामान्य घटनाओं का पता लगाना।
- **आइसोलेशन फ़ॉरेस्ट:** यह एक कुशल विसंगति का पता लगाने वाला एल्गोरिदम है जो डेटा बिंदुओं को अलग करने के लिए रैंडम विभाजन का उपयोग करता है। विसंगतियां सामान्य डेटा बिंदुओं की तुलना में कम विभाजन के साथ अलग हो जाएंगी।
- **वन-क्लास एसवीएम:** यह एक पर्यवेक्षित शिक्षण एल्गोरिदम है जिसे गैर-पर्यवेक्षित तरीके से विसंगति का पता लगाने के लिए अनुकूलित किया जा सकता है। यह एल्गोरिदम सामान्य डेटा का एक मॉडल सीखता है और फिर उन डेटा बिंदुओं की पहचान करता है जो इस मॉडल से विचलित होते हैं।
वित्तीय बाजारों में अनुप्रयोग
गैर पर्यवेक्षित शिक्षण का उपयोग वित्तीय बाजारों में विभिन्न प्रकार के अनुप्रयोगों में किया जा सकता है:
- **पोर्टफोलियो अनुकूलन:** क्लस्टरिंग का उपयोग समान निवेश प्रोफाइल वाले शेयरों को समूहीकृत करने के लिए किया जा सकता है, जिससे पोर्टफोलियो विविधीकरण में मदद मिलती है।
- **धोखाधड़ी का पता लगाना:** विसंगति का पता लगाने का उपयोग असामान्य लेनदेन की पहचान करने के लिए किया जा सकता है जो धोखाधड़ी का संकेत दे सकते हैं। एल्गोरिथम ट्रेडिंग में भी इसका उपयोग किया जा सकता है।
- **बाजार विभाजन:** क्लस्टरिंग का उपयोग निवेशकों को उनकी जोखिम सहनशीलता और निवेश लक्ष्यों के आधार पर विभाजित करने के लिए किया जा सकता है।
- **ट्रेंड एनालिसिस:** डायमेंशनलिटी रिडक्शन का उपयोग बाजार के रुझानों को उजागर करने के लिए किया जा सकता है। मूविंग एवरेज और आरएसआई जैसे संकेतकों के साथ संयोजन में इसका उपयोग किया जा सकता है।
- **वॉल्यूम विश्लेषण:** क्लस्टरिंग का उपयोग असामान्य व
अभी ट्रेडिंग शुरू करें
IQ Option पर रजिस्टर करें (न्यूनतम जमा $10) Pocket Option में खाता खोलें (न्यूनतम जमा $5)
हमारे समुदाय में शामिल हों
हमारे Telegram चैनल @strategybin से जुड़ें और प्राप्त करें: ✓ दैनिक ट्रेडिंग सिग्नल ✓ विशेष रणनीति विश्लेषण ✓ बाजार की प्रवृत्ति पर अलर्ट ✓ शुरुआती के लिए शिक्षण सामग्री

