सूची
डाटा माइनिंग क्या है | what is Data Mining in Hindi !!
डाटा माईनिंग का मतलब डाटा को सोर्ट, क्लासीफाई करके इस प्रकार से रखना है कि हम उसे एक आसान तरीके से एनालाइज कर सकें। जैसा कि नाम से ही पता चलता है कि डाटा माइनिंग क्या है। माइनिंग का मतलब होता है खोद कर निकालना। ऐसे में हम इस प्रकार से साधारण एंव सरल भाषा में समझ सकते हैं कि डाटा माइनिंग का मतलब है एक बड़े डाटाबेस से डाटा को खोदना यानि तराशना और उसे इस प्रकार से रखना कि हम आसानी से उसका प्रयोग कर सकें। मान लीजिए हमारे पास सौ लोगों के नाम और मोबाइल नंबर हैं तो हम इस डाटाबेस को एल्फाबेटिकली लगा दें ताकि हमें जब भी किसी नाम और नंबर को ढूंढना हो तो हम आसानी से ढूंढ सकें। यह डाटा माइनिंग का एक छोटा सा उदाहरण है। लेकिन डाटा माइनिंग बड़े स्तर पर डाटा को तराशना होता है। जब डाटा काफी ज्यादा हो जाता है तो उसे संभालना और उसका प्रयोग करना काफी मुश्किल हो जाता है। ऐसे में डाटा को आर्गेनाइज करना ही डाटा माइनिंग कहलाता है।
डाटा माइनिंग की टेक्नीक्स क्या हैं | Data Mining Techniques in Hindi !!
डाटा माइनिंग करने की अलग अलग टेक्नीक्स यानि कि विधियां हैं। आप डाटा को किसी भी प्रकार से माईन कर सकते हैं। हर टेक्नीक अपने आप में बेस्ट है। आपके डाटा प्रकार और डाटा की जरूरत और डाटा के प्रयोग के अनुसार ही आप टेक्नीक चुन सकते हैं। डाटा माइिनंग टेक्नीक को हम एक प्रकार के एल्गोरिदम भी कह सकते हैं जिसमें डाटा को एक एल्गोरिदम का प्रयोग करके माइन यानि आर्गेनाइज, क्लासिफाई किया जा सकता है और भविष्य में उसका प्रयोग आसानी से किया जा सकता है। हम यहां आपको मुख्य तौर पर प्रयोग होने वाली डाटा माइनिंग टेक्नीक्स के बारे बताने जा रहे हैं। यह वह तकनीकें हैं जिनका प्रयोग डाटा माइनिंग के लिए मुख्य तौर पर आजकल किया जा रहा है। इससे आप किसी भी बड़े डाटाबेस को आर्गेनाइज कर सकते हैं ताकि उसे एनालाइज करना या उसका अध्यन करना आसान हो सके। तो निम्नलिखित प्रकार की टेक्नीक्सा का प्रयोग हम डाटा माइनिंग के लिए करते हैं।
1.एसोसिएशन
2. क्लासिफिकेशन
3. क्लस्टरिंग
4. प्रिडिक्शन
5. सिक्वेंशियल पैटर्न
6. डिसीजन ट्री
एसोसिएशन
यह तकनीक डाटा एंट्रीस या सेटस के आपसी संबंध यानि रिलेशन के आधार पर काम करती है। इसमें हम किसी डाटाबेस के डाटा आईटम्स या एंट्रीस का आपसी रिलेशन बनाते हैं और उसी उनुसार उनके सेट बना दिए जाते हैं। रिलेशन के बेस पर डाटा एंट्रीस के सेट बनाकर एसोसिएट किए जाते हैं ताकि आसानी से हम डाटा को प्रयोग कर सकें। यह सबसे ज्यादा प्रयोग की जाने वाली तकनीक है। इस तकनीक का प्रयोग करना बेहद आसान है और मौजूदा समय में यह सबसे ज्यादा प्रयोग की जा रही है।
क्लासिफिकेशन
क्लासिफिकेशन में डाटा को मैथेमैटिकल या फिर मशीन लर्निंग के अाधार पर क्लासीफाई करके अलग-अलग सेट में रखा जाता है। मुख्य तौर पर यह तकनीक मैथेमटिकल एल्गोरिदम पर काम करती है। इस तकनीक में प्रि-डिफाइंड क्लासेस होतीं हैं जिसमें डाटा के सेटस या फिर ग्रुप बना कर रखी जाती हैं। यानि कि सबसे पहले मैथेमैटिकल या फिर मशीन लर्निंग के आधार पर डाटा के सेटस और ग्रुप बनाए जाते हैं इसके बाद इन सेटस या ग्रुप्स को प्रि-डिफाइंड क्लासेस में रख दिया जाता है।
क्लस्टरिंग
क्लस्टरिंग तकनीक क्लासिफिकेशन तकनीक के उलट काम करती है। जैसे की हमने आपको बताया कि क्लासिफिकेशन में मैथेमैटिकल एल्गोरिदम के आधार पर क्लासिफाई करके और ग्रुपिंग करके प्रि-डिफाइंड क्लासेस में रखा जाता है तो वहीं क्लस्टरिंग में मैथेमैटिकल की बजाए कैरेक्टरस्टिक्स के आधार पर डाटा को क्लस्टराइज किया जाता है और नई क्लासेस बना कर उसमें डाटा को डाल दिया जाता है। इसमें क्लासिफिकेशन तकनीक की तरह क्लासेसे प्रि-डिफाइंड नहीं होती बल्कि डाटा के नेचर के हिसाब से नईं क्लासेस बनाईं जातीं हैं।
प्रिडिक्शन
जैसा कि आपको नाम से ही पता चल गया होगा प्रिडिक्शन तकनीक का प्रयोग उस प्रकार के डाटा को माइन या एनालाइज करने के लिए किया जाता है जिसमें डाटा की सहायता से कोई प्रिडिक्शन करनी हो। इसका प्रयोग ज्यादातर मार्केट ट्रेंड पता करने या सेल्स व रिटेल मार्केटिंग में प्रोफिट एंव लॉस को प्रिडिक्ट करने के लिए किया जाता है। इसमें कुछ डाटा ऑब्जेक्टस को लेकर करेंट यानि वर्तमान डाटा वेरिएबल्स के साथ कंपेयर किया जाता है और फिर एनालाइज किया जाता है। इसके अनुसार ही प्रिडिक्शन होती है।
सिक्वेंशियल पैटर्न
सिक्वेंशियल पैटर्न तकनीक डाटा माइनिंग में पूरी तरह से पैटर्न्स के आधार पर काम करती है। इस तकनीक में किसी भी डाटाबेस में मिलते-जुलते पैटर्न ढूंढे जाते हैं। इसके बाद इन पैटर्न्स को आधार बना कर ही डाटा को सिक्वेंस में रखा जाता है। ताकि पैटर्न्स के आधार पर आसानी से ढूंढ कर एनालाइज किया जा सके।
डिसीजन ट्री
डिसीजन ट्री को भी आप एक ऐसी तकनीक के रूप में देख सकते हैं जिसमें एक डाटाबेस के डाटा के आधार पर आपको डिसीजन बनाना हो। यह तकनीक तभी प्रयोग में लाइ जाती है जिसमें डिसीजन लेना हो। इसमें एक सवाल या फिक कंडीशन को आधार बनाया जाता है। इस सवाल या कंडीशन के एक से ज्यादा जवाब होते हैं। हर जवाब को आधार बनाकर एनालाइज किया जाता है। उदाहरण के तौर पर अगर एक सवाल है तो उसके तीन जवाब हैं तो फिर हम हर जवाब को परख कर देखते हैं कि कौन-सा सटीक या फिक सटीक के आसपास सही बैठता है। ऐसे में डिसीजन लेने में मदद मिलती है।
डाटा माइनिंग फंक्शनेलिटी क्या है | Data mining Functionalities in Hindi !!
डाटा माइनिंग फंक्शनेलिटी का मतलब है एक बड़े डाटा सेट में से ऐसे पैटर्न निकालना जिनका आपसी रिलेशन हो और जिनके आधार पर डाटा को आसानी से एनालाइज किया जा सके। ऐसे में मुख्य तौर पर डाटा फंक्शनेलिटी दो प्रकार की होती है।
1. डिस्क्रिप्टिव
2. प्रिडिक्टिव
1. डिस्क्रिप्टिव –
डिस्क्रिप्टिव डाटा माइनिंग फंक्शनेलिटी में हम डाटा के जनरल फीचर या जनरल कैरेक्टरिस्टिक्स के आधार पर डाटा को माइन करके एनालाइज करते हैं। इसमें हमारा उददेश्य डाटा के नेचर और बिहेवियर का पता लगाना होता है ताकि डाटा के कैरेक्टरिस्टिक्स के आधार पर उसे सोर्ट किया जा सके और आगे एनालाइज किया जा सके।
2. प्रिडिक्टिव-
वहीं दूसरी तरफ प्रिडिक्टिव में हम डाटा वेरिएबल्स को लेकर आपस में कंपेयर यानि तुलना करते हैं जिससे हम आगे के ट्रेंडस को प्रिडिक्ट कर सकें। इसमें हमारा उददेश्य डाटा को कंपेयर करके प्रिडिक्ट करना होता है।