आइए अब हम Machine Learning के तीनों मुख्य प्रकारों को एक साथ समझते हैं:
🔷 1️⃣ Supervised Learning
📌 परिभाषा:
Supervised Learning में मशीन को ऐसा डेटा दिया जाता है जिसमें इनपुट और उसका सही आउटपुट पहले से तय होता है (लेबल्ड डेटा)। मशीन उसी से पैटर्न सीखती है और भविष्य की भविष्यवाणी करती है।
🧠 उदाहरण:
इनपुट (Features) | आउटपुट (Label) |
---|---|
उम्र = 25, वेतन = ₹30k | लोन स्वीकृत (Yes) |
उम्र = 45, वेतन = ₹60k | लोन अस्वीकृत (No) |
✅ उपयोग:
- Spam detection
- Disease prediction
- Price prediction
- Image classification
🔷 2️⃣ Unsupervised Learning
📌 परिभाषा:
Unsupervised Learning में मशीन को केवल इनपुट डेटा दिया जाता है, बिना किसी लेबल या सही उत्तर के। मशीन खुद डेटा के पैटर्न और समूह पहचानती है।
🧠 उदाहरण:
आपके पास ग्राहकों का खरीद डेटा है, लेकिन आप नहीं जानते कि कौन किस कैटेगरी का है — मशीन खुद समूह बना लेगी (क्लस्टरिंग)।
✅ उपयोग:
- Customer segmentation
- Market basket analysis
- Anomaly detection
- Recommendation systems
🔷 3️⃣ Reinforcement Learning
📌 परिभाषा:
इसमें एक Agent होता है जो Environment में काम करता है।
मशीन अपने एक्शन पर Reward (इनाम) या Penalty (सज़ा) पाती है और उसी से सीखती है।
🏆 उद्देश्य: सही नीति (Policy) सीखना जिससे अधिकतम Reward मिले।
🧠 उदाहरण:
- गेम खेलना (e.g. Chess, Go)
- Self-driving cars
- Robotics
📊 तुलना तालिका / Comparison Table:
विशेषता | Supervised Learning | Unsupervised Learning | Reinforcement Learning |
---|---|---|---|
इनपुट | लेबल्ड डेटा | अनलेबल्ड डेटा | स्टेट्स और रिवॉर्ड |
आउटपुट | ज्ञात (Known) | अज्ञात (Unknown) | सीखता है ट्रायल और एरर से |
मुख्य उद्देश्य | भविष्यवाणी | पैटर्न खोजना | सही एक्शन सीखना |
एल्गोरिद्म उदाहरण | Linear Regression, SVM | K-Means, PCA | Q-Learning, DQN |
उपयोग क्षेत्र | Email spam, Disease detection | Customer groups | गेम, रोबोटिक्स |
📌 चित्र / Diagram:
+-------------------+
| Machine Learning |
+-------------------+
|
--------------------------------
| | |
Supervised Unsupervised Reinforcement
(With labels) (No labels) (With reward)
🎯 निष्कर्ष / Conclusion:
- Supervised Learning सिखाया जाता है (शिक्षक के साथ)
- Unsupervised Learning खुद सीखता है (बिना शिक्षक के)
- Reinforcement Learning अनुभव से सीखता है (इनाम और सज़ा से)