Introduction of Supervised Learning Algorithms

Supervised Learning वह तकनीक है जिसमें मॉडल को ऐसे डेटा पर प्रशिक्षित किया जाता है जिसमें इनपुट के साथ-साथ सही आउटपुट (label) भी होता है।
उदाहरण:

Input (Features)	Output (Label)
उम्र = 30, वेतन = ₹40k	लोन स्वीकृत (Yes)

अब हम ऐसे प्रमुख एल्गोरिद्म्स को समझेंगे जो Supervised Learning में सबसे ज़्यादा उपयोग होते हैं।

🔷 🔹 Why Supervised Algorithms?

Feature	Benefit
Input-output mapping defined	आसानी से train और evaluate किया जा सकता है
Classification & Regression दोनों के लिए	बहुत versatile models उपलब्ध हैं
Scalability	छोटे से बड़े डेटासेट तक लागू होता है

प्रकार	उपयोग क्षेत्र	उदाहरण
Classification	Label पहचानना	Email Spam, Disease Detection
Regression	Value predict करना	House Price, Stock Prediction

Continuous Value Prediction
(जैसे घर की कीमत, तापमान)

y = w*x + b

from sklearn.linear_model import LinearRegression

model = LinearRegression()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

Binary Classification (Yes/No)

Probability (0 to 1), फिर threshold लगाकर decision

from sklearn.linear_model import LogisticRegression

model = LogisticRegression()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

Classification और Regression दोनों के लिए
डाटा को बार-बार विभाजित करके निर्णय लेना।

from sklearn.tree import DecisionTreeClassifier

model = DecisionTreeClassifier()
model.fit(X_train, y_train)

Multiple Decision Trees का ensemble
Voting या averaging के ज़रिए output देता है।

from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier(n_estimators=100)
model.fit(X_train, y_train)

High-dimensional datasets में classification के लिए बेहतरीन

from sklearn.svm import SVC

model = SVC(kernel='linear')
model.fit(X_train, y_train)

Instance-based learning — training में कोई model नहीं, prediction के समय नज़दीकी K-पड़ोसियों को देखता है।

from sklearn.neighbors import KNeighborsClassifier

model = KNeighborsClassifier(n_neighbors=3)
model.fit(X_train, y_train)

Text classification जैसे spam detection
(Statistical probability आधारित)

from sklearn.naive_bayes import GaussianNB

model = GaussianNB()
model.fit(X_train, y_train)

Algorithm	Type	Strengths	Use Case
Linear Regression	Regression	Simple, fast	Price prediction
Logistic Regression	Classification	Probabilistic output	Spam detection
Decision Tree	Both	Interpretability	Credit approval
Random Forest	Both	Accuracy, handles overfitting	Medical diagnosis
SVM	Classification	Works in high dimensions	Face recognition
KNN	Classification	No training, easy to implement	Pattern recognition
Naive Bayes	Classification	Fast, good for text	Sentiment analysis