Convolution एक mathematical operation है जो दो functions (या arrays) को combine करता है ताकि तीसरा function निकाला जा सके जो दोनों का अर्थपूर्ण interaction बताता है।
Deep Learning में, convolution का उपयोग image से features निकालने के लिए किया जाता है — जैसे edges, patterns, curves आदि।
🧮 Convolution in Math (1D):
जहाँ:
x = input
w = filter/kernel
∗ = convolution operation
📸 2. Convolution in Images (2D Case)
✅ Image = 2D Matrix of Pixels
✅ Filter/Kernel = Small matrix (e.g. 3×3, 5×5)
Operation:
Filter को image के ऊपर slide किया जाता है (called stride)
हर जगह पर input और filter के corresponding values multiply और sum होते हैं
Deep Neural Network (DNN) एक ऐसा artificial neural network होता है जिसमें एक से ज़्यादा hidden layers होते हैं।
👉 यह shallow network (जैसे simple MLP जिसमें 1 hidden layer हो) से अलग होता है क्योंकि इसमें “depth” होती है — यानी कई layers जो input से output तक data को progressively abstract करती हैं।
लेकिन complex tasks (जैसे image recognition, NLP, audio classification) में input-output relationship बहुत nonlinear होती है
✅ Deep networks:
High-level features को automatically extract कर सकते हैं
Abstractions को hierarchy में capture करते हैं
🧠 Hierarchical Feature Learning:
Layer
Learns
Layer 1
Edges, curves
Layer 2
Shapes, textures
Layer 3
Objects, faces
🔶 DNN की Architecture क्या होती है?
Architecture का मतलब होता है कि DNN में कितनी layers हैं, हर layer में कितने neurons हैं, activation functions क्या हैं, और input-output data का flow कैसा है।