Optimizing Distributed Training Approaches for Scaling Neural Networks

2503.23186

Total: 1

#1 Optimizing Distributed Training Approaches for Scaling Neural Networks [PDF] [Copy] [Kimi¹] [REL]

Authors: Vishnu Vardhan Baligodugula, Fathi Amsaad

This paper presents a comparative analysis of distributed training strategies for large-scale neural networks, focusing on data parallelism, model parallelism, and hybrid approaches. We evaluate these strategies on image classification tasks using the CIFAR-100 dataset, measuring training time, convergence rate, and model accuracy. Our experimental results demonstrate that hybrid parallelism achieves a 3.2x speedup compared to single-device training while maintaining comparable accuracy. We propose an adaptive scheduling algorithm that dynamically switches between parallelism strategies based on network characteristics and available computational resources, resulting in an additional 18% improvement in training efficiency.

Subject: Distributed, Parallel, and Cluster Computing

Publish: 2025-03-29 18:51:56 UTC

2503.23186

#1 Optimizing Distributed Training Approaches for Scaling Neural Networks [PDF] [Copy] [Kimi1] [REL]

#1 Optimizing Distributed Training Approaches for Scaling Neural Networks [PDF] [Copy] [Kimi¹] [REL]