technology
未读
深度学习:线性回归的从零开始实验
本文详述了如何从零开始构建线性回归模型,重点在于理解其核心组件:数据集生成、数据读取、参数初始化、模型定义、损失函数以及优化算法。通过实验,我们观察到模型能有效拟合数据,学到的参数与真实值高度接近,验证了方法的有效性。文章还探讨了权重初始化为零的影响,并确认了自动微分在学习模型参数方面的普适性。此外,对于二阶导数计算可能遇到的问题及其解决方案,以及`reshape`函数在损失计算中的必要性,都进行了细致的分析。最后,通过不同学习率的对比实验,揭示了学习率选择对模型收敛速度和稳定性的关键影响,并说明了当样本数不能被批量大小整除时,数据迭代器的处理方式。本实验不仅夯实了深度学习基础,也为理解更复杂的模型奠定了坚实基础,其价值在于提供了一个严谨且易于理解的实践范例。
technology
未读
深度学习:使用云服务器搭建环境
本文记录了作者时隔两年后重新学习深度学习的历程,重点在于利用“算力自由平台”搭建环境,并以《动手学深度学习》为教材。文章详细介绍了如何选择服务器、配置Jupyter Lab环境,以及巧妙地切换和注册conda环境为Jupyter内核,确保了学习的顺畅。通过安装必要的依赖并进行GPU可用性验证,作者成功搭建了可用的深度学习学习环境。文章总结了环境搭建的经验,强调了命令行和工具掌握的重要性,并展望了未来继续深入学习的计划。