深度学习超参数调优简介

我们知道,在深度学习中有两类基本的参数:模型参数(Model Parameters)和超参数(Hyperparameters),它们都对模型训练的结果有非常重要的影响。有些研究表明,对于超参数的选择不仅能够影响模型训练的质量好坏,而且也在一定程度上决定了模型训练需要耗费的时间以及内存资源的需求总量。甚至在一些深度模型训练过程中证明,超参数的选择比模型本身的参数更重要,影响也更大。 可见,超参数选择是否合理,直接影响了企业开发并使用模型的成本,所以在深度学习应用领域,业界已经把超参数调优作为开发深度学习应用流程中一个不可或缺的步骤。这样我们就能够把超参数调优解耦成一个独立的组件或模块,然后聚焦该组件的核心能力去做更多探索尝试,最终实现整个深度学习应用开发的业务目标,同时获得了灵活的开发模式,也具有较低的成本优势。 什么是超参数 超参数是指一类静态的参数,这些参数在模型训练之前被定义和设置,而且无法从给定的训练数据中进行学习估计。在模型训练算法中会存在很多超参数,少的话有几个,多的话可能达到几十成百上千个。下面,我们列出一