劰载中...飞翔的小鸟
首页大学学科资料人工智能《深度学习500问》第十四章+超参数调整
党建飞
院长

文档

179

关注

0

好评

1
PDF

《深度学习500问》第十四章+超参数调整

阅读 823 下载 0 大小 1.13M 总页数 0 页 2024-12-16 分享
价格:¥ 10.00
下载文档
/ 0
全屏查看
《深度学习500问》第十四章+超参数调整
还有 0 页未读 ,您可以 继续阅读 或 下载文档
1、本文档共计 0 页,下载后文档不带水印,支持完整阅读内容或进行编辑。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
5/5/2020第十四章超参数调整·第十四章超参数调整。14.1写在前面014.2超参数概念·14.2.1什么是超参数,参数和超参数的区别?■14.2.2神经网络中包含哪些超参数?■14.2.3为什么要进行超参数调优?·14.2.4超参数的重要性顺序·14.2.5部分超参数如何影响模型性能?·14.2.6部分超参数合适的范围014.3网络训练中的超参调整策略·14.3.1如何调试模型?·14.3.2为什么要做学习率调整?·14.3.3学习率调整策略有哪些?·14.3.4极端批样本数量下,如何训练网络?。14.4合理使用预训练网络■14.4.1什么是微调(fine-tune)·14.4.2微调有哪些不同方法?·14.4.3微调先冻结底层,训练顶层的原因?·14.4.4不同的数据集特性下如何微调?·14.4.4目标检测中使用预训练模型的优劣?·14.4.5目标检测中如何从零开始训练((train from scratch)?。14.5如何改善GAN的性能14.6 AutoML■14.6.1什么是AutoML?■14.6.2自动化超参数搜索方法有哪些?·14.6.3什么是神经网络架构搜索(NAS)■14.6.4 NASNet的设计策略■14.6.5网络设计中,为什么卷积核设计尺寸都是奇数·14.6.6网络设计中,权重共享的形式有哪些,为什么要权重共享第十四章超参数调整Markdown Revision 1;Date:2018/10/25Editor:乔成磊-同济大学,王超锋Contact:qchl0318@163.com,syusukel0516@163.comUpdater:sjsdfg,王超锋14.1写在前面关于训练深度学习模型最难的事情之一是你要处理的参数的数量。无论是从网络本身的层宽(宽度)、层数(深度)、连接方式,还是损失函数的超参数设计和调试,亦或者是学习率、批样本数量、优化器参数等等。这些大量的参数都会有网络模型最终的有效容限直接或者间接的影响。面对如此众多的参数,如果我们要一一对其优化调整,所需的无论是时间、资源都是不切实际。结果证实一些超参数比其它的更为重要,因此认识各个超参数的作用和其可能会造成的影响是深度学习训练中必不可少的一项重要技能。fle://home/shishuai/Desktop/第十四章超参数调整.html1/1555/2020第十四章超参数调整超参数调整可以说是深度学习中理论和实际联系最重要的一个环节。目前,深度学习仍存在很多不可解释的部分,如何设计优化出好的网络可以为深度学习理论的探索提供重要的支持。超参数调整一般分为手动调整和自动优化超参数两种。读者可先浏览思维导图,本章节不会过多阐述所有超参数的详细原理,如果需要了解这部分,您可以翻阅前面的基础章节或者查阅相关文献资料。当然,下面会讲到的一些超参数优化的建议是根据笔者们的实践以及部分文献资料得到认知建议,并不是非常严格且一定有效的,很多研究者可能会很不同意某些的观点或有着不同的直觉,这都是可保留讨论的,因为这很依赖于数据本身情况。14.2超参数概念14.2.1什么是超参数,参数和超参数的区别?区分两者最大的一点就是是否通过数据来进行调整,模型参数通常是有数据来驱动调整,超参数则不需要数据来驱动,而是在训练前或者训练中人为的进行调整的参数。例如卷积核的具体核参数就是指模型参数,这是有数据驱动的。而学习率则是人为来进行调整的超参数。这里需要注意的是,通常情况下卷积核数量、卷积核尺寸这些也是超参数,注意与卷积核的核参数区分。14.2.2神经网络中包含哪些超参数?通常可以将超参数分为三类:网络参数、优化参数、正则化参数。网络参数:可指网络层与层之间的交互方式(相加、相乘或者串接等)、卷积核数量和卷积核尺寸、网络层数(也称深度)和激活西数等。优化参数:一般指学习率(learning rate))、批样本数量(batch size)、不同优化器的参数以及部分损失函数的可调参数。正则化:权重衰减系数,丢弃比率(dropout).14.2.3为什么要进行超参数调优?本质上,这是模型优化寻找最优解和正则项之间的关系。网络模型优化调整的目的是为了寻找到全局最优解(或者相比更好的局部最优解),而正则项又希望模型尽量拟合到最优。两者通常情况下,存在一定的对立,但两者的目标是一致的,即最小化期望风险。模型优化希望最小化经验风险,而容易陷入过拟合,正则项用来约束模型复杂度。所以如何平衡两者之间的关系,得到到最优或者较优的解就是超参数调整优化的目的。14.2.4超参数的重要性顺序·首先,学习率,损失函数上的可调参数。在网络参数、优化参数、正则化参数中最重要的超参数可能就是学习率了。学习率直接控制着训练中网络梯度更新的量级,直接影响着模型的有效容限能力;损失西数上的可调参数,这些参数通常情况下需要结合实际的损失西数来调整,大部分情况下这些参数也能很直接的影响到模型的的有效容限能力。这些损失一般可分成三类,第一类辅助损失结合常见的损失函数,起到辅助优化特征表达的作用。例如度量学习中的Center loss,通常结合交叉熵损失伴随一个权重完成一些特定的任务。这种情况下一般建议辅助损失值不高于或者不低于交叉熵损失值的两个数量级;第二类,fle://home/shishuai/Deskto p/第十四章超参数调整.html2/155/5/2020第十四章超参数调整多任务模型的多个损失西数,每个损失西数之间或独立或相关,用于各自任务,这种情况取决于任务之间本身的相关性,目前笔者并没有一个普适的经验由于提供参考;第三类,独立损失函数,这类损失通常会在特定的任务有显著性的效果。例如RetinaNet中的focalIOs5,其中的参数y,α,对最终的效果会产生较大的影响。这类损失通常论文中会给出特定的建议值。·其次,批样本数量,动量优化器(Gradient Descent with Momentum)的动量参数B。批样本决定了数量梯度下降的方向。过小的批数量,极端情况下,例如batch size为1,即每个样本都去修正一次梯度方向,样本之间的差异越大越难以收敛。若网络中存在批归一化(batchnorm),batch size过小则更难以收敛,甚至垮掉。这是因为数据样本越少,统计量越不具有代表性,噪声也相应的增加。而过大的batch size,会使得梯度方向基本稳定,容易陷入局部最优解,降低精度。一般参考范围会取在1:1024之间,当然这个不是绝对的,需要结合具体场景和样本情况;动量衰减参数3是计算梯度的指数加权平均数,并利用该值来更新参数,设置为0.9是一个常见且效果不错的选择;·最后,Adam优化器的超参数、权重衰减系数、丢弃法比率(dropout)和网络参数。在这里说阴下,这些参数重要性放在最后并不等价于这些参数不重要。而是表示这些参数在大部分实践中不建议过多尝试,例如Adam优化器中的β1,B2,∈,常设为0.9、0.999、10-8就会有不错的表现。权重衰减系数通常会有个建议值,例如0.0005,使用建议值即可,不必过多尝试。dropout通常会在全连接层之间使用防止过拟合,建议比率控制在[0.2,0.5]之间。使用dropout时需要特别注意两点:一、在RNN中,如果直接放在memory cell中,循环batchnorm,dropout很可能影响batchnorm计算统计量,导致方差偏移,这种情况下会使得推理阶段出现模型完全垮掉的极端情况;网络参数通常也属于超参数的范围内,通常情况下增加网络层数能增加模型的容限能力,但模型真正有效的容限能力还和样本数量和质量、层之间的关系等有关,所以一般情况下会选择先固定网络层数,调优到一定阶段或者有大量的硬件资源支持可以在网络深度上进行进一步调整。14.2.5部分超参数如何影响模型性能?如何超参影响原因注意事项模型数容量调至最学过高或者过低的学习率,都会由优,学习率最优点,在训练的不同时间点都可能习于优化失败而导致降低模型有效提升率变化,所以需要一套有效的学习率衰减策略容限有效容量fle://home/shishuai/Desktop/第十四章超参数调整.html3/15
文档评分
    请如实的对该文档进行评分
  • 0
发表评论
温馨提示

      由于近期经常有客户反馈添加我们客服QQ没有反应,如果您在添加我们QQ客服一直没有通过,或者发送的信息一直没有回复,有可能是QQ消息通知吞吐或延迟,建议添加我们的客服微信进行联系。

注意:请不要使用Safari浏览器浏览本站!否则会有一些不兼容的情况出现比如视频无法播放

1. 本系统正在更新换代中,建设过程较为漫长,请耐心等待。

2. 本站已经与子站 BITCO其它子站点 实现互联互通。

3. 若您有业迪账户,直接登录即可,若子系统没有您的信息,将会提示您激活账户。

4. 如在使用与体验过程中有任何疑问,可与我们联系,我们唯一联系方式如下,建议添加我们客服微信,QQ经常有收不到消息与通知的情况。

微信号:暂未开放       QQ号:点我跳转

返回顶部