您的位置:首页 > 汽车 > 时评 > 【深度学习讲解笔记】第1章-机器学习基础(2)

【深度学习讲解笔记】第1章-机器学习基础(2)

2024/11/17 21:27:31 来源:https://blog.csdn.net/i156456365/article/details/142059361  浏览:    关键词:【深度学习讲解笔记】第1章-机器学习基础(2)

模型与函数构造

之前讲到,模型是由机器学习决定参数值的函数,通过训练,机器可以找出最好的一组参数使得函数的输出最优。常见的模型有线性模型,指数模型,对数模型等。在线性模型中,w和b是可学习的参数;在指数模型中,指数的底a和系数c是可学习的参数;在对数模型中,对数的底b和常数c是可学习的参数。

现实生活中有很多模型来自领域知识,比如经济学中的供需关系函数,生物医学中的药物反应模型等。这些模型给了我们目标函数的框架,我们只需要交给机器根据训练数据学习优化超参数即可。

很多时候,我们不知道目标函数具体长什么样子(是指数函数还是幂函数),甚至有些任务的目标函数过于复杂:比如前面提到的语音识别任务,需要输入一段音频转出文字,这样的函数框架不是我们可以设计的。类似地,图像分类,大语言模型对话的函数都很难设计,如ChatGPT4有1750亿参数,这么大的“函数”远超人类的想象力。

这里介绍一个理论:分段线性曲线可以连续逼近任何曲线

如此,当我们面对难以描述的曲线的时候,不妨给出一组线性函数,让机器通过调节超参数去学习拟合那条不知姓名的曲线。

看下面的例子,比如我们要拟合红色的曲线,我们可以给出3条折线(也叫hard sigmoid函数)和1条水平线(偏置),让机器调节这些线的水平位置,垂直高度,斜率等参数就可以逐渐逼近到红色线的位置。

 hard sigmoid函数由于拐点不可微分,导致梯度下降法受阻,故而我们采用更加平滑的sigmoid函数替代。

sigmoid函数公式为 ,通过调整参数可以改变形状,从而组合出丰富的函数。

 我们可以按以下步骤构建复杂函数:

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com