您的位置:首页 > 财经 > 产业 > ui设计培训班是个骗局_云南网站定制_全媒体广告投放平台_网站推广优化外链

ui设计培训班是个骗局_云南网站定制_全媒体广告投放平台_网站推广优化外链

2024/12/22 20:35:37 来源:https://blog.csdn.net/m0_74756454/article/details/143418417  浏览:    关键词:ui设计培训班是个骗局_云南网站定制_全媒体广告投放平台_网站推广优化外链
ui设计培训班是个骗局_云南网站定制_全媒体广告投放平台_网站推广优化外链

一,机器学习基础

1.1机器学习的定义

机器学习可以解释为,如果计算机程序在 T 任务中的表现(以 P 为衡量标准)随着经验 E 的提高而提高,则计算机程序可以从“经验 E”中学习某些“任务 T”和“性能衡量 P”类别。

机器学习中的关键要素:

  • 任务(Task)
  • 经验(Experience)
  • 指标(Performance Measure)

1.2 AI,ML与相关应用

AI设计的方面有很多:机器学习(ML),计算机视觉(CV),自然语言处理(NLP)等等。期中机器学习是最重要的分支之一,也可以说是AI领域的基础

机器学习也可以被视为一个跨学科的学科。其中涉及计算机科学,概率论,最优化,信息论,神经科学等等。

如今,机器学习广泛应用于医学,语音处理,自动驾驶等多个领域。

1.3 机器学习的类别

机器学习中有两个基本类型:监督学习(Supervised learning)和无监督学习(Unsupervised learning)。

从数学的角度看两个类别:

  • 监督学习:基于一些经过人类标记的输出,我们的任务是找到一个函数,使得输入x_{i}能对应获得一个输出y_{i}.
  • 无监督学习:我们需要建立一个有关x的模型,使得其中的特征能够很好地揭示出来。

拿生活的例子比喻,监督学习就像有老师教着学,无监督学习就像自学。从数据上看,两个例子中的区别在于“标签(label)”的有无。

从数据类型,连续或离散来看,机器学习又有两种类别。

  • 分类/聚类(Classification/Clustering):对离散量的处理,监督学习上指分类,无监督学习上指聚类。
  • 回归/降维(Regression/Dimensionality Reduction):对连续量的处理,监督学习上指回归,无监督学习上指降维。

接下来对监督学习和无监督学习做进一步的数学解释。

1.4 监督学习

1.4.1 数据集

在监督学习中,数据集是一些标签数据的集合,记作\begin{Bmatrix} (\mathbf{x}_{i},y_{i}) \end{Bmatrix}_{i=1}^{N},

其中,\mathbf{x}_{i} = \bigl(\begin{smallmatrix} x_{i}^{(1)},...,x_{i}^{(i)},...,x_{i}^{(D)} \end{smallmatrix}\bigr) \; i=1,...,N

  • 每个\mathbf{x}_{i}都是一个特征向量,向量中每个维度j = 1,..., D都包含一个能表述数据特征的值
  • 标签y_{i}几个意思一个属于类别的有限集合的元素,也可以是实数
  • 1.4.2 工作流程

普遍的工作流程如下:

  • 数据集准备
  • 训练(Training)
  • 测试(Inference/test)

其中训练是通过模型,从训练数据和对应的标签中获得学习到的参数;测试则是指通过模型和学习到的参数,由未知的X获得预测标签

1.5 无监督学习

1.5.1 数据集

在监督学习中,数据集是一些无标签数据的集合,记作\begin{Bmatrix} \mathbf{x}_{i} \end{Bmatrix}_{i=1}^{N},

其中,\mathbf{x}_{i} = \bigl(\begin{smallmatrix} x_{i}^{(1)},...,x_{i}^{(i)},...,x_{i}^{(D)} \end{smallmatrix}\bigr) \; i=1,...,N

  • 每个\mathbf{x}_{i}都是一个特征向量
1.5.2 工作流程

基本工作流程与监督学习类似,但需要注意:

  • 无监督学习的主要任务是分析数据对于未来推断的结构,将特征向量转化为能解决实际问题的值或者另一个向量
  • 在训练过程中,一些控制参数(比如说,类别)取代了标签的作用
1.5.3 聚类
  • 任务:将无标签点的集合分割成一些聚类
  • 表现:同一聚类的点互相接近,不同聚类的点相互远离,集群具有所有数据的适当聚合
  • 经验:足够的数据
1.5.4 降维

降维的目的:

  • 数据简化:非线性——>线性
  • 数据可视化:高维——>低维
  • 减少噪音:有些维度的数据带有噪音
  • 预测的变量选择:学习一个稀疏模型,如果不同维度之间存在冗余

1.6 一些与机器学习有关的基本概念

1.6.1 训练集

用于模型的训练的数据集

1.6.2 测试集

用于模型的评估的数据集

1.6.3 独立同分布假设(Independent and identically distributed (i.i.d.) assumption)

在标准机器学习中,假设所有样本都是独立同分布的随机变量的观测/实现,训练集和测试集遵循相同的分布。

1.6.4 目标函数(Target Function)

目标函数 t : X → Y:训练/测试数据背后的从输入到输出的真实映射函数。它是未知的,我们的目标是找到它。

1.6.5 假设与假设空间(Hypothesis and Hypothesis space)

假设是描述未知目标函数的候选函数;假设空间是所有可能的合法假设的集合。

1.6.6 成本函数(cost function)

成本函数衡量假设在估计 x 和 y 之间关系的能力方面是好是坏

1.6.7 损失函数(Objective function)

我们想要优化(最小化、最大化或极小化极大化)的函数。当我们最小化它时,我们也可以将其称为成本函数,或误差函数。

1.6.8 训练和测试

训练:用优化的方法在假设空间中找到一个比较好的假设,建立一个模型

测试:评估这个模型

1.7 一个比较普遍的工作流程

收集数据——> 数据预处理——>决定假设空间,损失函数,优化方法等等——>训练——>测试——>改进

 

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com