社会工作中的成长小组服务的对象_手机app开发与应用_优秀的网页设计案例_怎么做网络营销平台

2025/4/26 13:25:57 来源：https://blog.csdn.net/m0_38113054/article/details/144543729 浏览: 次关键词：社会工作中的成长小组服务的对象_手机app开发与应用_优秀的网页设计案例_怎么做网络营销平台

机器学习基本概念

监督与无监督的概念
样本、特征、标记
分类与回归
训练集与测试集
数据拟合与模型泛化
聚类和降维

监督与无监督的概念

监督学习是指从标注数据中学习预测模型的机器学习问题。
无监督学习是指从无标注数据中学习预测模型的机器学习问题。

样本、特征、标记

在这里插入图片描述
表格中的每一行都代表着一条样本数据；
表格的第一列 x 在机器学习中的术语叫做特征（feature），
表格的第二列 y 在机器学习中的术语叫做标记（label）
其中的 x （身高）是输入特征， y（体重）是输出标记。这就属于一个监督学习的问题，假如没有标记值 y ，是无法学习到模型参数 k 和 b 的。

分类与回归

根据预测 y 值类型的不同，监督学习主要有两个方面的应用：分类问题和回归问题

分类问题中预测的 y 值是离散值，一般取值的个数是有限的，比如性别、职业、省份等；
回归问题中预测的 y 值是连续值，一般取值的个数是无限的，比如身高、体重、收入等。

训练集与测试集

训练集用于模型的训练
测试集用于模型的测试

数据拟合与模型泛化

数据拟合：模型的预测输出值是不断地拟合与逼近真实的 y 值的
模型在未知数据上的预测效果越好，说明它的泛化能力越强。但如果一味地拟合训练数据，就会导致模型过拟合
过拟合的反面是欠拟合，也就是模型对训练数据的拟合程度不够，导致在训练数据上的误差较大，这种情况下模型在测试数据上的表现一般也不好。
在这里插入图片描述
蓝色数据点是训练数据，黄色曲线是学习到的模型曲线，也就是函数 y = f(x) ；
欠拟合时，模型没有学习到数据的一般规律，曲线较简单；
过拟合则是拟合每一个数据点，模型曲线较为复杂；
好的拟合曲线是可以反映大部分数据点的规律，有一定的泛化能力；
在这里插入图片描述
欠拟合的情况下，分类边界线比较简单，两侧有较多的误分类点；
过拟合的情况下，分类边界线比较曲折，两侧几乎没有误分类点

聚类和降维

在这里插入图片描述
样本聚类是数据纵向的压缩；
而特征降维是数据横向的压缩。

分类属于监督学习的范畴，而聚类属于无监督学习的范畴

社会工作中的成长小组服务的对象_手机app开发与应用_优秀的网页设计案例_怎么做网络营销平台

机器学习基本概念

监督与无监督的概念

样本、特征、标记

分类与回归

训练集与测试集

数据拟合与模型泛化

聚类和降维

最新新闻

热搜词