您的位置:首页 > 财经 > 产业 > 20240803---特征选择与稀疏学习

20240803---特征选择与稀疏学习

2024/12/23 12:35:02 来源:https://blog.csdn.net/zsysingapore/article/details/140890822  浏览:    关键词:20240803---特征选择与稀疏学习

1.特征选择:在机器学习任务中,通过样本的特征预测样本所对应的值。

(1)无关特征:通过空气的湿度、环境的温度、风力、当地人的男女比例来预测明天是否下雨。男女比例属于无关特征。
(2)冗余特征:通过房屋的面积、卧室的面积、车库的面积、城市消费水平、城市税收水平等特征来预测房价。这里面的税收水平就说多余特征。
因为税收水平和消费水平存在相关性,我们只要两者取其一就可以。(因为另一个能从其中一个推演出来)
线性相关,用线性模型做回归会出现多重共线性,会导致过拟合。
(3)减少特征:不仅减少过拟合、减少特征数量(降维)、提高模型泛化能力,而且还可以使模型获得更好的解释性,增强对特征和特征值之间的理解,加快模型的训练速度,一般的,还会获得更好的性能。问题是,在面对未知领域时,很难有足够的认识去判断特征与目标之间的相关性,特征与特征之间的相关性。这时候就需要用一些数学或工程上的方法来帮助我们更好地进行特征选择。

2.特征选择的方法

1)过滤法(Filter):

按照发散性或者相关性对各个特征进行评分,设定阈值或者待选择阈值的个数,选择特征
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

2)包裹法(Wrapper)︰

根据目标函数,每次选择若干特征或者排除若干特征,直到选择出最佳的子集。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3)嵌入法(Embedding):

先使用某些机器学习的算法和模型进行训练,得到各个特征的权值系数,根据系数从大到小选择特征。类似于Filter方法,但是是通过训练来确定特征的优劣。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

补充:
在这里插入图片描述

三、稀疏表示

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

四、字典学习

(1)字典学习

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

(2)字典学习的解法

在这里插入图片描述
在这里插入图片描述
看到了p60,明天还有ppt1和pp3要看

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com