您的位置:首页 > 健康 > 美食 > 应用商店oppo版本下载_网站页面设计和结构的技巧_保定网站seo_免费推广引流软件

应用商店oppo版本下载_网站页面设计和结构的技巧_保定网站seo_免费推广引流软件

2024/12/25 13:03:06 来源:https://blog.csdn.net/yn3535_/article/details/144249860  浏览:    关键词:应用商店oppo版本下载_网站页面设计和结构的技巧_保定网站seo_免费推广引流软件
应用商店oppo版本下载_网站页面设计和结构的技巧_保定网站seo_免费推广引流软件

如果示例都是猫或单个类,那就很纯净了,如果不是猫,那也很纯洁,但如果介于两者之间,该如何量化这组例子有多纯粹,看看熵的定义。

熵——它是对一组数据杂质的度量。给出一组像这样的六个例子,有三只猫和三只狗,我们把p定义为猫的例子分数,这是带有标签的示例分数,所以在本例中,P1=3/6,我们将测量一组例子的杂质,使用一个叫做熵的函数,如下所示,熵函数通常表示为这个数字的大写H(p1),函数看起来很像这条曲线,横轴是p,样本中猫的比例,垂直轴是熵的值,所以在这个例子中,其中P1=0.5,P1的熵值等于1,可以看出,当例子是50时,这条曲线是最高的,所以它是最不纯洁的,相比之下,你的一组例子要么都是猫,要么都不是猫,那么熵为0。

这里有一组不同的例子,有五只猫和一只狗,所以P1=5/6≈0.83,可以发现,它的熵大约为0.65,下一个例子,六张图片的样本都是猫,所以P1=6/6=1,熵是最后的点是零,所以,可以看出杂质从1降到零,换句话说,纯度提高。

另一个有两只猫和四只狗的样本,所以P1=2/6=1/3≈0.33,H(p1)=0.92,这其实挺不纯洁的,最后一个例子,如果我们有六只狗,那么P1=0,H(p1)=0,所以这是一个零和纯度或者这将是一个完全纯粹的集合,不是所有的猫或狗。

让我们看看P1的熵函数H的实际方程,回想一下,P1是等于猫的例子的一小部分,所以如果你有两三只猫的样本,那么这个样本必须有三分之一不是猫,所以定义P0等于不是猫的粒子的分数,所以P0=1-P1,然后将熵函数定义为-logP1,一个注意事项,P1或P0等于0,像这样的表达式看起来像零,零的对数等于零。

熵函数是一组数据杂质的度量,从零开始上升然后又回到零,作为样本中正面例子比例的函数,还有其他类似的函数,从零上升到1然后下降。这对于构建决策树也很有效。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com