您的位置:首页 > 娱乐 > 明星 > 沈阳德泰诺网站制作_外包app制作费用多少_推推蛙seo_百度快照优化seo

沈阳德泰诺网站制作_外包app制作费用多少_推推蛙seo_百度快照优化seo

2025/1/16 16:48:15 来源:https://blog.csdn.net/HG0724/article/details/143651351  浏览:    关键词:沈阳德泰诺网站制作_外包app制作费用多少_推推蛙seo_百度快照优化seo
沈阳德泰诺网站制作_外包app制作费用多少_推推蛙seo_百度快照优化seo

问题描述

一组数据如下:
在这里插入图片描述

df.isnull().sum()
城市          0
名称          0
星级       1529
评分          0
价格          1
销量          1
省/市/区       0
坐标          0
简介         41
是否免费        0
具体地址        3
dtype: int64
df['星级']
0       NaN
1        4A
2        5A
3        4A
4        5A... 
2438    NaN
2439     4A
2440    NaN
2441    NaN
2442    NaN
Name: 星级, Length: 2443, dtype: object
  • 使用finall()
# 这种填充方式是一次性的
df['星级'].fillna(value=np.random.choice(['1A', '2A', '3A', '4A', '5A']), inplace=True)

一次性 根据概率 随机选取某一值填充 导致最后比例不均衡

  • apply⭐
    使用该函数是遇到一个异常值 根据规则 随机选取 并填充
# 发现存在异常值 同样处理 
df['星级']=df['星级'].apply(lambda x: x if x in ['1A','2A','3A','4A','5A'] else random.choice(['1A','2A','3A','4A','5A']))
df['星级'].value_counts()
星级
4A    851
5A    576
3A    393
2A    324
1A    299
Name: count, dtype: int64

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com