1.摘要
野生蘑菇误食导致的中毒事件屡见不鲜,已成为我国食物中毒死亡案例的首要诱因。鉴于蘑菇种类繁多,形态各异,非专业人士难以仅凭外观、形态或颜色等直观特征准确区分有毒蘑菇与可食用蘑菇,缺乏统一且简便的鉴别标准。为了判断蘑菇的食用安全性,必须深入分析不同特征属性的蘑菇样本是否含有毒性。鉴于众多蘑菇种类均具毒性,近年来,野外及森林中采摘野生蘑菇作为食物引发的中毒事件备受社会关注。因此,迅速且准确地鉴别蘑菇毒性成为采摘活动中的核心安全问题,这一议题在全球范围内均得到了广泛重视。
本文旨在设计一种基于机器学习的算法,用于蘑菇毒性的预测。研究选用了UCI的Mushroom Data Set蘑菇数据集,并实现了朴素贝叶斯、决策树、逻辑回归等几种常用的机器学习算法,以实现对蘑菇毒性的精准预测。最终,本研究成功构建了一个操作简便、易于应用的蘑菇毒性识别与分类系统,该系统可以选择不同的分类器进行预测实现。(整个项目装逼又简单)
2.数据集描述
UCI的Mushroom Data Set数据集,总样本数为8124,其中6513个样本做训练,1611个样本做测试。并且,其中可食用有4208样本,占51.8%;有毒的样本为3916,占48.2%。每个样本描述了蘑菇的22个属性,比如形状、气味等等。对蘑菇的22种特征属性进行分析,从而得到蘑菇可使用性模型,更好的预测出蘑菇是否可食用。
即为:蘑菇数据集包含8124个样本,每个样本有23个特征,其中22个是描述蘑菇属性的字符型特征,1个是目标变量(蘑菇是否可食用)。
数据集链接:UCI 机器学习存储库
3.应用实现
可以选择分类器:
可以选择输出指标:
点击分类预测按钮:
当选择决策树时:
其结果如下:
代码链接:
https://download.csdn.net/download/weixin_40651515/89897733?spm=1001.2014.3001.5503