1. 机器学习简介
1.1 机器学习流程
- 获取数据
- SKLEARN数据集
- 查看数据分布
- 数据集分类
- 数据基本处理
- 缺省值处理
- 缩小数据范围
- 异常数据处理
- 数据分割
- 类别不平衡数据处理方式
- 特征工程
- 机器学习(算法)
- K-近邻算法
- 线性回归
- 线性回归的改进-岭回归
- 逻辑回归(分类)
- 决策树
- 朴素贝叶斯
- SVM
- EM算法
- HMM模型
- K-MEANS
- 集成学习
- 模型评估与调优
1.2 数据科学库
- matplotlib 画图
- numpy 数学计算、矩阵
- pandas
- seaborn
1.3 人工智能、机器学习、深度学习的关系
- 机器学习是人工智能的一个实现途径
- 深度学习是机器学习一个方法发展而来
1.4 人工智能分支
- 计算机视觉(CV): 机器感知环境的能力;类别:图像形成,图像处理,图像提取,图像的三维处理
- 语音识别(NRP): 识别语音并将其转换为对应文本的技术;
- 文本挖掘/分类(NRP): 理解,组织和分类结构化和非结构化文本文档;句法分析、情绪分析、垃圾信息检测
- 机器翻译(NRP): 利用机器的力量将一种自然语言文本翻译成另一种语言
- 机器人: 机器人的设计、制作和运用,以及控制他们的计算机系统、传感反馈和信息处理;固定机器人和移动机器人
1.5 机器学习定义
从数据中自动分析获取模型,并使用模型对未知事务进行预测