机器学习常用工具及库
环境依赖管理
Docker
https://www.oracle.com/cn/cloud/cloud-native/container-registry/what-is-docker/
隔离部署工具,能有效解决环境问题
Conda与Anaconda
conda作为Python数据科学领域的常用软件,是对Python环境及相关依赖进行管理的经典工具,通常集成在anaconda或miniconda等产品中供用户日常使用。
conda适合需要灵活管理多个项目依赖,且希望自定义安装软件包的用户。
Anaconda适合需要进行大量科学计算和数据科学工作的用户,希望一次性安装所有必要的软件包和依赖项。
机器学习库
scikit-learn
适合初学者的机器学习库,包含大量经典的机器学习算法。
官方文档:https://scikit-learn.org/stable/
PyTorch 官方文档
由Facebook开发,易于使用且灵活,广泛应用于研究和工业领域
https://pytorch.org/
Tensorflow 中文文档
Google开发的开源框架,支持从研究到生产的完整机器学习工作流
https://www.tensorflow.org/?hl=zh-cn
Keras 3.0 官方文档
高级神经网络API,易于使用,能够快速构建和训练模型。
https://keras.io/keras_3/
XGBoost
一种高效的梯度提升框架,特别适合处理结构化数据。
https://xgboost.readthedocs.io/en/stable/
https://www.nvidia.cn/glossary/data-science/xgboost/
数据集
findata, kaggle, datasearch等
在线运行环境
Google Colab
https://colab.google/
Kaggle
https://www.kaggle.com/
还有很多类似的平台,可以自行搜索获取
入门资料
Coursera: 如斯坦福大学的《机器学习》课程,由Andrew Ng教授讲授
edX: 如MIT的《Data Science and Machine Learning》课程
Kaggle: 提供大量免费机器学习教程,涵盖从基础到高级的内容
Fast.ai: 提供免费且高质量的深度学习课程和教程
《Deep Learning》: 作者是Ian Goodfellow等,是学习深度学习的经典教材
学习机器学习有哪些好工具推荐