机器学习基础
约 592 字大约 2 分钟
系统学习机器学习的核心概念、算法分类与实践路线。
核心概念
什么是机器学习
机器学习是 AI 的子领域,通过算法从数据中自动学习模式,无需显式编程。
三要素
- 数据 — 机器学习的燃料,质量和数量决定模型上限
- 模型 — 对数据的数学抽象,如线性回归、神经网络
- 算法 — 学习的方法,如梯度下降、反向传播
基本流程
- 数据收集 → 2. 数据预处理 → 3. 模型选择 → 4. 训练 → 5. 评估 → 6. 调优 → 7. 部署
算法分类
- 监督学习(回归 + 分类)— 使用带标签数据训练,如线性回归、逻辑回归、SVM
- 无监督学习(聚类 + 降维)— 发现无标签数据模式,如 K-Means、PCA
- 强化学习— 与环境交互学习,应用于游戏和机器人
监督学习算法
| 算法 | 用途 | 示例 |
|---|---|---|
| 线性回归 | 预测连续值 | 房价预测 |
| 逻辑回归 | 二分类 | 垃圾邮件检测 |
| 决策树 | 分类/回归 | 信用评估 |
| 随机森林 | 分类/回归 | 用户流失预测 |
| SVM | 分类 | 图像分类 |
| 神经网络 | 分类/回归 | 手写识别 |
无监督学习算法
| 算法 | 用途 | 示例 |
|---|---|---|
| K-Means | 聚类 | 用户分群 |
| DBSCAN | 聚类 | 异常检测 |
| PCA | 降维 | 数据可视化 |
| Apriori | 关联分析 | 购物篮分析 |
学习路线
- 入门阶段(1-3月)— Python + NumPy + 吴恩达课程 + Scikit-learn
- 进阶阶段(3-6月)— 深度学习 + PyTorch / TF + Kaggle竞赛
- 高级阶段(6-12月)— NLP + CV + LLM微调 + MLOps
学习资源
Machine Learning
吴恩达经典课程 / Coursera
fast.ai
实践导向 / 免费 / 从实战入手
Hugging Face
免费课程 / 模型库 / NLP 为主
Kaggle
竞赛 / 数据集 / Notebook / 社区
CS231n
Stanford 计算机视觉 / 深度学习
《机器学习》
周志华 / 西瓜书 / 国内经典教材
