Ruthless's Blog

Matrix theory in machine learning

科研 2026/6/9

子空间、秩、奇异矩阵、最小二乘.

机器学习 matrix

阅读全文

Matrix theory in machine learning

科研 2026/6/9

正定 (PD) 与半正定 (PSD) 矩阵在机器学习中的作用。

机器学习 matrix

阅读全文

RLHF与DPO

科研 2026/6/8

DPO，全称 Direct Preference Optimization，可以理解为：不用显式训练奖励模型、也不用 PPO，而是直接用偏好数据微调 LLM，让模型更偏向人类喜欢的回答。

它是 RLHF 的一种简化替代方案。

强化学习 DPO RLHF

阅读全文

CS229-6 The Perceptron and Large Margin

科研 2026/6/7

感知机

机器学习 CS229

阅读全文

CS229-7 K-means and EM / Gaussian Mixture Models

科研 2026/6/7

本节主要讲 K-means 聚类、Gaussian Mixture Models。

机器学习 CS229

阅读全文

CS229-8 The Expectation-Maximization Algorithm

科研 2026/6/7

本节详细讲解 EM 算法的原理与证明。

机器学习 CS229

阅读全文

CS229-4 Learning Theory

科研 2026/6/1

学习理论研究训练误差与泛化误差的关系。有限假设类用 Hoeffding inequality + union bound 得到 uniform convergence；无限假设类用 VC dimension 衡量模型复杂度，分析泛化所需样本量。

机器学习 CS229

阅读全文

CS229-5 Regularization and Model Selection

科研 2026/6/1

本文整理 CS229 课程中正则化与模型选择的核心内容，涵盖交叉验证、L1/L2 正则化、特征选择方法（wrapper / filter），以及从贝叶斯先验推导正则化的视角。

机器学习 CS229

阅读全文

CS229-2 Generative Learning

科研 2026/5/31

Gaussian Discriminant Analysis (GDA) 与朴素贝叶斯

机器学习 CS229

阅读全文

CS229-3 Support Vector Machines

科研 2026/5/31

支持向量机SVM的原理。

机器学习 CS229

阅读全文

LOADING

Ruthless's Blog

关于Ruthless的一些分享

Matrix theory in machine learning

Matrix theory in machine learning

RLHF与DPO

CS229-6 The Perceptron and Large Margin

感知机

CS229-7 K-means and EM / Gaussian Mixture Models

CS229-8 The Expectation-Maximization Algorithm

CS229-4 Learning Theory

CS229-5 Regularization and Model Selection

CS229-2 Generative Learning

CS229-3 Support Vector Machines