LOADING

加载过慢请开启缓存 浏览器默认开启

Ruthless's Blog

关于Ruthless的一些分享

CS229-4 Learning Theory

科研 2026/6/1

学习理论研究训练误差与泛化误差的关系。有限假设类用 Hoeffding inequality + union bound 得到 uniform convergence;无限假设类用 VC dimension 衡量模型复杂度,分析泛化所需样本量。

阅读全文

CS229-2 Generative Learning

科研 2026/5/31

Gaussian Discriminant Analysis (GDA) 与 朴素贝叶斯

阅读全文

CS229-3 Support Vector Machines

科研 2026/5/31

支持向量机SVM的原理。

阅读全文

CS229-1 Supervised Learning

科研 2026/5/30

从Linear Regression开始,到线性回归的Normal Equation与Probabilistic Interpretation;再引入Logistic Regression与Softmax Regression;最后使用Generalized Linear Models统一这三种回归。

阅读全文

矩阵求导法则

科研 2026/5/30

矩阵求导的定义与常见公式。

阅读全文

APO

科研 2026/5/29

APO的动机、原理、公式。

阅读全文

GRPO, SPPO

科研 2026/5/29

GRPO 与 SPPO 的动机、原理、公式及代码笔记。

阅读全文

强化学习

科研 2026/5/27

强化学习笔记,包括概念定义、REINFORCE、Actor-Critic、PPO 以及相关代码

阅读全文

上海创智学院回忆录

夏令营 2026/5/22

2026年上海创智学院夏令营回忆录

阅读全文

EvoHead

科研 2026/5/13

EvoHead笔记,方便之后回忆。

阅读全文