LOADING

加载过慢请开启缓存 浏览器默认开启

Ruthless's Blog

关于Ruthless的一些分享

CS229-2 Generative Learning

科研 2026/5/31

Gaussian Discriminant Analysis (GDA) 与 朴素贝叶斯

阅读全文

CS229-1 Supervised Learning

科研 2026/5/30

从Linear Regression开始,到线性回归的Normal Equation与Probabilistic Interpretation;再引入Logistic Regression与Softmax Regression;最后使用Generalized Linear Models统一这三种回归。

阅读全文

矩阵求导法则

科研 2026/5/30

矩阵求导的定义与常见公式。

阅读全文

APO

科研 2026/5/29

APO的动机、原理、公式。

阅读全文

GRPO, SPPO

科研 2026/5/29

GRPO 与 SPPO 的动机、原理、公式及代码笔记。

阅读全文

强化学习

科研 2026/5/27

强化学习笔记,包括概念定义、REINFORCE、Actor-Critic、PPO 以及相关代码

阅读全文

上海创智学院回忆录

夏令营 2026/5/22

2026年上海创智学院夏令营回忆录

阅读全文

EvoHead

科研 2026/5/13

EvoHead笔记,方便之后回忆。

阅读全文

VQ-VAE与codebook

科研 2026/3/21

现在生成式 AI(特别是视觉和动作生成领域)有一个大趋势:把连续的物理信号(如pixel、3D关节坐标)变成像“文字”一样的离散符号(Token),然后再用大语言模型(如 Transformer/GPT)来生成它们。

VQ-VAE 和 Codebook 就是完成这第一步“文字化(Tokenization)”的魔法。

阅读全文

Diffusion与FlowMatching

科研 2026/1/9

Diffusion Model 和 Flow Matching的简单理解与相关论文。

阅读全文