-
CS229:Ps3解读——NN,自然梯度下降与有趣的案例CS229:Ps3解读——NN,自然梯度下降与有趣的案例
7 min read zh -
CS224N: Between Transformer and GPT4深入探讨Transformer到GPT4之间的技术演进,包括模型预训练、微调技术和LLM训练的重要里程碑。
18 min read zh -
CS229:监督学习(五)——神经网络训练与架构CS229:监督学习(五)——神经网络训练与架构
9 min read zh -
CS230 C1:深度神经网络回顾以及代码实现CS230 C1:深度神经网络回顾以及代码实现
9 min read zh -
CS230 C2W1&2:模型训练常见trick——正则化方法&梯度调整方法CS230 C2W1&2:模型训练常见trick——正则化方法&梯度调整方法
15 min read zh -
CS230 C2W3:优化算法探究CS230 C2W3:优化算法探究
9 min read zh -
MIT 6.S184:扩散模型简介MIT 6.S184:扩散模型简介
24 min read zh