2025-5-1-逃离北京计划(2)

今天主要是在乌兰察布市的旁边的草原和火山转了转。(不安です)

乌兰察布

郭林锡勒草原

从早上6.30起床、然后7.10去吃早餐、7.30匆匆到集合地集合;于是开始了一天的坐车之旅(拜托,这可是整整从早上7.30-20.00的全程坐车之旅)。

大草原上风呼呼地吹、感觉人被冻傻了;再就是意外发现了一个湖,上面有些许的...

2025-4-30-逃离北京计划(1)

嘿嘿,今天直接闪现呼和浩特。

总结一下:今天走了14.7km,我是神!

呼和浩特

早上因为脑子里在不停地循环“私はできない できない できない子”所以其实6.15就醒了。掂念着昨天晚上上课忘记带走地耳机,想着今天早上一定要早点起来去拿,结果起的也太早了吧(啊喂

搭上8.30-9.37的怀柔小火车,抵达清河站——

结果因为截图...

2025-4-24

其他

知道RLHF吗?讲一下训练流程

用于大模型(如ChatGPT)对齐人类价值的训练方法。

  1. Supervised Fine-Tuning(SFT):用高质量人类标注数据微调预训练模型
  2. Reward Model(RM)训练:用人类偏好数据训练打分模型

2025-4-23-RNN/LSTM简介

RNN(循环神经网络

核心结构: RNN 的设计目的是处理序列数据(如文本、语音),其核心特点是隐藏层神经元之间存在循环连接,允许信息在时间序列中传递。

阅读全文

2025-4-23-Transformer相关知识

有关于Transformer的一些知识盘点。

Transformer

2025-4-23-梯度消失/爆炸

梯度消失与梯度爆炸的定义

梯度消失(Vanishing Gradient)

  • 现象:反向传播中,梯度随着网络层数或时间步长增加而指数级减小,导致浅层参数更新缓慢,模型无法学习底层特征。
  • 案例:深层CNN或长序列RNN中,浅层权重几乎不更新。...

2025-4-22-数据集收集工作推进

wow! A good question is How to collect data to build a dataset.

现在要完成下面的一些问题:

  1. 分割数据集-标注工具,怎么标注
  2. 上界做到??最好的分割方法
  3. 方法构建-当前的最新的方法
  4. 如何评估
  5. 分期推进数据 数据集的标注进展
搜索
匹配结果数:
未搜索到匹配的文章。