2025-5-2-逃离北京计划(3)

悲,去旅游的话就是每天无法睡懒觉。平均起床时间都在6.多。今天早上起来的更早,5.20多,差不多要下火车了。

银川-西夏区

早上先去酒店放了放行李,休整了一下,顺便混了一顿酒店的早饭,打了车准备向西夏区的岩画、西夏陵进发。

今天一天的活动范围就在贺兰山山...

2025-4-30-逃离北京计划(1)

嘿嘿,今天直接闪现呼和浩特。

总结一下:今天走了14.7km,我是神!

呼和浩特

早上因为脑子里在不停地循环“私はできない できない できない子”所以其实6.15就醒了。掂念着昨天晚上上课忘记带走地耳机,想着今天早上一定要早点起来去拿,结果起的也太早了吧(啊喂

2025-4-24

其他

知道RLHF吗?讲一下训练流程

用于大模型(如ChatGPT)对齐人类价值的训练方法。

  1. Supervised Fine-Tuning(SFT):用高质量人类标注数据微调预训练模型
  2. Reward Model(RM)训练

2025-4-23-Transformer相关知识

有关于Transformer的一些知识盘点。

Transformer

...
搜索
匹配结果数:
未搜索到匹配的文章。
CNN RNN