2025-5-4-逃离北京计划(5)

自驾一下午,悲剧于高速路口出现。

奔驰于高速,下高速吃烧烤。

回到酒店点奶茶。

感觉此篇应该是吐槽贴。

早上吃过小馄饨之后,去附近把车提了。

话又说回昨天晚上,小R说,“陪我去提车”。但是小R当时预定提车的时间是晚上9.左右。但是没想到我们从五湖穿越回来都已经十点多了。我实在太累了,并不想在动了,因此想让小R小L去提车,俺歇着()

2025-5-2-逃离北京计划(3)

悲,去旅游的话就是每天无法睡懒觉。平均起床时间都在6.多。今天早上起来的更早,5.20多,差不多要下火车了。

银川-西夏区

早上先去酒店放了放行李,休整了一下,顺便混了一顿酒店的早饭,打了车准备向西夏区的岩画、西夏陵进发。

今天一天的活动范围就在贺兰山山...

2025-4-30-逃离北京计划(1)

嘿嘿,今天直接闪现呼和浩特。

总结一下:今天走了14.7km,我是神!

呼和浩特

早上因为脑子里在不停地循环“私はできない できない できない子”所以其实6.15就醒了。掂念着昨天晚上上课忘记带走地耳机,想着今天早上一定要早点起来去拿,结果起的也太早了吧(啊喂

2025-4-24

其他

知道RLHF吗?讲一下训练流程

用于大模型(如ChatGPT)对齐人类价值的训练方法。

  1. Supervised Fine-Tuning(SFT):用高质量人类标注数据微调预训练模型
  2. Reward Model(RM)训练

2025-4-23-Transformer相关知识

有关于Transformer的一些知识盘点。

Transformer

...
搜索
匹配结果数:
未搜索到匹配的文章。
CNN RNN