1 个月前
今天主要是在乌兰察布市的旁边的草原和火山转了转。(不安です)
乌兰察布
郭林锡勒草原
从早上6.30起床、然后7.10去吃早餐、7.30匆匆到集合地集合;于是开始了一天的坐车之旅(拜托,这可是整整从早上7.30-20.00的全程坐车之旅)。
大草原上风呼呼地吹、感觉人被冻傻了;再就是意外发现了一个湖,上面有些许的...
今天主要是在乌兰察布市的旁边的草原和火山转了转。(不安です)
从早上6.30起床、然后7.10去吃早餐、7.30匆匆到集合地集合;于是开始了一天的坐车之旅(拜托,这可是整整从早上7.30-20.00的全程坐车之旅)。
大草原上风呼呼地吹、感觉人被冻傻了;再就是意外发现了一个湖,上面有些许的...
嘿嘿,今天直接闪现呼和浩特。
总结一下:今天走了14.7km,我是神!
早上因为脑子里在不停地循环“私はできない できない できない子”所以其实6.15就醒了。掂念着昨天晚上上课忘记带走地耳机,想着今天早上一定要早点起来去拿,结果起的也太早了吧(啊喂
搭上8.30-9.37的怀柔小火车,抵达清河站——
结果因为截图...
知道RLHF吗?讲一下训练流程
用于大模型(如ChatGPT)对齐人类价值的训练方法。
- Supervised Fine-Tuning(SFT):用高质量人类标注数据微调预训练模型
- Reward Model(RM)训练:用人类偏好数据训练打分模型
1 个月前 1 个月前有关于Transformer的一些知识盘点。
Transformer
1 个月前梯度消失与梯度爆炸的定义
梯度消失(Vanishing Gradient)
- 现象:反向传播中,梯度随着网络层数或时间步长增加而指数级减小,导致浅层参数更新缓慢,模型无法学习底层特征。
- 案例:深层CNN或长序列RNN中,浅层权重几乎不更新。...
1 个月前知识点
Transformer
- 介绍transformer架构
- 详细说一下Decoder的因果注意力 (也叫掩码自注意力)QKV分别来自哪
1 个月前wow! A good question is How to collect data to build a dataset.
现在要完成下面的一些问题:
- 分割数据集-标注工具,怎么标注
- 上界做到??最好的分割方法
- 方法构建-当前的最新的方法
- 如何评估
- 分期推进数据 数据集的标注进展
1 个月前Q: 开放词汇vs开放集vs开放世界??
A: 开放词汇的解释。
Open-Set Object Detection:模型不仅需要识别图像中的已知目标对象(即已知类别),还需要能够识别出图像中不属于已知类别的未知目标对象,并拒绝...
搜索匹配结果数:未搜索到匹配的文章。