归档

2025
四月
2025-4-30-逃离北京计划(1)
嘿嘿,今天直接闪现呼和浩特。 总结一下:今天走了14.7km,我是神! 呼和浩特 早上因为脑子里在不停地循环“私はできない できな...
2025-04-30
2025-4-29
昨天跑了几个实验,得到了如下的结果: detectron2 sam detectron2可以做语义分割,但是对...
2025-04-29
2025-4-24
其他 知道RLHF吗?讲一下训练流程 用于大模型(如ChatGPT)对齐人类价值的训练方法。 Supervised Fine-T...
2025-04-24
2025-4-23-RNN/LSTM简介
RNN(循环神经网络) 核心结构: RNN 的设计目的是处理序列数据(如文本、语音),其核心特点是隐藏层神经元之间存在循环连接,允许信息在时...
2025-04-23
2025-4-23-Transformer相关知识
有关于Transformer的一些知识盘点。 Transformer CNN RNN T...
2025-04-23
2025-4-23-梯度消失/爆炸
梯度消失与梯度爆炸的定义 梯度消失(Vanishing Gradient) 现象:反向传播中,梯度随着网络层数或时间步长增加而指数级减小...
2025-04-23
2025-4-22-字节面试准备
知识点 Transformer 介绍transformer架构 详细说一下Decoder的因果注意力 (也叫掩码自注意力)QKV分别...
2025-04-22
2025-4-22-数据集收集工作推进
wow! A good question is How to collect data to build a dataset. 现在要完成...
2025-04-22
2025-4-20-论文评审
Q: 开放词汇vs开放集vs开放世界?? A: 开放词汇的解释。 Open-Set Object Detection:模型不仅需要识别...
2025-04-20