搜索

Schwertlilien

As a recoder: notes and ideas.

2025-5-1-逃离北京计划(2)

1 个月前

今天主要是在乌兰察布市的旁边的草原和火山转了转。(不安です)

乌兰察布

郭林锡勒草原

从早上6.30起床、然后7.10去吃早餐、7.30匆匆到集合地集合；于是开始了一天的坐车之旅（拜托，这可是整整从早上7.30-20.00的全程坐车之旅）。

大草原上风呼呼地吹、感觉人被冻傻了；再就是意外发现了一个湖，上面有些许的...

2025-4-30-逃离北京计划(1)

1 个月前

嘿嘿，今天直接闪现呼和浩特。

总结一下：今天走了14.7km，我是神！

呼和浩特

早上因为脑子里在不停地循环“私はできない　できない　できない子”所以其实6.15就醒了。掂念着昨天晚上上课忘记带走地耳机，想着今天早上一定要早点起来去拿，结果起的也太早了吧（啊喂

搭上8.30-9.37的怀柔小火车，抵达清河站——

结果因为截图...

2025-4-29

1 个月前

昨天跑了几个实验，得到了如下的结果：

detectron2

2025-4-24

1 个月前

其他

知道RLHF吗？讲一下训练流程

用于大模型（如ChatGPT）对齐人类价值的训练方法。

Supervised Fine-Tuning（SFT）：用高质量人类标注数据微调预训练模型

Reward Model（RM）训练：用人类偏好数据训练打分模型

阅读全文

2025-4-23-RNN/LSTM简介

1 个月前

RNN（循环神经网络）

核心结构: RNN 的设计目的是处理序列数据（如文本、语音），其核心特点是隐藏层神经元之间存在循环连接，允许信息在时间序列中传递。

2025-4-23-Transformer相关知识

1 个月前

有关于Transformer的一些知识盘点。

Transformer

2025-4-23-梯度消失/爆炸

1 个月前

梯度消失与梯度爆炸的定义

梯度消失（Vanishing Gradient）

现象：反向传播中，梯度随着网络层数或时间步长增加而指数级减小，导致浅层参数更新缓慢，模型无法学习底层特征。
案例：深层CNN或长序列RNN中，浅层权重几乎不更新。...

2025-4-22-字节面试准备

1 个月前

知识点

Transformer

介绍transformer架构
详细说一下Decoder的因果注意力（也叫掩码自注意力）QKV分别来自哪
阅读全文
深度学习

2025-4-22-数据集收集工作推进

1 个月前

wow! A good question is How to collect data to build a dataset.

现在要完成下面的一些问题：

分割数据集-标注工具，怎么标注

上界做到？？最好的分割方法

方法构建-当前的最新的方法

如何评估

分期推进数据数据集的标注进展

阅读全文

2025-4-20-论文评审

1 个月前

Q: 开放词汇vs开放集vs开放世界？？

A: 开放词汇的解释。

Open-Set Object Detection：模型不仅需要识别图像中的已知目标对象（即已知类别），还需要能够识别出图像中不属于已知类别的未知目标对象，并拒绝...

阅读全文

目标检测

123…14

搜索

匹配结果数:

未搜索到匹配的文章。