刷题日记-1

开始佛系找工作(?)

主要是今天接到字节的电话,不知何时会等到一个面试,遂开始写点题。

然后下午的时候确定了时间,咱就是说,有一个死缓期,还是刷点题吧()。

Q2-重新排列数组

给你一个数组 nums,数组中有

Mon Dec 15 2025 00:00:00 GMT+0800 (中國標準時間)

我的指令:

这是OneFormer的方法,其这个文件夹下放着的是这个方法的相关代码。我现在想用这个方法在不同的做分割的数据集上跑实验。现在我想首先使用UECFoodPixComplete在这个方法上进行实验。UECFoodPixComplete数据集的相关信息也在想管的文件夹中。用中文和我交流。

阅读全文

2025-12-9

有关分割的信息

语义分割+卷积

语义分割:不区分同类别的不同实例。

早期研究(2017): 由卷积神经网络(CNN)主导,以全卷积网络(FCN)、DeepLa...

Mon Nov 24 2025 00:00:00 GMT+0800 (中國標準時間)

数据集的下一步工作的思考:

因为是分割数据集,我觉得后续的工作也是根据分割的标注去得到一些输出。之前也有说过,从方法上考虑是做下游任务:

  • 营养评估:考虑分割定位边缘更加精准,探索结合3D重建技术,从二维图像中估算菜品的实际体积。通过引入密度、食材成分等先验知识,构建从视觉信息到营养成分(如卡路里、碳水化合物、蛋白质、脂肪等)的量化评估模型。
  • 视觉VQA:对图片...

Tue Nov 11 2025 00:00:00 GMT+0800 (中國標準時間)

假设你是一个计算机视觉方面的专家,对于图像处理,强化学习,大模型等研究方向十分擅长。我想和你讨论一下我现在进行的研究课题,请指导一下我:我要解决的目标是图片中类与类之间的混合、重叠、覆盖的问题。具体来说,我是在食品场景中。在中餐中,作为十分常见的盖饭或是学校餐盘场景,经常会有不同的菜的边缘会混合在一起,甚至不只是边缘,而是混合的程度比较深。因为每一道中餐都是有不同的食材组成的,菜与菜之间可能含有相同的食材,或是比较相似的食材,这导致在边缘混合的情况下准确的定...

Mon Nov 10 2025 00:00:00 GMT+0800 (中國標準時間)

一些疑问

Q:有时候的框架仅使用了CLIP的单个编码器,这是为什么?

A:CLIP通过海量数据和对比学习训练后,它的两个编码器已经不再是普通的模型了,它们变成了:

  • 图像编码器:一个极其强大和通用的视觉特征提取器