2025-4-1-继续实验

CPEA

话说,感觉《一兆游戏》第一集25.50-30.00这一段配三个人非常easy。

还是先看论文吧

Backbone基本上是ResNet12,Dataset:miniImageNet , tieredImageNet, CIFAR-FS, and FC100。

阅读全文

2025-3-27-实验

最近,沉迷于看小说,我反思……

实验进度

还是最简单的三个实验、然后重复实验、已添加的指标、再跑shot=8上的。

image-2025032723...</div><div class=阅读全文

2025-3-21-AI-Agent?

AI Agent

比较正规的解释:AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。它们具备记忆、逻辑分析能力和任务拆解能力,旨在通过自然语言与用户交互,自动化处理复杂工作任务。

这个词倒不是今年才火的。实际上,在Chat GPT未提出之前、就已经有paper提出此思想。阅读全文

2025-3-20

晚上很饿,遂吃一个香蕉,发现能迅速有效缓解饥饿,赞。

PPT要改的地方:

每个组件 都相较于原来的、改变了什么、为什么比原有的效果好?好在哪里?

再就是听众不清楚强化学习、先介绍一下强化学习是什么。

用一个PPT介绍、再就是给每个组件都举例说明。

为什么是两次SFT+RL?不是三次?

阅读全文

2025-3-18-Zhou-CVPR-2020

Bellver Bueno, Miriam, et al. "Hierarchical object detection with deep reinforcement learning." Deep Learning for Image Processing Applications. IOS Press, 2017. 164-176.

...

2025-3-17-实验进度

image-20250317235634066gua

关于简单的实验做完了,还剩下几块难啃的骨头()

food101-MAML的今晚应该能跑完。

python ./test.py --dataset food101 --model Co...

2025-3-17-Uzkent-WACV-2020

Uzkent, Burak, Christopher Yeh, and Stefano Ermon. "Efficient object detection in large images using deep reinforcement learning." Proceedings of the IEEE/CVF winter conference on applications of computer vision. 2020....