Pipeline 可视化报告

Dialogue: 4517902939_1 fragments: 1 covered: 0

#10

user1

后面可以实验直接使用coco的那个faster rcnn权重加载进去训练dota数据集，做几组实验看看。你的数据集样本有多少？尺寸是多大呢？

#11

user2

就是咱们第一次测试的时候您发的那个权重是吧。

#12

user1

对，就是那个评估37.几的。

#13

user2

#14

user2

不到3000张图。

#15

user1

尺寸这个比较重要，是和coco数据有比较大的差异的地方。图片样本也很少。

#16

user2

对 coco单卡一个epoch得一个半小时。

#17

user1

那确实需要使用coco数据集的faster-rcnn的权重来训练了。

#18

user2

这个就5分钟。

#19

user1

主要是你的数据量小了很多。coco数据集应该有19万的样本吧。不对，9万多好像。我也记不清了。

#20

user2

但是这个数据。它目标不见得会少。有40多万个目标。It contains 403,318 instances in total。

#21

user1

目标不少，但样本的辨识度太低了，学习难度就比较高。

#22

user2

是的。

#23

user1

里面有20000尺寸的，最好统计一下各个尺寸范围的比例，分析一下数据，设置一个比较好的resize 尺寸。

#24

user2

我看看它论文里给了没。

#25

user1

也可以参考参考之前开源代码里对dota数据集的超参设置。应该有不少人调过这个数据集。

#26

user2

#27

user2

还差挺多的。

#28

user2

#29

user2

#30

user2

这个好像是我们实验室啊。

#31

user1

，不慌，我们这才是实验性的跑起来，后面优化的地方还多。

#32

user2

老师那个旋转框是不是先不着急加。

#33

user1

那还不请教请教你的师兄师姐。

#34

user2

嗯嗯嗯我得问问老师是谁做的。

#35

user1

旋转框那个可以下个月上，这个月主要要把vit和swin的有效果出来。

#36

user2

嗯嗯那我最近就先着重优化这个框架。

#37

user1

是的，先把基础框架打牢。

#38

user2

好。正好下个月我就考完试了。

#39

user1

那肯定考试更重要的。

#40

user2

#41

user2

老师和您汇报下目前的情况。换swin的同学说刚开始跑的时候也是没有输出，然后改了改参数有了一点点精度。

#42

user2

#43

user1

不过现在差距还是有些大，这样吧，裸训的话把轮数加大，训24epoch看下精度。

#44

user2

我现在都是训60个。

#45

user1

之前你实验室那个打榜数据要相关的参数介绍没呢？

#46

user2

打榜的那个没要到，王老师给了一个旋转框的。是基于metection框架的。然后image scale设的是512*512。其他的就有一个numgts不一样我正在实验呢。

#47

user1

没有非旋转框的嘛？

#48

user2

王老师就帮忙找到一个旋转框的。发现上升好慢又给调回来了。因为基本上都是。50来个epoch才到最高的结果。

#49

user1

主要是要确定一下faster-rcnn模型对这个数据集的性能目前最高能做到什么地步，算法本身肯定也存在瓶颈。

#50

user2

我在博客里倒是找到一个。他的mAP@0.5也是30多。。不过博客可能参考性没那么大。

#51

user1

王老师发给你的旋转框配置是基于faster rcnn吗？

#52

user2

嗯嗯对。

#53

user1

他的baseline map是多少呢？

#54

user2

她就发了一个配置文件。然后说这个精度差的有点多。

#55

user1

，确实差的有些多。

#56

user2

我问她精度多少她给忽略了。大概60可能差不多？我看了一下dota的论文。

#57

user1

我觉得70应该差不多，毕竟sota都79了。

#58

user2

没有没有。论文上也用faster rcnn 测了。这个模型是当时最高的。也就60。

#59

user1

那差一半啊，参数配置论文上有说吗？

#60

user2

#61

user2

咱现在38，他是60。emmm给了个代码。他说是基于这个代码改的。https://github.com/msracver/Deformable-ConvNets。

#62

user1

backbone用的应该不是resnet50。

#63

user2

他用的101貌似是。

#64

user1

-H？hrnet？那我们也用101跑一个看看。

#65

user2

他还用了一个小技巧。就是说这个图不是太大吗。然后就全都裁成1024*1024的。检测完了之后。再把结果拼起来。合在原图里。

#66

user1

，骚操作。

#67

user2

#68

user2

裁还行我感觉这玩意拼不好拼呢。

#69

user1

大图变小图来检测，可以提高小目标的检测性能，应该是不太好拼接，比较麻烦。

#70

user2

对。其他的就没啥信息量了。

#71

user1

那我们暂时目标调到接近60就行了。换res101来训练。

#72

user2

那我用101试试。嗯嗯。

#73

user1

101的实现你参考vision里面的，直接拿过来应该可以用。

#74

user2

好的。

#75

user1

swin那个他之前找过我，它有加载swin的权重进去没呢？还是说直接裸训的。

#76

user2

裸训的。

#77

user2

#78

user1

那看来swin网络挺稳定的，速度咋样呢？

#79

user2

速度不知道，我问问。8分钟一个epoch。

#80

user1

嗯嗯，让他实验一下加载swin权重（方便后面使用mae预训练的）和 finetune的优化器和学习策略尝试一下mae里面配置的，transformer网络里通常都是用adamweightdecay优化器和cosine学习策略。胡雷毅那边反馈说swin网络跑起来太慢了，你们数据量应该也是比较小的。

#81

user2

嗯嗯这个相当小了相比coco。我说错了老师这个图的结果，他说是加载了预训练模型的。。

#82

user1

后面swin网络性能上还需要进一步优化一下。，我说呢，我记得他之前和我讲裸训一直爆炸。

#83

user2

#84

user1

我让他加载官网的swin权重进去试试。

#85

user2

嗯嗯。

#86

user1

他意思是加载了之后网络实际上还是有问题的呀？后面权重都是0的话。

#87

user2

说是到一半这样的。而且他加载的就是官网的那个模型。

#88

user1

那还行，按理说用swin应该比resnet50效果要好一点儿，让他坐后面说的实验吧，换优化器和学习策略。

#89

user2

老师他换优化器遇到点问题，我也不懂，让他找您了哈。

#90

user1

好，明天再找我看一下吧。

Dialogue: 4525591374 fragments: 1 covered: 0

user2

老师我从这几个方面查了数据集，都没有问题。我们昨天打印出来的catToImages出现重复的image_id是因为每遇到一个属于这个图片的框，这个图片的id就被加进去一次，这里没有问题。而且我跟踪了一下代码，这里用到的是coco工具的getcatsid 和 imageid,没用到这个属性。但是我好像知道它为啥总是预测类别11（small vehicle）了，数据分布是这样的（每个类别对应框的数量）。

user2

目标样本分布也太不均衡了。

user1

那意思是训练不充分是吧，pytorch上有人用faster-rcnn做过这个数据集的实验没呢？

user2

就是有的类别四万多张，有的才14张，嗯嗯，训练不充分不平衡。

user1

resnet这个backbone权重你有加载进去吗？

user2

加不加载差不多。都试了。

user1

那感觉效果也太差了，我看loss降的挺低的啊。那看来是要解决loss震荡的问题。

user2

预测结果。全都去预测11了，别的训练样本加起来都没它多。

#10

user1

这个数据集按理说应该也有人用faster-rcnn跑过。看下有没有可以参考的调参或者数据处理经验。你师兄师姐他们有跑过这个数据集吗？

#11

user2

我去问问王老师。昨天另一个同学在nwpu上跑了。

#12

user2

#13

user1

效果咋样？

#14

user2

能降到这个程度。他还没有eval。

#15

user1

为啥第一个loss这么大啊。

#16

user2

有没有可能它加载了backbone的预训练模型。然后那个模型是在传统图像数据集里训得。所以特征差距有点大。

#17

user1

不应该的，都是rgb图像，按理说不会有这么大差距。loss过于异常了，精度估计也不咋地。

#18

user2

嗯嗯也是震荡。

#19

user1

这样吧，还是跑一下coco的数据集，确保这个开源的网络可以复现coco的结果。

#20

user2

老师有没有什么快捷的，可以上传数据集的方式。

#21

user1

如果数据集没问题，网络不知道是不是后面被更新的有问题了。

#22

user2

我不想百度网盘了。

#23

user1

我同步一份数据集上传到obs上，你利用obsutil工具再同步到你的服务器上。

#24

user2

好嘞谢谢老师。

#25

user1

obs://linbert/data/coco/。我在往这个路径里上传。obsutil你会用吧？

#26

user2

我听您讲过。我再去翻翻讲义。

#27

user1

计算中心平台培训的PPT上有介绍和下载链接。

#28

user2

好的。

#29

user1

https://gitee.com/foundation-models/aircas-project/blob/master/docs/%E6%A8%A1%E5%9E%8B%E8%BF%81%E7%A7%BB%E8%A7%84%E8%8C%83/%E6%A8%A1%E5%9E%8B%E5%B7%A5%E7%A8%8B%E6%9E%B6%E6%9E%84%E6%A0%B7%E4%BE%8B/mae%EF%BC%88%E6%A8%A1%E5%9E%8B%E5%90%8D%E7%A7%B0%EF%BC%89/obssync.sh。直接参考这个文件。

#30

user2

嗯嗯好。

#31

user1

我直接上传mindrecord的数据集和json文件，原始图片是不是不需要了？

#32

user2

嗯嗯对就可以直接训练了。

#33

user1

那就行，还有3min就能传完了。

#34

user2

#35

user1

#36

user2

这个链接不让我访问。哦哦。好的。

#37

user1

#38

user2

好老师我想起来了。我查的是val的分布。只能说明数据处理过程没问题。这个结果不一定是数据不均衡造成的了。

#39

user2

#40

user2

老师我执行了这个命令。

#41

user2

#42

user2

还报这个错误呢。

#43

user1

是不是安装错了系统的。你这个是不是Ubuntu的系统。https://support.huaweicloud.com/utiltg-obs/obs_11_0003.html。

#44

user2

是咱们的168.170.180.62服务器。哦在传了它是ubuntu但是是x86的架构。

#45

user1

咋样，传成功没呢？

#46

user2

嗯嗯传完啦。

#47

user2

#48

user1

嗯嗯，你不要改网络部分，按照官网的配置跑一下看。

#49

user2

好的。何老师打扰一下我跑完了coco数据集，loss没有下降的趋势，测试的时候也没有有效的框输出。卢致聪跑了NWPU数据集，也是一样的情况。

#50

user2

#51

user2

就是根据官网的配置做的。没有改动。对呀。啥也没改。。

#52

user1

那就是model zoo代码本身有问题了。

#53

user2

应该是了 nwpu数据集训出来的也没有输出。

#54

user1

评估那一部分的代码要好好检查检查，看算法实现上是不是有问题。

#55

user2

有没有可能从训练就出问题了。

#56

user1

coco的loss降的和官网上差不多吧？

#57

user2

那倒是不过官网上还是有下降趋势的。

#58

user1

还是重点检查评估部分的代码，从数据集输入到网络输出再到后处理过程，这个网络在coco数据集是经过很多次验证了，网络部分肯定是没啥问题的。

#59

user2

好的收到。

#60

user1

你评估的时候是单卡评估是吧。

#61

user2

对用的单卡。

#62

user1

我下午再发你一份我以前的评估代码。

#63

user2

好的好的。

#64

user1

你代码在哪台服务器上？我看一下。

#65

user2

服务器：ssh root@168.170.180.62 密码：Ascend@hpi4。/home/gfzshiwai/fasterrcnn。

#66

user1

这个事吧。

#67

user1

#68

user2

对。结果在scripts/train1里。

#69

user1

eval的执行命令发我看下，还有默认的配置文件是哪个？

#70

user2

faster_rcnn/default_config.yaml。bash run_eval_ascend.sh /home/gfzshiwai/obs_coco/annotations/instances_val2017.json /home/gfzshiwai/faster_rcnn/scripts/train/ckpt_0/faster_rcnn-11_58633.ckpt resnet_v1.5_50 /home/gfzshiwai/obs_coco。

#71

user1

。https://download.mindspore.cn/model_zoo/r1.3/fasterrcnnresnetv150_ascend_v130_coco2017_official_cv_bs2_acc60.6/。把这个ckpt下载下来。评估一下看看。

#72

user2

这是整个模型的参数吧。

#73

user1

对。训练好的。

#74

user2

#75

user1

，咋还加载不了。

#76

user2

这好像是一个80类一个81类的回归参数。这个权重文件里为什么对background还有一组回归参数呢。。

#77

user1

320是啥的维度？

#78

user2

80 x 4。

#79

user1

那把类别直接改一下试试把。

#80

user2

嗯嗯我试试。在跑了。。

#81

user2

#82

user2

有了。但是老师我有点不懂为什么还要预测背景的回归参数。

#83

user1

网络要学习除目标以外的背景信息，让网络可以分辨图片背景，用此区分正负样本。

#84

user2

这说明推理的代码也没问题。那就是把这个参数加上重新训试试？看来回归的时候也要加。

#85

user1

对，我测试了一下，网络直接输出来的，都是无效框，全是空值。后面处理应该没问题。

#86

user2

没想到加不加背景框的回归效果会差这么多。

#87

user1

他网络本身就没加吗？

#88

user2

#89

user2

对网络本身没加。这是我刚才改的。就是RCNN类的初始化。

#90

user1

#91

user1

，真无语，mindspore的人合代码之前都没检查一下。

#92

user2

新版本画蛇添足了属于是。老师那这个官方modelzoo里的代码不得改一下吗。不然大家下下来还得debug。

#93

user1

有时间提个issue给他吧。

#94

user2

嗯嗯行。谢谢老师要是我自己估计先找不着是这的问题。。

Dialogue: 4524863919_1 fragments: 2 covered: 0

user2

羊子。你给我发个vlm做分类的json呢。我看看

user1

好的好的，发给你了。

user2

input里面的预定类别不是这个数据集的所有类别吧。这是为啥这样设置捏。

user1

我看geochat也是这样做的。

Dialogue: 4502841701 fragments: 1 covered: 0

#79

user2

input里面的预定类别不是这个数据集的所有类别吧。这是为啥这样设置捏。

#80

user1

我看geochat也是这样做的。

#81

user2

这个评价指标用的是啥。

#82

user1

#83

user1

就是预测的精度。正确数目/总数。

#84

user2

判断是否正确，比的是输出的字符是否是“airplane”。这种么。完全匹配则是预测正确？

#85

user1

对。

Query 2: 辣条

Dialogue: 4496860679 fragments: 1 covered: 0

#12

user2

#14

user1

#15

user1

感觉很香。

#16

user2

牛逼哈哈。蕃茄味的？

#17

user1

酸辣味的。挺好吃的。

#18

user2

可以。我之前吃的原味。没味儿。别吃。

Dialogue: 4498002041 fragments: 1 covered: 0

#18

user1

#20

user1

买了十包辣条。飞旺最好吃。

#23

user1

Dialogue: 4489116092_1 fragments: 1 covered: 0

#30

user2

#31

user2

这个辣椒真不错。我先睡了。你早点休息。

Dialogue: 4517514626 fragments: 1 covered: 0

user2

user1

吃这么好。

user2

又多了三个凉菜。

user2

4505301654_1_1

user1

好，明天再找我看一下吧。

user2

嗯嗯行。何老师我们现在遇到一个问题：多卡跑的时候如果启动单卡任务，多卡就会断；如果单卡跑的时候启动多卡，单卡也会断。这种情况有时候发生有时候又不发生。

user1

，还有这种问题啊。

user2

user1

会不会是其他人kill的命令不对，误kill了进程啊。

user2

就报这种错。我们正在聊天呢。没有人kill。

user1

这种错误很难说，目前mindspore版本是多少呢？

user2

就是最开始安装的1.6。有时候重启一下服务器能好一会，不过下次就不行了。

user1

那最有可能是硬件问题，可能需要找一下群里的崔宇报备一下这个情况。不过你们这样，首先把所有进程都kill掉。对了，是不是有用docker容器的环境跑啊？

user2

没有人用docker。。

#10

user1

npu-smi info 命令截图我看下，看下每张卡的状态。

#11

user2

#12

user1

现在这么多试验在跑着，估计也不能kill。

#13

user2

我刚刚启动的7卡，0123就停了。现在应该只有56在跑。

#14

user1

这就挺离谱的。你们用的数据集都是一份吗？

#15

user2

哈哈哈太离谱了。对。现在都在跑Dior。

#16

user1

要不试试隔离一下吧。每个人建一个conda环境。物理机上有conda吗？

#17

user2

有的。好那我们试一下。

#18

user1

那你们每个人搞个conda环境执行任务试一试。

#19

user2

好嘞。

#20

user1

我们这边物理机都是这样操作的，还没遇到过你们这种情况。

#21

user2

我们之前很长一段时间没有这个问题的。就是最近几天。我也觉得有可能硬件有问题，我找崔宇老师报备一下吧。

#22

user1

这个不好查原因，不过大概率硬件时不时可能不稳定。可以的。让他那边安排人检查一下。

#23

user2

好的。何老师我在modelzoo上拉取了一个fasterrcnn对应mindspore1.6版本的镜像，然后创建容器之后进入了一个普通用户，连创建文件的权限都没有，不知道有没有默认的root密码呀。

#24

user2

#25

user1

不对呀，你们机器都是root用户登录的。

#26

user2

就是用官网上那个docker镜像。创建了一个容器。进去之后就是一个普通用户。

#27

user1

你自己可以指定容器的用户权限，在创建的时候。

#28

user2

噢噢，我试一下。何老师打扰一下，我门上传到gitee的代码，是不是只要包含针对Dior数据集的配置就可以了，还有就是readme要包含哪些内容呢。

#29

user1

就类似modelzoo上原本的格式来填写就行。

#30

user2

嗯嗯那结果也是写在dior上的结果吗。

#31

user1

数据集配置先都上传上去，我先看一下。

#32

user2

好的。

#33

user1

我们开源仓在另一个仓，代码先上我们这个仓，可能还要整改一下。

#34

user2

嗯嗯，我们合完就先都传上去。

4504660431

user1

师弟，从fair1m数据集里面找100张图，这100张图里面要包含faie1m里面的五个大类，只需要找出来图片就行。数据下载地址：https://blog.csdn.net/Harry_Jack/article/details/120673622。争取周末放假前整理完给我。

user1

截图里面是五个大类别，你找出来的这100张图包含这五个大类别就行。

user2

收到，是这周六之前吗。

user1

对的师弟。

user2

好。师兄，是总共找100张图片，每张图片都要包括这五个大类。具体是五大类内部的哪个类没关系嘛。

user1

不用每张图片，100张图里面总共包含5大类就行，内部的小类先不用管。

user2

哦。好滴。师兄，这个是我整理好的图片和对应的label。相应的类别还有每个类别的计数我都保存在excel里了。

user1

好的师弟，辛苦。

user2

客气了应该的。

#10

user1

师弟最近有时间吗。

#11

user2

师兄，这两天家里有点事情。，过两天回学校应该还好。

#12

user1

OK。那你先忙。

#13

user2

有什么任务吗？我可以抽空先带起来。

#14

user1

筛一下数据，标注公司的数据反馈回来了，需要筛选一下。

#15

user2

哦哦。师兄，像这种 bottom的意思是在另外一个飞机的下面，不是指在图片的下面？

#16

user2

#17

user1

图片下方也没有飞机了吧。那我们就认为这个图也是正确的。

#18

user2

ok。师兄，我看了一遍，就是一开始没理解对bottom这些位置的意思，找了些错误。后来弄明白之后复看了一遍前面找的错误，发现都没啥问题。右上角的bottom right side不确定对不对。这个看不清是不是篮球场。

#19

user2

#20

user1

OK师弟。辛苦师弟了。

#21

user2

没事。师兄老师这个是线下开还是线上开啊。

#22

user1

应该是线下。

#23

user2

哦哦好的。

#24

user1

师弟今天有时间吗。

#25

user2

还好，是有什么事吗。

#26

user2

好的。师兄，这就算一个2d框一个描述，对吗。

#27

user2

#28

user1

对的。

#29

user2

好的。

#30

user1

师弟，按cap字段来统计，cap出现的次数就是标注的数量。麻烦师弟重新统计下。

#31

user2

我现在在外面手头没电脑，晚上搞可以吗。

#32

user1

ok。不着急。

#33

user2

师兄我现在要改的是2d框的数量还是描述的数量啊，我还是没太明白。

#34

user1

cap的数量。有一定的出入。咱俩和公司的统计都有出入。你看统计cap字段是30775吗。

#35

user2

我统计到30754。

#36

user1

阿这。问题不大。那就30755吧。

#37

user2

好的。

4524436736_1_1

user1

okok。

user2

志强，我想求助一下，你了解cider这个指标吗。他的取值范围是多少你知道吗。就这个问题。

user1

问问润岩。他知道这个。

user2

好！谢谢志强。

user1

好的。

user2

看我有些文件夹也是空的。没有的不用放了。我就是空着了。

user1

好的。直接刻盘就行了对吧。

user2

对的！直接刻。然后放我桌子上就行。桌上好几份光盘。放一起就行。

user1

好。

user2

志强，离校oa你之前给过我不？

#10

user1

额。啥 oa 啊俊希。

#11

user2

1.毕业生离校离院申请批准之后，登录空天院协同，发起“研究生毕业通知单”审批表单，待审核完成后毕业生导出OA审批单，以“学号-姓名”命名，汇总至李俊希处。6月25日前完成。这个哈。不着急，你要没弄就弄下。

#12

user1

还没把我申请下。嗯嗯。这个吗俊希。部门研究生负责人是谁呀俊希。

#13

user2

对的。是这个。孙老师。

#14

user1

hao。已经发送了等审批。

#15

user2

好滴。

#16

user1

这样就行吗俊希。

#17

user2

你这个应该还没审批完，志强。

#18

user1

。只剩下亚姐审批了是吗。

#19

user2

亚姐。孙老师。

#20

user1

奥奥我去催下。

#21

user2

都需要审批呢。没事，不着急。别管了。

#22

user1

好的。好了俊希。

#23

user2

好滴！！！收到！！！刚才睡着了。。

#24

user1

ok。俊希我们的入党志愿书能拿到吗公司要这个东西。复印件。

#25

user2

志强，你派遣了吗。

#26

user1

派遣不是户口吗。

#27

user2

档案。

#28

user1

党关系也需要派遣吗。

#29

user2

你的党关系档案和人事档案一起走。派遣就给你寄走。

#30

user1

奥。那我再问问。这个能复印吗先？方便吗。

#31

user2

好滴。要这个东西申请查党就行。你的档案在这边，就在这边申请。在那边，就在那边申请。所以只要知道在哪儿就行。

#32

user1

这边申请查党需要几天啊俊希。

#33

user2

志强，具体我没操作过。我找找。

#34

user1

需要在 OA 申请是吗。

#35

user2

我这个手机上没有。我们在怀柔培训呢。今晚上住这里。

#36

user1

好。

#37

user2

要不我明天给你问问呢？

#38

user1

ok。

#39

user2

今天党办老师下班了。你着急不？

#40

user1

感谢。不着急。

#41

user2

那行，我明天给你问问。

#42

user1

ok。俊希有问怎么操作嘛。还有我看我们的介绍信时效只有一个月超了就严格送不回去了是嘛。

#43

user2

超过了要重新开。志强。我现在发消息。志强。你提oa吧。问了三个人。终于找到了。老师说你的档案还没转出。

#44

user1

好但是需要。这个我得先问公司要。我去问问。

#45

user2

好滴。

#46

user1

俊希。我们党支部书记是谁呀。

#47

user2

是我哈。

#48

user1

啊……写成张道兵老师了。我再写一下。发过去了俊希。

#49

user2

好滴好滴。

#50

user1

对了俊希介绍信回执需要交给你是嘛还是直接交给空天院。

#51

user2

信封里有。按照信封里的邮寄就可以啦。

#52

user1

好。俊希，提完以后我去哪复印呀。

#53

user2

应该是李宁老师会给你留言吧。还差李宁老师的批示。

#54

user1

好。好。

#55

user2

志强，你的学号多少。

#56

user1

201918013727046。

#57

user2

收到！

#58

user1

这些那个就业推荐表儿，然后我上面儿有划的，就是就是比如说我拿字儿写错，我把它划掉了，然后我们这边儿说让重新盖空天院教育处的章，这个章好盖吗。你比如说这个就业范围全国还是不限制，我写错了，他就说需要在这儿盖个章。

#59

user2

这玩意没啥用呀，能不能和腾讯商量下，别要这个了。我的都没交。

#60

user1

不行，人家强制要这个。这个章我得找谁申请，需要盖呀？

#61

user2

那就找李宁吧。

#62

user1

而且这还挺急的。他说的是明天下午六点之前要交。涉及落户口的事儿。

#63

user2

直接给他发企业微信。他就处理了。审批也快。你现在给他发消息。审批好，就给你换了应该。

#64

user1

好。李宁老师在新技术园区哪个楼的825啊？

#65

user2

A。

#66

user1

ok。

#67

user2

就是咱们毕业典礼那里。

#68

user1

好。俊希，我们这个邮给谁呀。

#69

user2

信封里有。志强。

#70

user1

我好像都交了。你信封里的有照片嘛。

#71

user2

志强，我没有。信封我都没有。

#72

user1

奥奥。我去问问。

#73

user2

我没有介绍信。

#74

user1

好。

#75

user2

志强，我来求问一件事，我们准备用生成模型做一批垃圾堆检测的数据集，想问问你知不知道有什么生成模型可以使用呀，不需要做训练那种。

#76

user1

生成分割坐标吗。

#77

user2

生成图像。检测任务。

#78

user1

给坐标生成图像吗。

#79

user2

我们现在是已经下载了一批垃圾堆数据集（图像+目标框xml），都是网上公开了标签的，我们想再做一批新的测试集，用于开展即将举办的一个青少年比赛。在网上下载图像的方法已经想了，但是需要花很多钱，因为一张大图上可能只有一点点的垃圾堆。

#80

user2

#81

user2

就这样，一景大图，只有标×那里一点垃圾堆。所以我们就想着能不能直接用生成模型生成一些垃圾堆图像，我们可以再去标注。

#82

user1

试试4o? 我们一般都调4o接口。

4523674212_1

user2

。xx真把这些东西玩明白了。

user1

哈哈哈。

user2

强得很。

user1

对随机过程做傅里叶变换有什么说法？

user2

首先给我讲了短时傅立叶变换，就是先给这个序列加窗，在时间窗口做傅立叶变换，然后窗移动一个步长，再做傅立叶变换。就是为了分析视频特性。时频。但是我这个序列，长度只有10。

user1

太短了。

user2

对。很有可能不符合香农采样定理。

user1

那就可以压缩感知了。

user2

可以吗。

user1

信息如果是稀疏的话。

#10

user2

其实傅立叶变换是又效果的。

#11

user1

多长的窗？

#12

user2

加了之后效果有变好。我现在就是对整个序列做傅立叶变换。

#13

user1

噢噢没做短时傅里叶变换。

#14

user2

就是长度为10的窗吧hhh。

#15

user1

对，可以这么说。

#16

user2

我觉得这个雷达回波。可能是一个频率比较低的带限信号？你对这个有了解吗他是那种天气雷达。

#17

user1

这个和雷达回波没关系了吧。

#18

user2

6分钟采样一次。

#19

user1

和探测区域的变化频率有关系。

#20

user2

对。这个变化频率。不知道是怎么个频率。

#21

user1

探测区域变化速度和采样频率应该需要满足一定关系。

#22

user2

你说这气象部门，是不是得满足这个关系。

#23

user1

应该得满足，就像防空机枪射速和导弹速度的关系一样。

#24

user2

就是有很多个雷达，每个雷达一个数据，我现在不分析雷达之间的，只分析单个雷达在时间上的关系。

#25

user1

我去。不能理解了。一小时采样十次，十个数？

#26

user2

对，每个地点十个数。但是我有很多个地点。

#27

user1

噢噢明白了，多少个地点？各个地点采样的时间同步吗？

#28

user2

16x16。同步的。

#29

user1

这么少的数据量呀。

#30

user2

其他模块已经分析过相邻地点之间的相似性了。

#31

user1

我以为人工智能得用好多数据量。

#32

user2

这个模块，就分析时间上的相关性。

#33

user1

可以可以，还挺有意思的题目。论文发表后我得了解一下。

#34

user2

初始模型的输入是128x128的，我现在相当于把它的特征提取过程中，得到了一个比较紧凑的特征表示：16x16。如果直接对128x128进行这样的分析，显存吃不消。

#35

user1

这种数据上做人工智能，比其他什么语音图像数据，我应该能理解一些。

#36

user2

这种更接近信号处理。因为它中间要保存很多的特征图，又是视频，10x128x128，加上特征图和模型参数，如果再计算自注意力（平方复杂度），32G的显存都不够了。

#37

user1

噢噢这样呀。

#38

user2

嗯嗯。

#39

user1

训练的话，把10个时间采样换成几个采样？是不是需要很多。

#40

user2

你是说有多少样本吗。

#41

user1

还是说，是很多组 10个时间采样。对。

#42

user2

4万个。

#43

user1

我去。

#44

user2

这个数据集有4万个。

#45

user1

每个都是10×128×128？

#46

user2

每个是20个128*128。后边10个当标签。

#47

user1

噢噢预测10个。

#48

user2

#49

user2

9361*4。不到4万。3万多。

#50

user1

又回到我对人工智能的认知上去了，数据量好大呀。

#51

user2

但是这些数据里边有混叠。比如有40个数据。连续的采样。我会把前20个当一个样本。然后5-25是一个。

#52

user1

噢噢明白。

#53

user2

10-30是一个。这个数据集是香港天文台发的。统计的09-15年的有下雨天的数据。

#54

user1

三千多个小时。

#55

user2

挺多的这个数据集是最大的了。

#56

user1

有公开的数据那还挺好的。

#57

user2

不公开。申请的。

#58

user1

，好吧。

#59

user2

等这个数据集等了一个多月。

#60

user1

那发论文他们也得挂名吧。

#61

user2

不用。

#62

user1

那致谢就可以了。

#63

user2

就说数据集是他们提供的就行了。对。我研究一下xx给我讲的这个短时傅立叶变换，看看怎么加进去。试试效果咋样。

#64

user1

嗯嗯，加油。

#65

user2

起了吗xx。我去烤鸭店等你哈。

#66

user1

荒谬至极了。。。

#67

user2

平时有闹钟周末就容易忘了哈哈哈。https://arxiv.org/abs/1506.02640。xx你直接看这篇吧。我刚才看了看YOLO。还是这个简单易用。看那个faster rcnn 没必要整那么复杂。

#68

user1

好的谢谢xx，我洗澡的时候还在想找不找得到原始文章。

#69

user2

我觉得这个就很适合。

#70

user1

我学习一下。

#71

user2

嗯嗯。

#72

user1

#73

user1

输入的channel是64，下面的标红框的地方，是指有128个卷积核吗？

#74

user2

就是每个卷积核卷出来一个通道。对的。

#75

user1

他这个卷积核的大小是3*3，还是3*3*64呀。是在一个二维平面里卷，还是在三维数据立方体里卷呀。卷积核移动的方向是在前两个维度移动的，不在第三个维度移动是吗？

#76

user2

128个3 3 64的。

#77

user1

那参数好多呀。

#78

user2

是的。

#79

user1

#80

user1

那这个1*1，本质上就是第三维的全连接加上stride的降采样？

4523674212_1_1

user2

嗯嗯。

user1

输入的channel是64，下面的标红框的地方，是指有128个卷积核吗？

user2

就是每个卷积核卷出来一个通道。对的。

user1

user2

128个3 3 64的。

user1

那参数好多呀。

user2

是的。

user1

那这个1*1，本质上就是第三维的全连接加上stride的降采样？

#10

user2

yeap。

#11

user1

ok明白了，谢谢啦。

#12

user2

理解很透彻。

#13

user1

看了一个星期的人工智能了。今天才接触到分类、检测和分割。感觉我要解决的问题不太好建模。因为它涉及到多个框之间的位置约束。

#14

user2

oo 可以再考虑考虑看能不能把这个约束加到模型里。

#15

user1

嗯嗯这个问题基本上是核心工作。

#16

user2

可。

#17

user2

矩阵啊。你就每个样本存成一个.npy。读起来非常方便。深度学习里边存啥的都有。hdf5不多。

#18

user1

OK，就这个了，我去看看matlab怎么存成.npy。我看着csdn上写的读起来确实方便简单。

#19

user1

#20

user1

AI太好用了。

#21

user2

真的就有点东西。咋的xx。真打算用深度学习做啦。

#22

user1

真打算了，网络框架chatGPT都帮我写好了。不过，从我仿真的数据集，和真实数据预处理后，人眼都看不出来sample和label之间的关系，不知道机器能不能学出来。

#23

user2

？

#24

user1

pytorch大大降低了新手进入深度学习领域的成本。

#25

user2

我看看他帮你写的框架。

#26

user1

太简洁了。

#27

user2

和你的sample。

#28

user1

xx，我这个工作别和别人提及。

#29

user2

不会。

#30

user1

我用chatGPT这个操作也别跟别人说。

#31

user1

#32

user1

我太狗了，问了三个AI，CSDN里面新出了个inscode平台有AI接口，还有微软的new bing，和ChatGPT。

#33

user2

样本足够多就能学出来。

#34

user1

我肉眼是真看不出来。其实我这个仿真的样本，肉眼看起来和实测数据的样本挺一致的。

#35

user2

这个z就是很抽象。啊。

#36

user2

试试吧，这个试错成本。着实低。

#37

user1

。AI写的框架很初步。但是对于初学者来说，一看就会，省了很多成本。更复杂的应该AI也可写出来，就是我不会问。

#38

user2

对初步的框架但凡有一点效果。你就可以继续调优了。反正别人没人做过。你提出来就很牛逼。

#39

user1

这个工作非常新，如果效果好，真是领域内很好的工作了。

#40

user2

嗯嗯这个模式这么固定。试试。你明天就可以跑起来了。

#41

user2

有效果就行。

#42

user1

真调不出来，我得找你合作去了。

#43

user2

调优有策略。

#44

user1

在B站上看李沐视频里面有一些相关知识。有啥集成学习 boosting 啥的。

#45

user2

你这个数据不多，结构简单。迭代很快。

#46

user1

我今天构建数据集，明天应该可以跑起来了。

#47

user2

你用啥跑的。

#48

user1

笔记本。6G的3060。

#49

user2

那你图片整小点没事。这个模式又不复杂。

#50

user1

嗯嗯500*500。问AI时还是问的1000*1000，后来感觉显存不够。

#51

user2

我怕你batch太小也影响效果。

#52

user1

是的batch_size估计也就最大是2。老师已经在配电脑了，两种4090，到时候也有计算资源。

#53

user2

啥时候配齐。你申请的吗。

#54

user1

仇老师帮买了一张4090，发现dell的服务器不够宽，塞不进去。后来焦老师让我写个家用机的配置单。估计两周内能搞定吧。我前两天给的焦老师配置单。

#55

user2

神仙老师。行动迅速。

#56

user1

。。

#57

user2

我当时觉得这种一阶段的应该比传统检测有效，有点期待你明天的结果。

#58

user1

这种有点像分割，不太像检测了。label有点像mask。

#59

user2

不是检测。就是普通的回归了。

#60

user1

本质上就是用个z形折线刀去切蛋糕，500*500的样本（蛋糕）用500*1的刀去切成两半。

#61

user2

明白。我看了一遍没啥技术问题。

#62

user1

那就开干。

#63

user2

就是网络有点过于简单，不过这任务也简单，应该问题不大。

#64

user1

是的，我看李沐讲，网络的复杂度要和数据的复杂度匹配，不然就过拟合或欠拟合。

#65

user2

嗯嗯开干再说。先不想那么多。

#66

user1

冲。太尴尬了，2000个样本，6：2：2划分训练集、验证集、测试集，batch_size=3，用到adam优化器，学习率是0.001。这是过拟合吗？

#67

user2

你的loss为啥这么大。你输入之前没有归一化吗。

#68

user1

sample归一化还是label归一化？

#69

user2

对应归一化。

#70

user1

我的label是1*500的向量，每个元素的取值区间是（1：500）。

#71

user2

sample呢。

#72

user1

sample是500*500的矩阵，每个元素取值区间是（0：1）。sample本身是个相关系数图，最大值就是1。是loss这么大不科学，还是这样构建标签不科学。

#73

user2

这样构建标签不科学，同时也没有这么大的loss。你把标签除以500。

#74

user1

有道理。

#75

user2

然后用的时候，把模型输出结果乘500就行了。

#76

user1

明白，感觉会有提升。

#77

user2

用了多长时间。

#78

user1

吃饭回来就好了。不到20分钟。batch_size=3,现在采用3.8G显存。

#79

user2

你两张4090就很快了。

#80

user1

对，下次就用4。

#81

user2

可以吃饭回来看看咋样。

#82

user1

5可能会爆。我归一化、改patch_size再试一下。

#83

user2

嗯嗯。

#84

user1

感觉框架有点问题，学习率不能自适应不同的patch_size，得调，不然就nan。

#85

user1

#86

user1

label/500是不是等效MSE loss/2500。

#87

user2

参数更新的也不一样。

#88

user1

噢噢相当于学习率也有变化。

#89

user2

有效了感觉。你可视化一波。val的loss你没打印一开始的。就是训练之前的。其实也应该是从比较高降下来的。

#90

user1

噢噢明白了，就是model初始化后就验证一波。

#91

user2

嗯嗯。你把结果可视化一下。应该有效果了。

#92

user1

我写一下可视化，直接运行的，没用调试模式，没有保存变量。

#93

user2

。是。咋样xx。可视化有效果吗。

#94

user1

#95

user1

左边是训练数据，右边是验证数据。标签我还加入了预测的含义，步子迈的大了。

#96

user1

#97

user1

这个是测试数据结果。

4517902939_1

user1

你看下里面学习率策略，8，11的时候会有大幅度下降。后面学习率应该就很低了。

user2

user1

怎么感觉没起作用啊。

user2

好像没有大幅度下降。嗯嗯对。

user1

你backbone的预训练权重用的是我里面生成的好的吧？带1.3的那个标志的。

user2

对。是用的那个。

user1

那就没啥问题，可能就是需要调调参数。

user2

我看了下代码。里面根本没用8 11那个参数。。

user1

你再对一下vision和这个在学习策略代码上的差异。

user2

嗯嗯好。

#10

user1

后面可以实验直接使用coco的那个faster rcnn权重加载进去训练dota数据集，做几组实验看看。你的数据集样本有多少？尺寸是多大呢？

#11

user2

就是咱们第一次测试的时候您发的那个权重是吧。

#12

user1

对，就是那个评估37.几的。

#13

user2

#14

user2

不到3000张图。

#15

user1

尺寸这个比较重要，是和coco数据有比较大的差异的地方。图片样本也很少。

#16

user2

对 coco单卡一个epoch得一个半小时。

#17

user1

那确实需要使用coco数据集的faster-rcnn的权重来训练了。

#18

user2

这个就5分钟。

#19

user1

主要是你的数据量小了很多。coco数据集应该有19万的样本吧。不对，9万多好像。我也记不清了。

#20

user2

但是这个数据。它目标不见得会少。有40多万个目标。It contains 403,318 instances in total。

#21

user1

目标不少，但样本的辨识度太低了，学习难度就比较高。

#22

user2

是的。

#23

user1

里面有20000尺寸的，最好统计一下各个尺寸范围的比例，分析一下数据，设置一个比较好的resize 尺寸。

#24

user2

我看看它论文里给了没。

#25

user1

也可以参考参考之前开源代码里对dota数据集的超参设置。应该有不少人调过这个数据集。

#26

user2

#27

user2

还差挺多的。

#28

user2

#29

user2

#30

user2

这个好像是我们实验室啊。

#31

user1

，不慌，我们这才是实验性的跑起来，后面优化的地方还多。

#32

user2

老师那个旋转框是不是先不着急加。

#33

user1

那还不请教请教你的师兄师姐。

#34

user2

嗯嗯嗯我得问问老师是谁做的。

#35

user1

旋转框那个可以下个月上，这个月主要要把vit和swin的有效果出来。

#36

user2

嗯嗯那我最近就先着重优化这个框架。

#37

user1

是的，先把基础框架打牢。

#38

user2

好。正好下个月我就考完试了。

#39

user1

那肯定考试更重要的。

#40

user2

#41

user2

老师和您汇报下目前的情况。换swin的同学说刚开始跑的时候也是没有输出，然后改了改参数有了一点点精度。

#42

user2

#43

user1

不过现在差距还是有些大，这样吧，裸训的话把轮数加大，训24epoch看下精度。

#44

user2

我现在都是训60个。

#45

user1

之前你实验室那个打榜数据要相关的参数介绍没呢？

#46

user2

打榜的那个没要到，王老师给了一个旋转框的。是基于metection框架的。然后image scale设的是512*512。其他的就有一个numgts不一样我正在实验呢。

#47

user1

没有非旋转框的嘛？

#48

user2

王老师就帮忙找到一个旋转框的。发现上升好慢又给调回来了。因为基本上都是。50来个epoch才到最高的结果。

#49

user1

主要是要确定一下faster-rcnn模型对这个数据集的性能目前最高能做到什么地步，算法本身肯定也存在瓶颈。

#50

user2

我在博客里倒是找到一个。他的mAP@0.5也是30多。。不过博客可能参考性没那么大。

#51

user1

王老师发给你的旋转框配置是基于faster rcnn吗？

#52

user2

嗯嗯对。

#53

user1

他的baseline map是多少呢？

#54

user2

她就发了一个配置文件。然后说这个精度差的有点多。

#55

user1

，确实差的有些多。

#56

user2

我问她精度多少她给忽略了。大概60可能差不多？我看了一下dota的论文。

#57

user1

我觉得70应该差不多，毕竟sota都79了。

#58

user2

没有没有。论文上也用faster rcnn 测了。这个模型是当时最高的。也就60。

#59

user1

那差一半啊，参数配置论文上有说吗？

#60

user2

#61

user2

咱现在38，他是60。emmm给了个代码。他说是基于这个代码改的。https://github.com/msracver/Deformable-ConvNets。

#62

user1

backbone用的应该不是resnet50。

#63

user2

他用的101貌似是。

#64

user1

-H？hrnet？那我们也用101跑一个看看。

#65

user2

他还用了一个小技巧。就是说这个图不是太大吗。然后就全都裁成1024*1024的。检测完了之后。再把结果拼起来。合在原图里。

#66

user1

，骚操作。

#67

user2

#68

user2

裁还行我感觉这玩意拼不好拼呢。

#69

user1

大图变小图来检测，可以提高小目标的检测性能，应该是不太好拼接，比较麻烦。

#70

user2

对。其他的就没啥信息量了。

#71

user1

那我们暂时目标调到接近60就行了。换res101来训练。

#72

user2

那我用101试试。嗯嗯。

#73

user1

101的实现你参考vision里面的，直接拿过来应该可以用。

#74

user2

好的。

#75

user1

swin那个他之前找过我，它有加载swin的权重进去没呢？还是说直接裸训的。

#76

user2

裸训的。

#77

user2

#78

user1

那看来swin网络挺稳定的，速度咋样呢？

#79

user2

速度不知道，我问问。8分钟一个epoch。

#80

user1

#81

user2

嗯嗯这个相当小了相比coco。我说错了老师这个图的结果，他说是加载了预训练模型的。。

#82

user1

后面swin网络性能上还需要进一步优化一下。，我说呢，我记得他之前和我讲裸训一直爆炸。

#83

user2

#84

user1

我让他加载官网的swin权重进去试试。

#85

user2

嗯嗯。

#86

user1

他意思是加载了之后网络实际上还是有问题的呀？后面权重都是0的话。

#87

user2

说是到一半这样的。而且他加载的就是官网的那个模型。

#88

user1

那还行，按理说用swin应该比resnet50效果要好一点儿，让他坐后面说的实验吧，换优化器和学习策略。

#89

user2

老师他换优化器遇到点问题，我也不懂，让他找您了哈。

#90

user1

好，明天再找我看一下吧。

#91

user2

#92

user1

，还有这种问题啊。

#93

user2

#94

user1

会不会是其他人kill的命令不对，误kill了进程啊。

#95

user2

就报这种错。我们正在聊天呢。没有人kill。

#96

user1

这种错误很难说，目前mindspore版本是多少呢？

4525591374

user2

目标样本分布也太不均衡了。

user1

那意思是训练不充分是吧，pytorch上有人用faster-rcnn做过这个数据集的实验没呢？

user2

就是有的类别四万多张，有的才14张，嗯嗯，训练不充分不平衡。

user1

resnet这个backbone权重你有加载进去吗？

user2

加不加载差不多。都试了。

user1

那感觉效果也太差了，我看loss降的挺低的啊。那看来是要解决loss震荡的问题。

user2

预测结果。全都去预测11了，别的训练样本加起来都没它多。

#10

user1

这个数据集按理说应该也有人用faster-rcnn跑过。看下有没有可以参考的调参或者数据处理经验。你师兄师姐他们有跑过这个数据集吗？

#11

user2

我去问问王老师。昨天另一个同学在nwpu上跑了。

#12

user2

#13

user1

效果咋样？

#14

user2

能降到这个程度。他还没有eval。

#15

user1

为啥第一个loss这么大啊。

#16

user2

有没有可能它加载了backbone的预训练模型。然后那个模型是在传统图像数据集里训得。所以特征差距有点大。

#17

user1

不应该的，都是rgb图像，按理说不会有这么大差距。loss过于异常了，精度估计也不咋地。

#18

user2

嗯嗯也是震荡。

#19

user1

这样吧，还是跑一下coco的数据集，确保这个开源的网络可以复现coco的结果。

#20

user2

老师有没有什么快捷的，可以上传数据集的方式。

#21

user1

如果数据集没问题，网络不知道是不是后面被更新的有问题了。

#22

user2

我不想百度网盘了。

#23

user1

我同步一份数据集上传到obs上，你利用obsutil工具再同步到你的服务器上。

#24

user2

好嘞谢谢老师。

#25

user1

obs://linbert/data/coco/。我在往这个路径里上传。obsutil你会用吧？

#26

user2

我听您讲过。我再去翻翻讲义。

#27

user1

计算中心平台培训的PPT上有介绍和下载链接。

#28

user2

好的。

#29

user1

#30

user2

嗯嗯好。

#31

user1

我直接上传mindrecord的数据集和json文件，原始图片是不是不需要了？

#32

user2

嗯嗯对就可以直接训练了。

#33

user1

那就行，还有3min就能传完了。

#34

user2

#35

user1

#36

user2

这个链接不让我访问。哦哦。好的。

#37

user1

#38

user2

好老师我想起来了。我查的是val的分布。只能说明数据处理过程没问题。这个结果不一定是数据不均衡造成的了。

#39

user2

#40

user2

老师我执行了这个命令。

#41

user2

#42

user2

还报这个错误呢。

#43

user1

是不是安装错了系统的。你这个是不是Ubuntu的系统。https://support.huaweicloud.com/utiltg-obs/obs_11_0003.html。

#44

user2

是咱们的168.170.180.62服务器。哦在传了它是ubuntu但是是x86的架构。

#45

user1

咋样，传成功没呢？

#46

user2

嗯嗯传完啦。

#47

user2

#48

user1

嗯嗯，你不要改网络部分，按照官网的配置跑一下看。

#49

user2

好的。何老师打扰一下我跑完了coco数据集，loss没有下降的趋势，测试的时候也没有有效的框输出。卢致聪跑了NWPU数据集，也是一样的情况。

#50

user2

#51

user2

就是根据官网的配置做的。没有改动。对呀。啥也没改。。

#52

user1

那就是model zoo代码本身有问题了。

#53

user2

应该是了 nwpu数据集训出来的也没有输出。

#54

user1

评估那一部分的代码要好好检查检查，看算法实现上是不是有问题。

#55

user2

有没有可能从训练就出问题了。

#56

user1

coco的loss降的和官网上差不多吧？

#57

user2

那倒是不过官网上还是有下降趋势的。

#58

user1

还是重点检查评估部分的代码，从数据集输入到网络输出再到后处理过程，这个网络在coco数据集是经过很多次验证了，网络部分肯定是没啥问题的。

#59

user2

好的收到。

#60

user1

你评估的时候是单卡评估是吧。

#61

user2

对用的单卡。

#62

user1

我下午再发你一份我以前的评估代码。

#63

user2

好的好的。

#64

user1

你代码在哪台服务器上？我看一下。

#65

user2

服务器：ssh root@168.170.180.62 密码：Ascend@hpi4。/home/gfzshiwai/fasterrcnn。

#66

user1

这个事吧。

#67

user1

#68

user2

对。结果在scripts/train1里。

#69

user1

eval的执行命令发我看下，还有默认的配置文件是哪个？

#70

user2

#71

user1

。https://download.mindspore.cn/model_zoo/r1.3/fasterrcnnresnetv150_ascend_v130_coco2017_official_cv_bs2_acc60.6/。把这个ckpt下载下来。评估一下看看。

#72

user2

这是整个模型的参数吧。

#73

user1

对。训练好的。

#74

user2

#75

user1

，咋还加载不了。

#76

user2

这好像是一个80类一个81类的回归参数。这个权重文件里为什么对background还有一组回归参数呢。。

#77

user1

320是啥的维度？

#78

user2

80 x 4。

#79

user1

那把类别直接改一下试试把。

#80

user2

嗯嗯我试试。在跑了。。

#81

user2

#82

user2

有了。但是老师我有点不懂为什么还要预测背景的回归参数。

#83

user1

网络要学习除目标以外的背景信息，让网络可以分辨图片背景，用此区分正负样本。

#84

user2

这说明推理的代码也没问题。那就是把这个参数加上重新训试试？看来回归的时候也要加。

#85

user1

对，我测试了一下，网络直接输出来的，都是无效框，全是空值。后面处理应该没问题。

#86

user2

没想到加不加背景框的回归效果会差这么多。

#87

user1

他网络本身就没加吗？

#88

user2

#89

user2

对网络本身没加。这是我刚才改的。就是RCNN类的初始化。

#90

user1

#91

user1

，真无语，mindspore的人合代码之前都没检查一下。

#92

user2

新版本画蛇添足了属于是。老师那这个官方modelzoo里的代码不得改一下吗。不然大家下下来还得debug。

#93

user1

有时间提个issue给他吧。

#94

user2

嗯嗯行。谢谢老师要是我自己估计先找不着是这的问题。。

4524863919_1

user1

没问题。比他高。但他自己对比的croma就不支持光学测试。我可能只能和他比，他们的DOFA这个方法。其他的我就说加在相关工作里增加讨论吧，然后解释一下当时我们为什么最开始没想到跑这个bench。

user2

羊子。你给我发个vlm做分类的json呢。我看看

user1

好的好的，发给你了。

user2

input里面的预定类别不是这个数据集的所有类别吧。这是为啥这样设置捏。

user1

我看geochat也是这样做的。

user2

这个评价指标用的是啥。

user1

就是预测的精度。正确数目/总数。

user2

判断是否正确，比的是输出的字符是否是“airplane”。这种么。完全匹配则是预测正确？

user1

对。

#10

user2

如果达打成Airpalne的话。也算预测错误哈。

#11

user1

你这是字符的乱序还是首字母大写的意思。

#12

user2

乱序。大写感觉应该没问题。

#13

user1

乱序不算。

#14

user2

乱序的话就表示预测错了。

#15

user1

咱们在有限数据上训的，不至于会出现乱序。嗯嗯。

#16

user2

哦哦哦。

#17

user1

只会预测错类别。

#18

user2

那做grounding的话。也是判断输出的那个[]是否跟真值字符匹配。

#19

user1

我还没跑过遥感通用的那种grounding数据集，比如基于dior那个。但grounding预测的不是框吗，不需要预测字符吧。

#20

user2

对是框。那如果有多个框的话，输出的框的顺序跟真值框的顺序不一样，怎么处理啊。

#21

user1

我看他们的代码，一般是通过把框编码为文本的时候，会按照xy从小到大排序。所以实际上框是有顺序的。输入的时候就处理好了。

#22

user2

啊，检测这个任务不是给个图检测出所有对象的框嘛，输入没框啊。

#23

user1

就是输入的真值就是按顺序编码的框，所以模型计算损失，慢慢地学出来就是按顺序的。按理来说不需要后处理。

#24

user2

哦哦哦。了解。

#25

user2

ok。羊子你在所里不。

#26

user1

在忙。

#27

user2

你中午去食堂的时候，顺便把我桌子上那两个三会一课的本子去1318给下李晓宇。你去食堂吃么。

#28

user1

。我不去食堂吃！！我要做ppt。

#29

user2

好好好。那你做吧。

#30

user1

他要不着急，我下午可以送。

#31

user2

#32

user2

我问问别人。你好好做吧。

#33

user1

远程的党支书。

#34

user2

骂我呢。霍霍了高冷师弟。

#35

user1

看见了。没事把他培养成你的接班人。

#36

user2

你跟他说下，是哪个哈。

#37

user1

你俩本子。他拍照片给你。

#38

user2

羊子，你有多的论文保密纸没。

#39

user1

#40

user1

一张这个。

#41

user2

你要用这个不。

#42

user1

不用你先用吧。我到时候再去要。

#43

user2

是不是还有一张来着。那个没有是吧。

#44

user1

那张没有多的了。

#45

user2

好哦。待会聪找你拿哈。这小子又要投论文了。

#46

user1

#47

user1

放门口。桌子上了。

#48

user2

这么社恐！

#49

user1

一会儿要去接超子。

#50

user2

好好好。

4502841701

user1

点几个最有代表性的。

user2

典型的就这几个吧。。

user1

要不再来俩。

user2

再加个盘古/豆包。

user1

一个人三页。

user2

外国加个gemimi。

user1

国外的应该还有谷歌还是啥的。

user2

昂。

user1

可以。

user2

你要做那部分。

#10

user1

都行。

#11

user2

那我弄国内。

#12

user1

那我gpt+谷歌+ds？

#13

user2

可以。

#14

user1

ok。就模型，发布时间，结构，能力/任务，这个好像重点是大语言模型。

#15

user2

#16

user2

是不是太水了。噢噢噢。结构要说吗。可以。模型，发布时间，结构，能力/任务和各自优势。

#17

user1

。

#18

user2

争取20分钟搞定。10分钟吧。我觉得。

#19

user1

我还没吃完饭。

#20

user2

我搞完发你。我继续high了。不着急。

#21

user1

ok。要不直接发群里。

#22

user2

也可以。

#23

user1

这样是不是我就不用对齐模板了。哈哈哈。让超哥自己对去吧。

#24

user2

#25

user2

#26

user2

#27

user1

哈哈哈哈。感觉你的格式。比较简洁。我在干什么。我被他的模板洗脑了。

#28

user2

别把。羊。

#29

user1

你可以直接发群里让他看一下。火速师兄。那我改一下。不雕花了。

#30

user1

数据....师兄....数据................................................！

#31

user2

晚上弄弄哈。

#32

user1

可以师兄，能不能两个任务分开存，然后每个项里加上task2或者task3，然后各自划分出8:2的训练和测试。

#33

user2

OKOK没问题，我得晚上回去用电脑弄哈。

#34

user1

okok 这个detection和what之间的空格不用加。

#35

user1

#36

user1

reasoning的也是。

#37

user2

ok。

#38

user1

#39

user1

师兄，这是你处理的代码不，我自己来也行。

#40

user2

嗯嗯对的。

#41

user1

ok。

#42

user1

#43

user1

意满离。测试集的关系都存在于训练集里。

#44

user2

那还行。hahh。

#45

user1

师兄，论文的。报销银行对账单。是必须这样的吗。

#46

user1

#47

user1

不可以是支付宝界面吗。

#48

user2

不能支付宝吧。都是这种好像。

#49

user1

这种是怎么拿到的呢。

#50

user2

你论文付款，用的不是银行卡吗？用的支付宝啊？

#51

user1

是佩瑾付款的。

#52

user1

#53

user1

就是银行付款的话从银行明细里看就行了哈。

#54

user2

银行明细里应该有这个的。

#55

user1

okok。然后含INVOICE的发票翻译是不是我一键翻译就行了。他这模板也看不清。

#56

user2

我是打印下来，写几个字的。

#57

user1

懂了。thankyou！

#58

user2

在所里吗？咱部门党支部老师要看看咱们的积极分子考察表，你帮我去我抽屉里面拿一本材料，去给老师瞅一眼。

#59

user1

那我去哪儿找她。

#60

user2

卫星楼209。

#61

user1

是今天一天都可以还是现在。

#62

user2

应该是现在噶，看这意思。

#63

user1

#64

user1

就拿着两本去了。

#65

user2

嗯嗯，可以。

#66

user1

师兄，有个审稿人说需要补充实验的，我是不是评估一下，需要的话说我们会在xx部分中增加实验，还是这一周跑出来比较好啊。

#67

user2

这周跑出来，今天先把要跑的实验规划好。。

#68

user1

嗯嗯。师兄，这个geo bench也是朱晓香他们的论文。不过我看了一下，它里面包含六个分类和六个分割的任务，但是大部分都是多光谱的。只有这三个是RGB。

#69

user1

#70

user2

没事。你跑rgb的就行。本来咱们预训练就没跑多光谱的。

#71

user1

ok！那我先把实验跑了分类和分割应该还好。

#72

user2

怎么样。实验跑上了嘛。

#73

user1

嗯嗯分类的已经跑完了，在跑分割。

#74

user2

分类精度没问题吧。

#75

user1

#76

user1

#77

user2

羊子。你给我发个vlm做分类的json呢。我看看

#78

user1

好的好的，发给你了。

#79

user2

input里面的预定类别不是这个数据集的所有类别吧。这是为啥这样设置捏。

#80

user1

我看geochat也是这样做的。

#81

user2

这个评价指标用的是啥。

#82

user1

#83

user1

就是预测的精度。正确数目/总数。

#84

user2

判断是否正确，比的是输出的字符是否是“airplane”。这种么。完全匹配则是预测正确？

#85

user1

对。

4496860679

user1

https://github.com/Dao-AILab/flash-attention/issues/1103。我当时这么解决的。

user2

牛逼。下次碰到我试试。溜的挺快。

user1

哈哈哈哈哈哈哈。直接跑路了家人。你们不会。还没结束吧。先睡觉了hxd。

user2

吃吗吃吗。

user1

可吃可吃。

user2

gogogo 出发喽。

user1

不是。超哥这外放声音有点大啊。我在这都听的很清楚。

user2

有免费高质量音乐给你听。应该感恩。

user1

我还在好奇哪来的声音。

user2

今天晚上跟师兄吃饭不跟你们吃了。

#10

user1

哈哈哈哈OK。吃饭吗家人。早点吃早点睡。

#11

user2

吃！

#12

user2

#13

user2

可爱捏。

#14

user1

#15

user1

感觉很香。

#16

user2

牛逼哈哈。蕃茄味的？

#17

user1

酸辣味的。挺好吃的。

#18

user2

可以。我之前吃的原味。没味儿。别吃。

4498002041

user1

今晚吃啥呀。老哥。

user2

他们。我现在忙。到那了。到哪。

user1

吃饭钱给谁。

user2

咪咪。

user1

杨洋像我爸。哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈。

user2

哈啊哈哈哈哈哈。让羊换个眼镜。

user1

天生c位。

user2

多少年了。还穿这个黄袜子。。

user1

关灯了都。

user1

#10

user1

what happened。工作咋样呀。请夸。杨洋问你。为啥不回群里。他等着算人呢。

#11

user2

啥。噢噢噢。刚看到。

#12

user1

哎。幸福啊。想回家了都。

#13

user2

想念。

#14

user1

。今天跳舞碰到gay。比我还会扭。

#15

user2

哈哈哈哈。后面有美女。

#16

user1

美女不会跳。不知道在干嘛。神经。

#17

user2

是啊。哈哈哈哈哈哈。在欣赏自己的美貌吧。

#18

user1

#19

user2

？

#20

user1

买了十包辣条。飞旺最好吃。

#21

user2

十包够你吃？婷子。

#22

user1

别管。克制。

#23

user1

#24

user1

哇靠。真好吃。。

#25

user2

怎么不给我买点。这么自私。

#26

user1

分你一半。下次吃饭的时候带给你。

#27

user2

你不一晚上就吃完。

#28

user1

吃了六包。

#29

user2

厉害噶。多喝点水啊。

#30

user1

想回家了。下周回家。

#31

user2

可以。去吧。宝贝。

#32

user1

#33

user1

。

#34

user2

咋了。xiong'dei。

#35

user1

跳舞摔得。牛逼吧。。晕死。

#36

user2

没事吧。真吓人啊。别跳了。今晚。

#37

user1

今天不跳了。你在公司？

#38

user2

对啊。在公司。咋啦。

#39

user1

咋样。上班的。感觉。五一回家么。

#40

user2

不回。

#41

user1

，又不回。

#42

user2

没时间啊。

#43

user1

不把婺源当家了是吧。五天没时间？

#44

user2

不回了不回了。妹。啥时候回家。

#45

user1

#46

user1

4.24。

#47

user2

好哦。我朋友51去婺源。

#48

user1

你又不去。说个屁。你五一去哪哦。

#49

user2

在宿舍写论文吧。哎。

#50

user1

姐呢。

#51

user2

肥家。

#52

user1

有病？五一写啥论文。回家不能写？

#53

user2

多一篇论文找工作有优势。

#54

user1

那你还是写吧。。。。

#55

user2

是啊。写写。。我也想摆啊。

#56

user1

不生病就行。把身体熬坏白白里。服了你。。。。

#57

user2

那你多关心我‘。

#58

user1

我关心你有个der用。

#59

user2

懂了。有杨洋了。不想关心我。

#60

user1

不可能。杨洋不需要关心。他都不太写。哈哈哈哈哈哈哈哈哈哈哈。还是关心你。。

#61

user2

在拉屎。

#62

user1

去跳舞。

#63

user2

#64

user1

赞同。姐妹麻辣烫是全世界最好吃的麻辣烫。叫他去三小门口。买辣条吃。

#65

user2

你吃过欧阳家吗。你。

#66

user1

吃过。小青蛙那边么。

#67

user2

嗯嗯。

#68

user1

婺源还有我没吃过的～。

#69

user2

你在婺源呆的比我少吧。哦不对。你复读了一年。比我读藕。多。哈哈哈哈哈哈。

#70

user1

我上大学的时候。经常回家。

#71

user2

嚣张。

#72

user1

我现在有腹肌。。

#73

user2

真的假的。看看。

#74

user1

看得见么。我昨天膝盖伤了没跳今天跳的太丑了。侧面明显。

#75

user2

笑死。

#76

user1

婺源下冰雹了。

#77

user2

你睡了没。

#78

user1

还没呢。老哥。

#79

user2

待会2点帮我抢个票。我2点开会。没时间。

#80

user1

抢啥票。

#81

user2

#82

user2

6点左右到就行，优先129这趟。5.5号石家庄到北京的。

#83

user1

129不是七点到。？

#84

user2

说错了。最好是北京西站哈。你看着抢就行。待会转你钱。我先开会去了。2点开始抢。

#85

user1

知道了！

#86

user1

#87

user1

只买到这趟太惊险了。

#88

user2

好呢。我看看哈。好噶。

#89

user1

#90

user1

回家了。

#91

user2

羊也回去？

#92

user1

羊送我。

#93

user2

哦哦哦。你们两真恩爱啊。

#94

user1

还行吧。守男德罢了。你要啥生日礼物。愁死了。

#95

user2

自己想。还问我。都24岁的人了。能不能有点浪漫。

4489116092_1

user1

必须拉。你干嘛不拉窗帘。我给你炖了。

user2

我以为你故意开着。平时我都拉。李亚也搬回科电了？

user1

嗯嗯。no bb。sleep。

user2

OK。back。

user1

空调温度。调低点。

user2

已经很低了。bro。

user1

放屁。闹铃关掉。还得是。kven。

user2

你又在发什么颠。

user1

干嘛。都不让我评论了。

user2

都是基操。

#10

user1

又不关门。

#11

user2

我就在，卫生间我关闭门。我马上就回去了。

#12

user1

你。拉屎拉一小时？我回来一小时了。

#13

user2

放屁顶多20分钟。我就去超市转了。

#14

user1

我洗澡都洗完了。

#15

user2

哪有一个小时。洗澡太快了。

#16

user1

买点香蕉。

#17

user2

no。

#18

user1

#19

user1

累了。你给我带点吃的。回来。

#20

user2

我看看吧，主要去的地儿，消费可能太高了，我这个工资买不了什么东西。

#21

user1

？你不是去吃麻辣烫。

#22

user2

要不你先转我点我回来了给你带点大财。我吃完就直接走了，演出很快就开始了。

#23

user1

mad。那我点外卖。

#24

user2

Okay.

#25

user1

#26

user1

如何。

#27

user2

。

#28

user2

#29

user2

健身的顶级享受。

#30

user2

#31

user2

这个辣椒真不错。我先睡了。你早点休息。

#32

user1

牛逼。我睡会。

#33

user2

睡。海康微视。咱们实验室有人去吗。前几届。

#34

user2

#35

user1

。感觉穿牛仔裤不舒服。不穿长裤了。你知道我的衣服在哪个箱子里面么。

#36

user2

买点。

4517514626

user2

user1

吃这么好。

user2

又多了三个凉菜。

user2

又来了几个菜。

user1

。这么猛。几个人啊。

user2

6。

user1

厉害噶。吃的爽噶？

user2

还好。都不是很好吃。太咸了。有一个还是昆明大众点评。top1。

#10

user1

哈哈哈哈。太闲了。太咸了可还行。准备回来了。

#11

user2

回宿舍了ga。

#12

user1

昂。在大巴上。

#13

user2

辛苦啦宝宝。

#14

user1

到啦。我也去洗澡噶。

#15

user2

好刚刚洗好。

#16

user1

在跟许子讨论东西。

#17

user1

#18

user2

哈哈哈。逮谁都宝贝。

#19

user1

洗面奶。有什么推荐的。我不太懂。

#20

user2

我就用的freeplus。

#21

user1

好哦。爱你。

#22

user2

你不是不用洗面奶。

#23

user1

用噶。这几天长痘了。焦虑ing。

#24

user2

好呢。你多喝水晚上早点睡饮食清淡点。

#25

user1

ok。我上床了。

#26

user2

买了你之前用的珂润的泡沫洗面奶。

#27

user1

嗯嗯好像用过。哈哈哈哈。

#28

user2

你那个痘痘拍一个细节给我看看。

#29

user1

#30

user2

别摸点涂那个水杨酸凝胶。绿色小支那个。

#31

user1

我找找。

#32

user2

别摸别扣多喝水多睡觉。我给你买的维生素每天都吃。

#33

user1

好呢。我现在就吃。

#34

user2

#35

user2

猜猜。抽到哪个。

#36

user1

#37

user2

#38

user2

哈哈哈。

#39

user1

嘿嘿。还挺好玩的。咱们后面也可以逛盲盒点。

#40

user1

赶紧学习你。

#41

user2

#42

user1

这个没法集中啊你。让狗狗出去呆着。

#43

user2

okk。吃好饭啦。准备睡觉觉。

#44

user2

#45

user1

okay。okay。bro。

#46

user2

#47

user2

下午去我三大大家吃饭我三大妈手艺特别好。我爸问我要不要提前去帮忙学习学习。就摘了个菜。都搞好了。技术一点没学到。晚上得洗碗。

#48

user1

#49

user2

我三大妈。买的柴火装备。炒菜。他们的后花园结了好多果子。

#50

user1

牛逼哈。

#51

user2

芒果。菠萝蜜。这么厉害的一顿。我摘了菜。

#52

user1

哈哈哈哈哈。你也是出了一份力的。

#53

user2

肚子大大。太有生活了。

#54

user1

太舒服了。这小日子。

#55

user2

#56

user2

#57

user2

佛寺。

#58

user1

刚遛弯回来。好美。

#59

user2

#60

user1

好看的噶。

#61

user2

#62

user2

明天没有饭局了。终于。

#63

user1

哈啊哈哈哈哈哈。饭局是一种累罪吗。

#64

user2

素。

#65

user2

你想要传统的金项链还是有名牌子的项链。

#66

user1

God damn。Gold chain。

#67

user2

#68

user2

你觉得这个好看吗。

#69

user1

好看。

#70

user2

okok。

#71

user1

还是忍不住。给我透露？

#72

user2

我怕买了你不喜欢。

#73

user2

#74

user2

王嘉尔带金好看。

#75

user2

#76

user2

#77

user2

这俩对比呢。

#78

user1

感觉都不错诶。哎呀。你跟我说干嘛。无语。

#79

user2

哈哈哈哈哈哈哈哈。

#80

user1

藏不住事。

#81

user2

我怕你不喜欢。

#82

user1

包喜欢的。

#83

user2

搞得惊喜没得咯？

#84

user1

嘿嘿。我感觉还有。。

#85

user2

这么说都不能没有了嘎。你小子。坏的很。

#86

user2

到酒店啦。三亚so hot。今天好像多云。所以很闷。

#87

user2

没给我升海景呜呜呜呜。

Pipeline 可视化报告

Query 1: 讨论数据集

Query 2: 辣条

4505301654_1_1

4504660431

4524436736_1_1

4523674212_1

4523674212_1_1

4517902939_1

4525591374

4524863919_1

4502841701

4496860679

4498002041

4489116092_1

4517514626