2024-2-29 15:46 /
今日工作总结

1. 运行代码前最后做一遍数据检查,解决昨天发现的两个bugs
(1) 解决“ghost frames”的问题,核对文件目录,发现能观测到的基本是path coding问题,数量不算多,按忽视处理
(2) 采样观测clip cut错误的情况,错误发生率处于可以接受的范围。按忽视处理

2. 在更大的尺度上测试LLM效果,同时继续优化prompt推理速度,对prompt进行调优。偶然在175B的大模型上测试,发现prompt和输入已经没有问题了,之所以输出不够令人满意,是单纯因为模型不够大导致的... 这个真没辙了,明天把这个事情定下来