2023-6-2 21:05 /
---今日工作总结---
1. 部署、上线了UNet+ESRGAN,DDRB+ESRGAN的方案。
在公司里图像重建任务的效果表现很不错,论文还需要再读几遍,
然后把这几天接触到的论文读一下
- WGAN
- 推想GAN
- raGAN

看到了paranormal studio非常惊艳的neural style transfer视频,展现了近乎完美的stablization,用的方法是G mora c5和c5.5,明后天了解一下
https://www.youtube.com/shorts/sleXXoBHRHY

目前前进的方向还比较模糊,到底是AIGC还是AI辅助需要花时间思考一下。目前做的工作还是以AI辅助为主。如果是AIGC,目前比较火的方向和论文做个列表。

2. 白箱第七集
原画单元标号:标记上的B1、A4字样。这里的A和B分别代表脚和猫两个单元部分,B1代表本Cut内的B单元原画的第一张,A4则代表A单元的第四张
有意思的是,为什么会是A4和B1而不是A1和B4? 难道是猫一直保持不动而人的脚走过来?

---明日工作安排---
明天周末
(1) 了解数据情况,提出数据处理方案
(2) 根据数据集情况,寻找研究方向,提出目前能做的方案。
(3) 重读论文ESRGAN,快速过一遍WGAN,raGAN,推想GAN。

Q: sketch 2 image 如何实现的?Paired learning? 大模型应该不是这个思路吧
还有control net

某B的AIGC视觉算法岗要求
工作职责:
配合算法工程师从事基于AI的图像视频等内容生成算法开发、落地等工作。具体包括最新算法的调研实现、数据处理与模型训练、效果评估等。
工作要求:
有较强代码能力,论文理解能力,能独立快速进行算法实现;
有CV算法背景;
加分项:熟悉多模态、扩散模型等技术。

基础能力和发展方向如果忘了,可以对照着这个来学。

*所以multimodal几乎是绕不开的
https://oss.zhidx.com/uploads/2023/05/645ca67a27cfc_645ca67a2506f_645ca67a2503f_WX20230511-162517@2x.png/_zdx?a
https://oss.zhidx.com/uploads/2023/05/64649768d6e21_64649768d41d0_64649768d419a_%E7%99%BE%E4%B8%87.jpg/_zdx?a
https://zhidx.com/p/377284.html

某公司的视觉算法专家(AIGC方向)
岗位要求:
1、计算机、数学等相关专业博士,具有扎实的计算机视觉或机器学习算法基础,在相关方向知名国际会议发表过论文
2、熟悉VAE,GAN,Stable Diffusion等基础生成模型
3、熟悉CLIP,ERNIE-ViL等transformer跨模态模型
4、熟练使用主流LLM并了解其原理
5、对稿定的业务场景有浓厚兴趣

能不能手写一下SD?或者深入了解一下LoRA?之前被面试官问的时候挂在了基本的数学细节上,还是需要仔细研究一下。

以及视野培养--产品经理
工作职责:
1. 负责AIGC创作工具的产品设计工作,管理产品需求并协调开发测试资源;
2. 为工具的体验,转化,和业务结果负责,能持续规划并找到切入点;
3. 跟踪市场趋势,分析前沿及友商产品间的差异性,以确定产品策略,提升产品核心竞争力;
4. 收集用户反馈,分析用户行为并挖掘用户需求
工作要求:
1. 本科及以上学历,5年以上工具类产品经验,有AI类经验优先;
2. 极强的自驱力,对新技术的好奇心,有一定的国际视野,国际化背景/经验为佳;
3. 对用户产品理解深刻,具备较强的产品规划能力,产品和运营上能有独立的判断力;
4. 良好的沟通协调能力, 项目管理能力,执行力强,具有优秀的团队合作精神、创新精神;
5. 热爱 B 站文化,有创作经验优先;

嗓子有点干疼,不会要阳了吧……