照亮星星的人们 » 日志
我的AIGC技术与动画行业探索之路(9)

2023-6-2 21:05 /

---今日工作总结---
1. 部署、上线了UNet+ESRGAN，DDRB+ESRGAN的方案。
在公司里图像重建任务的效果表现很不错，论文还需要再读几遍，
然后把这几天接触到的论文读一下
- WGAN
- 推想GAN
- raGAN

看到了paranormal studio非常惊艳的neural style transfer视频，展现了近乎完美的stablization，用的方法是G mora c5和c5.5，明后天了解一下
https://www.youtube.com/shorts/sleXXoBHRHY

目前前进的方向还比较模糊，到底是AIGC还是AI辅助需要花时间思考一下。目前做的工作还是以AI辅助为主。如果是AIGC，目前比较火的方向和论文做个列表。

2. 白箱第七集
原画单元标号：标记上的B1、A4字样。这里的A和B分别代表脚和猫两个单元部分，B1代表本Cut内的B单元原画的第一张，A4则代表A单元的第四张
有意思的是，为什么会是A4和B1而不是A1和B4? 难道是猫一直保持不动而人的脚走过来？

---明日工作安排---
明天周末
(1) 了解数据情况，提出数据处理方案
(2) 根据数据集情况，寻找研究方向，提出目前能做的方案。
(3) 重读论文ESRGAN，快速过一遍WGAN，raGAN，推想GAN。

Q: sketch 2 image 如何实现的？Paired learning? 大模型应该不是这个思路吧
还有control net

某B的AIGC视觉算法岗要求
工作职责:
配合算法工程师从事基于AI的图像视频等内容生成算法开发、落地等工作。具体包括最新算法的调研实现、数据处理与模型训练、效果评估等。
工作要求:
有较强代码能力，论文理解能力，能独立快速进行算法实现；
有CV算法背景；
加分项：熟悉多模态、扩散模型等技术。

基础能力和发展方向如果忘了，可以对照着这个来学。

*所以multimodal几乎是绕不开的
https://oss.zhidx.com/uploads/2023/05/645ca67a27cfc_645ca67a2506f_645ca67a2503f_WX20230511-162517@2x.png/_zdx?a
https://oss.zhidx.com/uploads/2023/05/64649768d6e21_64649768d41d0_64649768d419a_%E7%99%BE%E4%B8%87.jpg/_zdx?a
https://zhidx.com/p/377284.html

某公司的视觉算法专家(AIGC方向)
岗位要求:
1、计算机、数学等相关专业博士，具有扎实的计算机视觉或机器学习算法基础，在相关方向知名国际会议发表过论文
2、熟悉VAE,GAN,Stable Diffusion等基础生成模型
3、熟悉CLIP,ERNIE-ViL等transformer跨模态模型
4、熟练使用主流LLM并了解其原理
5、对稿定的业务场景有浓厚兴趣

能不能手写一下SD？或者深入了解一下LoRA？之前被面试官问的时候挂在了基本的数学细节上，还是需要仔细研究一下。

以及视野培养--产品经理
工作职责:
1. 负责AIGC创作工具的产品设计工作，管理产品需求并协调开发测试资源；
2. 为工具的体验，转化，和业务结果负责，能持续规划并找到切入点；
3. 跟踪市场趋势，分析前沿及友商产品间的差异性，以确定产品策略，提升产品核心竞争力；
4. 收集用户反馈，分析用户行为并挖掘用户需求
工作要求:
1. 本科及以上学历，5年以上工具类产品经验，有AI类经验优先；
2. 极强的自驱力，对新技术的好奇心，有一定的国际视野，国际化背景/经验为佳；
3. 对用户产品理解深刻，具备较强的产品规划能力，产品和运营上能有独立的判断力；
4. 良好的沟通协调能力, 项目管理能力，执行力强，具有优秀的团队合作精神、创新精神；
5. 热爱 B 站文化，有创作经验优先；

嗓子有点干疼，不会要阳了吧……

Tags: 我的AIGC技术与动画行业探索之路

照亮星星的人们 » 日志我的AIGC技术与动画行业探索之路(9)

照亮星星的人们 » 日志
我的AIGC技术与动画行业探索之路(9)