2023-12-3 16:18 /
今日工作总结

1. 阅读论文两篇
(1) Fast End-to-End Trainable Guided Filter
这是4天前在【AI动画技术研究】日志更新(183)中提到的未读完的那篇文章,Learning to Cartoonize Using White-box Cartoon Representations论文的surface representation使用的Guilded Filter技术就来源于此,在那篇文章里,GF提供了一个较为平滑的图像效果以实现对anime风格的还原。

这篇文章是经典视觉image processing中的filter概念在DL路径下的延伸,能够去噪、去马赛克、去模糊、抠图、美化图片等等。Learning to Cartoonize Using White-box Cartoon Representations中用到这个技术我猜很有可能一个原因是作者觉得传统滤波器不好用,所以过来找DL的filter做cartoon风格的平滑。属于可有可无的技术快餐。

这篇文章写的比较糟糕,不是很喜欢。

(2) Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for
Character Animation

5天前,28号发的论文,一作是Alibaba的研究团队。


和第一篇糟糕的文章不同,这篇的技术路线虽然总给我一种既视感,但是文章写作方面的思路值得学习。有inaginary conversation, "so what?"以及详略得当的技术细节cover。是值得学习写作的好文章。

做了这样一件事:在输入一张ref+一系列pose的情况下合成具有time-consistency的sequence输出。利用了spacial-attenion, cross-attention和temporal attention。

这一篇没有完全读完,temporal attention是AnimateDiff的内容,明天需要阅读。