论文地址:https://arxiv.org/pdf/2401.00908.pdf
项目地址:https://docs.google.com/document/d/1irisz6f1G4oYaKojqwuU9rSDBV1-VaCh0VkeuIX0sfs/edit?pli=1
2023年,我们看到了扩散模型推理速度方面的一些重大理论改进,例如Song等人的原始一致性模型论文,以及最近的LCM。(另外,对抗扩散蒸馏。)我们已经开始看到使用这些想法的项目,例如Dan Wood的Art Spew(每秒77512×512图像,在单个4090上)、Modal的Turbo.art(基于SDXL Turbo) 和fal.ai的30fps脸部交换。
此外,为了增加直播的专业度,这场直播设置了9个以上机位,动用了斯坦尼康、纵横滑轨、电影机、导播台等电影级别的专业设备,花费或许不到传闻中的百万级,但也不会太少,是名副其实的钞能力直播。
机器学习能够建立起一些原本不存在的关联,而其中的一些关联让人感到非常惊喜。