今天回顾过去,创业公司 Stability AI 去年 8 月开源文本图像生成模型 Stable Diffusion 代表着一个重要时刻,它推动了图像生成模型的创新,这一过程至今还在持续。尤其是最近 ControlNet 的出现让 Stable Diffusion 在能力上领先于竞争的模型 Midjourney 和 DALL-E。 现在,大语言模型也迎来它们的 Stable Diffusion 时刻。ChatGPT 使用的 GPT-3 大语言模型在构建和运营上比图像生成模型更昂贵。GPT-3 由 OpenAI 构建和控制,没有开源,即使能获得 GPT-3 模型你也无法在商用级硬件如英伟达的 A100 GPU 上运行。但 Facebook 的 LLaMA 模型改变了这一切,你甚至可以在一台 MacBook 电脑上运行 LLaMA。
https://simonwillison.net/2023/Mar/11/llama/