Stability AI 在 2024 年 10 月 22 日推出 Stable Diffusion 3.5,包含多个型号变体,包括 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo,以及稍晚发布的 Stable Diffusion 3.5 Medium。
这些模型的尺寸可高度定制,可在消费级硬件上运行,并且根据宽松的Stability AI 社区许可,可免费用于商业和非商业用途。
Stability AI 在 2024 年 10 月 22 日推出 Stable Diffusion 3.5,包含多个型号变体,包括 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo,以及稍晚发布的 Stable Diffusion 3.5 Medium。
这些模型的尺寸可高度定制,可在消费级硬件上运行,并且根据宽松的Stability AI 社区许可,可免费用于商业和非商业用途。
Stable Diffusion 是一种生成人工智能模型,可以根据文本和图像提示生成独特的逼真图像。Stable Diffusion和ChatGPT、Midjourney是AIGC应用快速体验推荐的应用,也与 Meta Llama 3 一起作为开源人工智能模型的代表。
SwarmUI(以前称为 StableSwarmUI)是Stable Diffusion官方推出的一款WebUI框架,致力于易于访问、高性能和可扩展性,可以在Windows、Linux及Mac 电脑及 Docker 上运行(《AIGC应用快速体验》一文中有更多Stable Diffusion用户界面的介绍),支持Stability AI自家的图像模型SD 1.5、SDXL、SD3、Stable Cascade,以及 Black-Forest-Labs FLUX.1,Black-Forest-Labs拥有开发第一个Stable Diffusion的原始开发人员。并且,SwarmUI还支持AI 视频模型(LTX-V、Hunyuan Video、Cosmos 等),并计划在未来支持音频等。
本地部署人工智能模型,不仅通过重视和利用资源赋予个人权力,而且还培育出更加分散和民主的数字生态系统。也就是说,不仅增强了隐私和安全性,还引入了个人计算作为数字时代潜在货币的有趣概念。
Ollama是一个易用的本地语言模型运行框架,可以一键启动并运行Meta Llama 3、Microsoft Phi 3、Google Gemma 2和其他更多开源语言模型(官方模型库也是一份很棒的开源语言模型清单,和NVIDIA提供的最受欢迎的基础模型列表一样,总是汇总支持的最新模型信息),并支持自定义模型导入。Ollama旨在简化在本地硬件上运行大型语言模型的过程,支持GPU加速以提升推理性能。本文基于 Windows 11 + 64 GB + RTX 2080 Ti + Llama 3.x + Cherry Studio 实践。