AIGC应用快速体验

AI Generated Content（AIGC）是指通过人工智能模型创建数字内容，例如图像、音乐和自然语言，被认为是继UGC、PGC之后的新型内容生产方式，AI编程、AI绘画、AI写作等都属于AIGC的分支。AIGC 的目标是使内容创建过程更加高效和易于访问，从而能够以更快的速度制作高质量的内容。AIGC是通过从人类提供的指令中提取和理解意图信息，并根据其知识和意图信息生成内容来实现的。

aigc-app-quick-start

以下通过ChatGPT、Stable Diffusion和Midjourney三个广受关注的人工智能模型，快速体验AI编程和AI绘画的乐趣。题图背景是Midjourney绘制的一只猫。

本文带您体验ChatGPT、Stable Diffusion和Midjourney，但目前还有更多正在关注的主要人工智能模型。另外，您在体验以下应用之前，也许应该了解一些先进服务之路以保证能够接近这些应用。

使用ChatGPT编程

注册并登录ChatGPT网页版，就可以在输入框中输入提示进行编程（或者其他文字对话）。

ChatGPT

对于不喜欢网页版的用户，还可以使用第三方的桌面应用程序或者移动APP。

ChatGPT 桌面应用程序：macOS、Linux & Windows，by lencx。实际上是用Tauri打包的官方网站，需要ChatGPT账号。

ChatGPT 桌面应用程序

OpenCat：macOS/iOS，by Zhenlu Zou。需要自备 OpenAI API Key。

AMA - Your AI helping hand：Andriod，by Deng Gao。需要自备 OpenAI API Key。

AMA - Your AI helping hand

基于 OpenAI API搭建的网页版：AI EDU：国内直接可用的ChatGPT镜像体验网站，可分配共享的API Key，还提供APP；Freegpt.one：另一个类似的实现。ChatKit：支持语音和URL。第三方网页版可能不保证持续服务。

GPT4All Chat 是一个本地运行的人工智能聊天应用程序，以 GPT-J 作为基本模型，并搭配基于 Qt 的跨平台 GUI，可跨平台（Linux、Windows、MacOSX）安装，支持在消费级 CPU 上本地运行，目前已支持17款模型（7B和13B参数，文件大小3GB - 8GB）。这是目前最简单的GPT使用方式。

适用于 Slack 的 ChatGPT 应用程序：类似于 Midjourney 运行在 Discord 服务器的模式（参看本文后面的 Midjourney 部分）。同为团队聊天应用程序，与Discord初始定位游戏工具不同， Slack 全力投入业务，称自己为“数字总部”。2023 年 3 月 7 日，Salesforce 和 OpenAI 推出了适用于 Slack 的 ChatGPT 应用程序，目前处于测试阶段。

ChatGPT作品：用python编程一个商品管理系统。

class Product:
    def __init__(self, name, price, quantity):
        self.name = name
        self.price = price
        self.quantity = quantity
class ProductManager:
    def __init__(self):
        self.products = []
    def add_product(self, product):
        self.products.append(product)
    def find_product(self, name):
        for p in self.products:
            if p.name == name:
                return p
        return None
    def remove_product(self, name):
        for p in self.products:
            if p.name == name:
                self.products.remove(p)
                return True
        return False
    def display_products(self):
        print("Product\tPrice\tQuantity")
        for p in self.products:
            print(f"{p.name}\t{p.price}\t{p.quantity}")
pm = ProductManager()
while True:
    print("1. Add product")
    print("2. Find product")
    print("3. Remove product")
    print("4. Display all products")
    print("5. Exit")
    choice = int(input("Enter your choice: "))
    if choice == 1:
        name = input("Enter product name: ")
        price = float(input("Enter product price: "))
        quantity = int(input("Enter product quantity: "))
        pm.add_product(Product(name, price, quantity))
        print("Product added successfully!")
    elif choice == 2:
        name = input("Enter product name: ")
        p = pm.find_product(name)
        if p:
            print(f"Product found - {p.name}, Price: {p.price}, Quantity: {p.quantity}")
        else:
            print("Product not found!")
    elif choice == 3:
        name = input("Enter product name: ")
        if pm.remove_product(name):
            print("Product removed successfully!")
        else:
            print("Product not found!")
    elif choice == 4:
        pm.display_products()
    elif choice == 5:
        print("Exiting program...")
        break
    else:
        print("Invalid choice. Please try again.")

返回一个基本的商品管理系统的Python代码，其中包括添加商品、查找商品、删除商品和显示所有商品的功能。

运行结果：

使用Stable Diffusion绘画

注册并登录Stable Diffusion的DreamStudio在线平台网页版，就可以在输入框中输入提示进行绘画。

Stable Diffusion DreamStudio

这是以默认提示（Prompt）“A dream of a distant galaxy, concept art, matte painting, HQ, 4k”生成的四张图片。

所有新用户都将获得 100 个免费的 DreamStudio 积分，足以创建 500 个标准图像。这是您首次创建帐户时的一次性奖金，不会补充。在默认设置下，每张图片 0.2 个信用点数。根据您选择的图像分辨率和步数，消耗积分会有所不同。下面是一张详细的图表来解释：

使用Stable Diffusion的途径非常多：

云平台：DreamStudio……
WebUI：AUTOMATIC1111、SwarmUI、Comfy UI、SD.Next（Vladmandic）、Google Colab……
安装软件：Easy Diffusion……
第三方试用网站：Stable Diffusion Online、Hugging Face……

Stable Diffusion WebUI

AUTOMATIC1111

Stability 提供名为 DreamStudio 的在线图像生成服务，其开源版本名为 StableStudio（这个项目似乎已经被搁置）。第三方开源用户界面包括最受欢迎的并提供额外功能的AUTOMATIC1111 Stable Diffusion Web UI，旨在减少用户所需提示量的Fooocus，和具有基于节点的用户界面的ComfyUI、SD.Next（Vladmandic）等。特别推荐在 UI、稳定性、可用性和实用性方面都有整体改进的 SwarmUI。

Stability Matrix 是一款免费的开源桌面应用程序，可简化安装和更新Stable Diffusion WebUI，并且不需要系统全局安装 Python、Git、CUDA 等。

SwarmUI

SwarmUI（以前称为 StableSwarmUI）是Stable Diffusion官方推出的一款WebUI框架，可以在Windows、Linux及Mac 电脑上运行。

Google Colab

在Google Colab的这篇笔记（stable_diffusion.ipynb）介绍了Stable Diffusion的基础实现、深度调整以及相应的理论知识，全部运行（Ctrl+F9）可以检视实现过程。Google Colab为程序运行免费提供内存、硬盘和宝贵的GPU运行时。

stable_diffusion.ipynb

您可以将prompt = "a photograph of an astronaut riding a horse"以下的代码单元格删除，并在自己的云端硬盘中保存一个副本。每次使用的时候，只需要执行一次全部运行（Ctrl+F9），然后修改prompt = ""的引号部分，再执行当前代码单元格就可以快速获得另一张图片。

按照Google Colab笔记的示范，您还可以在本地搭建Jupyter Notebook环境并安装Stable Diffusion，当然如果安装运行成功的话，还需考验您的显卡性能。

Easy Diffusion

Easy Diffusion提供在您自己的计算机上一键安装和使用 Stable Diffusion，无需依赖项或技术知识，启动成功后在浏览器中使用，默认Prompt是a photograph of an astronaut riding a horse。

Easy Diffusion

系统要求：

Windows 10/11、Linux 或 Mac。
NVIDIA 显卡，最好具有 4GB 或更多 VRAM 或 M1 或 M2 Mac。但是，如果您没有兼容的显卡，您仍然可以通过“使用 CPU ”设置来使用它。它会很慢，但它应该仍然有效。
8GB 内存和 20GB 磁盘空间。

在四核Intel Core2 Quad Q9650 @ 3.00GHz + 2G*4 DDR2 + 亮机显卡环境中生成以上骑马的宇航员图片需要 36 分钟，而在六核AMD Ryzen 5 5600G @ 3.9GHz + 16G×2 DDR4 + 核心显卡环境中生成这张狗的图片只需要 5 分钟。
，

从实测来看，Easy Diffusion 提供一键安装，无需技术知识和预装软件，快速入门AI图像创作，较差的硬件上更容易运行；Automatic1111 同样适合初学者，处于中间位置；SwarmUI 则可以提供处理更苛刻任务所需的灵活性和效率，为最终用户提供了更大的控制权。

Stable Diffusion Online：使用最近发布的Stable Diffusion模型在线创建图像，免费试用最基本功能。

Stable Diffusion作品：四川民居

使用Midjourney绘画

忘记Midjourney、Disco Diffusion和DALL-E 2、Imagen了吗？

当然没有。和Stable Diffusion一样，这些都是以文本描述生成图像的人工智能模型，也很流行。

Théâtre D’opéra Spatial获得2022 Colorado State Fair, First Place Fine Arts，署名Jason M. Allen via Midjourney。

其中，Midjourney的热度就非常高，使用者可通过Discord的机器人指令进行操作。

Discord是一个聊天软件，最先针对网络游戏玩家和Reddit社群，后扩展到教育和商业应用，用户加入或创建社区服务器后开始群体聊天。Discord支持在服务器中应用机器人，Midjourney就是利用这种机制在Discord社区服务器中启用Midjourney Bot。也就是说，Midjourney没有独立的应用，它运行在Discord服务器当中，就像小程序和微信的关系。

Midjourney

在Midjourney注册好帐号以后，您需要前往Discord的Midjourney服务器，注册Discord账号并使用独立的Discord APP或者网页版登录。

在Midjourney服务器中选择任意的 #Newbies-xxx 新手测试频道（房间）进入，可以看到其他用户发送的 Prompt，以及生成的图片。这是新手学习使用Midjourney命令、提示和参数的试验场，得益于Discord的社区调性，您会粘在这里——你的工作是与所有人共享的，最初困扰你的东西很快会成为灵感和知识的来源。

在输入框中输入 /i 就可以选择 /imagine prompt，在后面输入提示内容按 Enter 发送命令来生成图片。

Discord Midjourney Bot

Midjourney一次生成四张图片，你可以从4张图中选择一张来U（Upscale，放大像素并提升细节），或者V（Variation，基于所选图片来延伸变形），1~4代表着左上到右下的4张照片。用户的选择实际上是一种强行的数据标注过程，得益于一大拨具有美学背景的专业用户标注，Midjourney如今在美学表现上一骑绝尘。

在放大像素并提升细节之后，会出现一组新的按钮。

Make Variations：在此基础上，再生成4个变体。
Light Upscale Redo：创建一个 1024px x 1024px 的图像并添加适量的细节和纹理。
Beta Upscale Redo：创建一个 2048px x 2048px 的图像，而不添加额外的细节。

如果您觉得公开频道（房间）信息太多、刷新太快，还可以新建服务器并启用Midjourney Bot，从而拥有自己的vMidjourney。当然在Discord更可以语音聊天、视频聊天、共享屏幕或者直播，Xbox Live用户对此不会陌生。

最后，分享一个vMidjourney、可以直接使用中文的 Niji AI Discord 频道，以及一个中文的MidJourney资源懒人包。

Midjourney作品：一只猫

a cat via Midjourney

本地部署还是云服务？

虽然基于GPT-3.5架构的ChatGPT和Stable Diffusion都是开源模型，但在本地部署有一定的硬件资源和编程技术门槛，因此您也可以付费以继续使用“开箱即用”的官方云服务。

ChatGPT Plus：USD $20 / month
Stable Diffusion：1,000 credits / USD $10
Midjourney：USD $8 / month

特别是绘画（生成图像）需要更多的计算资源（CPU、RAM & GPU），无论采取本地部署还是云服务，您都将准备付出更高的成本。也就是说，如果您不订阅官方或者Google Colab等第三方云计算服务，那就得准备自己的高算力计算机——GPU 一直是大多数 AI 工作负载的主力，物理硬件昂贵，应该把目光转向云端GPU。

特别提醒：如果一个模型提供尺寸不同的多个版本，那么除了参数最高的原始版本，其他各种蒸馏小模型的性能是大打折扣的，不论它们如何优化以使得模型能够在消费级硬件上高效运行。参数越小的模型准确率往往越低，这是选择本地部署需要知道的事实。

算力的基础知识可参考《Jetson Nano 2GB 开发套件活动手玩》一文中的“算力单位”小节；《人工智能超算中心的高性能处理芯片》介绍了NVIDIA A100/H100和AMD MI100/MI250等目前的顶级显卡，当然体验用户及入门者仍旧可以使用游戏卡。
“摄影穷三代，单反毁一生”是历来摄影圈的调侃，而训练和使用图像人工智能模型基本都要求GPU，似乎永远跳不出“器材党”的圈子，因而出现了许多面向AIGC的GPU租用服务。

晋级

另外，当这些工具准备妥当以后，如何把想象力变成现实（如提示技巧）和遵守规则（如避免NSFW内容），正是您接下来需要学习的内容。以下是三个提示管理资源。

官方文档：

综合学习指南，内容全面，并跟踪模型动态：

lablab.ai，一个人工智能技术和教程的创客社区
The Ultimate GPT-4 Guide，包含 GPT3 和 GPT4 的 100 多种资源
ChatGPT学习手册，持续关注ChatGPT
MidJourney资源懒人包，一个主题群组

学习资源：

Awesome AIGC Tutorials收集各种生成式 AI 的教程，涵盖大型语言模型、AI 绘画和相关领域。
Awesome ChatGPT，收集 ChatGPT 各种资源的GitHub仓库。
通往AGI之路，一个AI学习路径的飞书知识库。

评价和动态

ChatGPT是最成熟的AI聊天应用。

GPT-4：OpenAI 的最新版本 GPT-4是迄今为止来自 ChatGPT 和 Dall-E 背后最强大和令人印象深刻的 AI 模型。微软研究院在一篇论文中对早期GPT-4的测试表明，GPT-4的智能标志着计算机科学领域及其他领域的真正范式转变。尽管是纯粹的语言模型，这个早期版本的GPT-4在各种领域和任务上表现出显著的能力，包括抽象、理解、视觉、编码、数学、医学、法律、对人类动机和情感的理解等等。
ChatGPT plugins：推出插件功能，赋予ChatGPT使用工具、联网、运行计算的能力，可与5000+个应用交互。

Stable Diffusion是稀缺的开源模型。

开源社区致力于优化模型效率和完善模型文档，实现技术民主化。
在风格变化的多样性上具有优势，但获得想要的图片效果较难以尝试。

Midjourney进入大众市场。

Midjourney是面向创意行业的灵感激发及效率工具，并有舒适的质量和速度体验。
最突出的成果是独特的科幻艺术风格概念图，随着Midjourney v5面世，可以生成具有写实风格的图片。
得益于Discord的开放社区调性，创建了艺术共创社群。
Midjourney Bot降低了用户使用门槛，

附：人工智能快速应用入门

了解人工智能大模型，如OpenAI GPT、Meta Llama；
试用人工智能工具，如ChatGPT（问答）、Stable Diffusion（图像）；
使用简化本地部署和运行大型语言模型的工具，如Ollama；
掌握人工智能对话客户端，如Cherry Studio、LobeChat；
使用提示词编写和优化资源，如PromptHero。

👍

酷玛DS

酷玛DS