AIGC应用快速体验

人工智能 2023-03-25 869 次浏览 0 条评论 次点赞

AI Generated Content(AIGC)是指通过人工智能模型创建数字内容,例如图像、音乐和自然语言,被认为是继UGC、PGC之后的新型内容生产方式,AI编程、AI绘画、AI写作等都属于AIGC的分支。AIGC 的目标是使内容创建过程更加高效和易于访问,从而能够以更快的速度制作高质量的内容。AIGC是通过从人类提供的指令中提取和理解意图信息,并根据其知识和意图信息生成内容来实现的。

aigc-app-quick-start

以下通过ChatGPT、Stable Diffusion和Midjourney三个广受关注的人工智能模型,快速体验AI编程和AI绘画的乐趣。题图背景是Midjourney绘制的一只猫。

本文带您体验ChatGPT、Stable Diffusion和Midjourney,但目前还有更多正在关注的主要人工智能模型。另外,您在体验以下应用之前,也许应该了解一些先进服务之路以保证能够接近这些应用。

使用ChatGPT编程


注册并登录ChatGPT网页版,就可以在输入框中输入提示进行编程(或者其他文字对话)。

ChatGPT

对于不喜欢网页版的用户,还可以使用第三方的桌面应用程序或者移动APP。

ChatGPT 桌面应用程序:macOS、Linux & Windows,by lencx。实际上是用Tauri打包的官方网站,需要ChatGPT账号。

ChatGPT 桌面应用程序

OpenCat:macOS/iOS,by Zhenlu Zou。需要自备 OpenAI API Key

dd00bbfe-610b-4228-b471-ac0645b44089.jpg

AMA - Your AI helping hand:Andriod,by Deng Gao。需要自备 OpenAI API Key

AMA - Your AI helping hand

基于 OpenAI API搭建的网页版AI EDU:国内直接可用的ChatGPT镜像体验网站,可分配共享的API Key,还提供APPFreegpt.one:另一个类似的实现。ChatKit:支持语音和URL。第三方网页版可能不保证持续服务。

GPT4All Chat

GPT4All Chat 是一个本地运行的人工智能聊天应用程序,以 GPT-J 作为基本模型,并搭配基于 Qt 的跨平台 GUI,可跨平台(Linux、Windows、MacOSX)安装,支持在消费级 CPU 上本地运行,目前已支持17款模型(7B和13B参数,文件大小3GB - 8GB)。这是目前最简单的GPT使用方式。

适用于 Slack 的 ChatGPT 应用程序:类似于 Midjourney 运行在 Discord 服务器的模式(参看本文后面的 Midjourney 部分)。同为团队聊天应用程序,与Discord初始定位游戏工具不同, Slack 全力投入业务,称自己为“数字总部”。2023 年 3 月 7 日,Salesforce 和 OpenAI 推出了适用于 Slack 的 ChatGPT 应用程序,目前处于测试阶段

ChatGPT作品:用python编程一个商品管理系统。

class Product:
    def __init__(self, name, price, quantity):
        self.name = name
        self.price = price
        self.quantity = quantity
class ProductManager:
    def __init__(self):
        self.products = []
    def add_product(self, product):
        self.products.append(product)
    def find_product(self, name):
        for p in self.products:
            if p.name == name:
                return p
        return None
    def remove_product(self, name):
        for p in self.products:
            if p.name == name:
                self.products.remove(p)
                return True
        return False
    def display_products(self):
        print("Product\tPrice\tQuantity")
        for p in self.products:
            print(f"{p.name}\t{p.price}\t{p.quantity}")
pm = ProductManager()
while True:
    print("1. Add product")
    print("2. Find product")
    print("3. Remove product")
    print("4. Display all products")
    print("5. Exit")
    choice = int(input("Enter your choice: "))
    if choice == 1:
        name = input("Enter product name: ")
        price = float(input("Enter product price: "))
        quantity = int(input("Enter product quantity: "))
        pm.add_product(Product(name, price, quantity))
        print("Product added successfully!")
    elif choice == 2:
        name = input("Enter product name: ")
        p = pm.find_product(name)
        if p:
            print(f"Product found - {p.name}, Price: {p.price}, Quantity: {p.quantity}")
        else:
            print("Product not found!")
    elif choice == 3:
        name = input("Enter product name: ")
        if pm.remove_product(name):
            print("Product removed successfully!")
        else:
            print("Product not found!")
    elif choice == 4:
        pm.display_products()
    elif choice == 5:
        print("Exiting program...")
        break
    else:
        print("Invalid choice. Please try again.")

返回一个基本的商品管理系统的Python代码,其中包括添加商品、查找商品、删除商品和显示所有商品的功能。

运行结果:

20230328181738.png


使用Stable Diffusion绘画


注册并登录Stable Diffusion的DreamStudio在线平台网页版,就可以在输入框中输入提示进行绘画。

Stable Diffusion DreamStudio

这是以默认提示(Prompt)“A dream of a distant galaxy, concept art, matte painting, HQ, 4k”生成的四张图片。

所有新用户都将获得 100 个免费的 DreamStudio 积分,足以创建 500 个标准图像。这是您首次创建帐户时的一次性奖金,不会补充。在默认设置下,每张图片 0.2 个信用点数。根据您选择的图像分辨率和步数,消耗积分会有所不同。下面是一张详细的图表来解释:

DreamStudio Credits

使用Stable Diffusion的途径非常多:

  • 云平台:DreamStudio……
  • WebUI:AUTOMATIC1111、SwarmUI、Comfy UI、SD.Next(Vladmandic)、Google Colab……
  • 安装软件:Easy Diffusion……
  • 第三方试用网站:Stable Diffusion Online、Hugging Face……

Stable Diffusion WebUI

AUTOMATIC1111

Stability 提供名为 DreamStudio 的在线图像生成服务,其开源版本名为 StableStudio(这个项目似乎已经被搁置)。第三方开源用户界面包括最受欢迎的并提供额外功能的AUTOMATIC1111 Stable Diffusion Web UI,旨在减少用户所需提示量的Fooocus,和具有基于节点的用户界面的ComfyUISD.Next(Vladmandic)等。特别推荐在 UI、稳定性、可用性和实用性方面都有整体改进的 SwarmUI

39d22e9d-3d69-46a0-9b9c-be2f87818240.jpg

Stability Matrix 是一款免费的开源桌面应用程序,可简化安装和更新Stable Diffusion WebUI,并且不需要系统全局安装 Python、Git、CUDA 等。

SwarmUI

swarmui.jpg

SwarmUI(以前称为 StableSwarmUI)是Stable Diffusion官方推出的一款WebUI框架,可以在Windows、Linux及Mac 电脑上运行。

Google Colab

在Google Colab的这篇笔记(stable_diffusion.ipynb)介绍了Stable Diffusion的基础实现、深度调整以及相应的理论知识,全部运行(Ctrl+F9)可以检视实现过程。Google Colab为程序运行免费提供内存、硬盘和宝贵的GPU运行时。

stable_diffusion.ipynb

您可以将prompt = "a photograph of an astronaut riding a horse"以下的代码单元格删除,并在自己的云端硬盘中保存一个副本。每次使用的时候,只需要执行一次全部运行(Ctrl+F9),然后修改prompt = ""的引号部分,再执行当前代码单元格就可以快速获得另一张图片。

按照Google Colab笔记的示范,您还可以在本地搭建Jupyter Notebook环境并安装Stable Diffusion,当然如果安装运行成功的话,还需考验您的显卡性能。

Easy Diffusion

Easy Diffusion提供在您自己的计算机上一键安装和使用 Stable Diffusion,无需依赖项或技术知识,启动成功后在浏览器中使用,默认Prompt是a photograph of an astronaut riding a horse

Easy Diffusion

Easy Diffusion

系统要求:

  • Windows 10/11、Linux 或 Mac。
  • NVIDIA 显卡,最好具有 4GB 或更多 VRAM 或 M1 或 M2 Mac。但是,如果您没有兼容的显卡,您仍然可以通过“使用 CPU ”设置来使用它。它会很慢,但它应该仍然有效。
  • 8GB 内存和 20GB 磁盘空间。

2023-07-07-172316.jpg

在四核Intel Core2 Quad Q9650 @ 3.00GHz + 2G*4 DDR2 + 亮机显卡环境中生成以上骑马的宇航员图片需要 36 分钟,而在六核AMD Ryzen 5 5600G @ 3.9GHz + 16G×2 DDR4 + 核心显卡环境中生成这张狗的图片只需要 5 分钟。

从实测来看,Easy Diffusion 提供一键安装,无需技术知识和预装软件,快速入门AI图像创作,较差的硬件上更容易运行;Automatic1111 同样适合初学者,处于中间位置;SwarmUI 则可以提供处理更苛刻任务所需的灵活性和效率,为最终用户提供了更大的控制权。

Stable Diffusion Online:使用最近发布的Stable Diffusion模型在线创建图像,免费试用最基本功能。

Stable Diffusion作品:四川民居

4081162956.jpg


使用Midjourney绘画


忘记Midjourney、Disco Diffusion和DALL-E 2、Imagen了吗?

当然没有。和Stable Diffusion一样,这些都是以文本描述生成图像的人工智能模型,也很流行。

Colorado State Fair, First Place Fine Arts
Théâtre D’opéra Spatial获得2022 Colorado State Fair, First Place Fine Arts,署名Jason M. Allen via Midjourney。

其中,Midjourney的热度就非常高,使用者可通过Discord的机器人指令进行操作。

Discord是一个聊天软件,最先针对网络游戏玩家和Reddit社群,后扩展到教育和商业应用,用户加入或创建社区服务器后开始群体聊天。Discord支持在服务器中应用机器人,Midjourney就是利用这种机制在Discord社区服务器中启用Midjourney Bot。也就是说,Midjourney没有独立的应用,它运行在Discord服务器当中,就像小程序和微信的关系。

Midjourney

Midjourney注册好帐号以后,您需要前往Discord的Midjourney服务器,注册Discord账号并使用独立的Discord APP或者网页版登录。

20230326091651.jpg

在Midjourney服务器中选择任意的 #Newbies-xxx 新手测试频道(房间)进入,可以看到其他用户发送的 Prompt,以及生成的图片。这是新手学习使用Midjourney命令提示参数的试验场,得益于Discord的社区调性,您会粘在这里——你的工作是与所有人共享的,最初困扰你的东西很快会成为灵感和知识的来源。

在输入框中输入 /i 就可以选择 /imagine prompt,在后面输入提示内容按 Enter 发送命令来生成图片。

Discord Midjourney Bot

Midjourney一次生成四张图片,你可以从4张图中选择一张来U(Upscale,放大像素并提升细节),或者V(Variation,基于所选图片来延伸变形),1~4代表着左上到右下的4张照片。用户的选择实际上是一种强行的数据标注过程,得益于一大拨具有美学背景的专业用户标注,Midjourney如今在美学表现上一骑绝尘。

20230326111455.jpg

在放大像素并提升细节之后,会出现一组新的按钮。

  • Make Variations:在此基础上,再生成4个变体。
  • Light Upscale Redo:创建一个 1024px x 1024px 的图像并添加适量的细节和纹理。
  • Beta Upscale Redo:创建一个 2048px x 2048px 的图像,而不添加额外的细节。

如果您觉得公开频道(房间)信息太多、刷新太快,还可以新建服务器并启用Midjourney Bot,从而拥有自己的vMidjourney。当然在Discord更可以语音聊天、视频聊天、共享屏幕或者直播,Xbox Live用户对此不会陌生。

最后,分享一个vMidjourney、可以直接使用中文的 Niji AI Discord 频道,以及一个中文的MidJourney资源懒人包

Midjourney作品:一只猫

a cat via Midjourney


本地部署还是云服务?


虽然基于GPT-3.5架构的ChatGPT和Stable Diffusion都是开源模型,但在本地部署有一定的硬件资源和编程技术门槛,因此您也可以付费以继续使用“开箱即用”的官方云服务。

  • ChatGPT Plus:USD $20 / month
  • Stable Diffusion:1,000 credits / USD $10
  • Midjourney:USD $8 / month

特别是绘画(生成图像)需要更多的计算资源(CPU、RAM & GPU),无论采取本地部署还是云服务,您都将准备付出更高的成本。也就是说,如果您不订阅官方或者Google Colab等第三方云计算服务,那就得准备自己的高算力计算机——GPU 一直是大多数 AI 工作负载的主力,物理硬件昂贵,应该把目光转向云端GPU。

算力的基础知识可参考《Jetson Nano 2GB 开发套件活动手玩》一文中的“算力单位”小节;《人工智能超算中心的高性能处理芯片》介绍了NVIDIA A100/H100和AMD MI100/MI250等目前的顶级显卡,当然体验用户及入门者仍旧可以使用游戏卡。

“摄影穷三代,单反毁一生”是历来摄影圈的调侃,而训练和使用图像人工智能模型基本都要求GPU,似乎永远跳不出“器材党”的圈子,因而出现了许多面向AIGC的GPU租用服务。

晋级


另外,当这些工具准备妥当以后,如何把想象力变成现实(如提示技巧)和遵守规则(如避免NSFW内容),正是您接下来需要学习的内容。以下是三个提示管理资源。

官方文档:

综合学习指南,内容全面,并跟踪模型动态:

资源:


评价和动态


ChatGPT是最成熟的AI聊天应用。

  • GPT-4:OpenAI 的最新版本 GPT-4是迄今为止来自 ChatGPT 和 Dall-E 背后最强大和令人印象深刻的 AI 模型。微软研究院在一篇论文中对早期GPT-4的测试表明,GPT-4的智能标志着计算机科学领域及其他领域的真正范式转变。尽管是纯粹的语言模型,这个早期版本的GPT-4在各种领域和任务上表现出显著的能力,包括抽象、理解、视觉、编码、数学、医学、法律、对人类动机和情感的理解等等。
  • ChatGPT plugins:推出插件功能,赋予ChatGPT使用工具、联网、运行计算的能力,可与5000+个应用交互。

Stable Diffusion是稀缺的开源模型。

  • 开源社区致力于优化模型效率和完善模型文档,实现技术民主化。
  • 在风格变化的多样性上具有优势,但获得想要的图片效果较难以尝试。

Midjourney进入大众市场。

  • Midjourney是面向创意行业的灵感激发及效率工具,并有舒适的质量和速度体验。
  • 最突出的成果是独特的科幻艺术风格概念图,随着Midjourney v5面世,可以生成具有写实风格的图片。
  • 得益于Discord的开放社区调性,创建了艺术共创社群。
  • Midjourney Bot降低了用户使用门槛,
👍

本文由 cds 整理发布,参考 CC-BY-SA 3.0 协议共享,欢迎转载、引用或改编。
感谢您的支持,以共同推动STEM公益教育!

楼主残忍的关闭了评论