前言
Stable Diffusion 是一个开源的深度学习文本到图像生成模型,能够根据提供的文本描述生成相应的图像,是生成对抗网络(GANs)和扩散模型(Diffusion Models)研究领域的重要进展之一。
简单理解为,输入一段文本内容,Stable Diffusion 能够更快速地生成图像。
Stable Diffusion 可以在消费级硬件上运行,降低了对高端计算资源的需求。
所有的AI设计工具,安装包、模型和插件,都已经整理好了,👇获取~
WebUI
Stable Diffusion WebUI,提供了用户友好的图形界面,旨在简化使用 Stable Diffusion 模型进行图像生成的过程。在界面上调整诸如采样步骤(sampling steps)、引导强度(guidance scale)、种子(seed)等参数,这些都可以显著影响最终生成的图像质量与风格。
除了从文本生成图像外,WebUI 还支持“图像到图像”功能,这允许用户上传现有图像并对其进行风格转换或修改。
下面是提取自 Stable Diffusion WebUI 的安装过程。
安装
在带有 NVidia-GPU 的 Windows 10/11 上使用发布包安装
- 从v1.0.0-pre下载
sd.webui.zip
并解压其内容。 - 运行
update.bat
。 - 运行
run.bat
。
更多详情请参见在NVidia-GPU上安装和运行
在 Windows 上自动安装
- 安装Python 3.10.6(更新版本的 Python 不支持 torch),并勾选“将 Python 添加到 PATH”。
- 安装git。
- 下载 stable-diffusion-webui 仓库,例如通过运行
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
。 - 以普通用户身份(非管理员)从 Windows 资源管理器中运行
webui-user.bat
。
在 Linux 上自动安装
- 安装依赖项:
# 基于 Debian 的系统:``sudo apt install wget git python3 python3-venv libgl1 libglib2.0-0``# 基于 Red Hat 的系统:``sudo dnf install wget git python3 gperftools-libs libglvnd-glx``# 基于 openSUSE 的系统:``sudo zypper install wget git python3 libtcmalloc4 libglvnd``# 基于 Arch 的系统:``sudo pacman -S wget git python3
如果您的系统非常新,则需要安装 python3.11 或 python3.10:
# Ubuntu 24.04``sudo add-apt-repository ppa:deadsnakes/ppa``sudo apt update``sudo apt install python3.11`` ``# Manjaro/Arch``sudo pacman -S yay``yay -S python311 # 不要与 python3.11 包混淆`` ``# 仅针对 3.11``# 然后在启动脚本中设置环境变量``export python_cmd="python3.11"``# 或者在 webui-user.sh 中``python_cmd="python3.11"
- 导航到您希望安装 webui 的目录,并执行以下命令:
wget -q https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh
或者直接克隆仓库到任何您想要的位置:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
- 运行
webui.sh
。 - 检查
webui-user.sh
以获取选项。
什么是提示词
了解提示词的构成、规则,可以生成更加准确的、稳定的图像。例如摄像头、人身比例、画面饱和度等等。
对于文本输入的内容,有着严格的规则,这导致了普通用户无法充分的参与其中。
多数情况下,建议配合 ChatGPT 使用。下面是一些示例:
|
角度
|
提示词示例
|
说明
|
| — | — | — |
| 摄像头视角 | Aerialshotfroma drone at dawn,capturing the mist rising over a serene lake
|
使用无人机在黎明时分拍摄,捕捉到晨雾从宁静湖面上升的画面
|
|
| Wide-angle lensforan immersive underwater scenewithcoral reefsandmarine life
|
广角镜头用于沉浸式水下场景,展示珊瑚礁和海洋生物
|
|
| Macroclose-up of a dew-covered spider webinmorning light,showing intricate details
|
微距特写清晨阳光下的露珠蜘蛛网,展现细节
|
| 艺术风格 | InfluencedbyImpressionism,usingloose brushstrokesandvibrant colors to depict a garden
|
受印象派影响,运用松散笔触和鲜艳色彩描绘花园
|
|
| Renaissance-inspired compositionwithbalanced symmetryandclassical proportions
|
文艺复兴风格的作品,强调对称平衡和经典比例
|
|
| Surrealisticelements integratedintoa realistic setting,creating dreamlike imagery
|
将超现实元素融入真实场景,创造梦幻般的图像
|
| 人像特性 | Portraitof a confident businesswoman,sharp focus on eyeswithsoft lighting
|
自信的职业女性肖像,眼睛聚焦清晰,柔和照明
|
|
| Elderlymanwithweathered hands,highlighting his life experiences through textures
|
经历风霜的老者手部特写,通过纹理突出其生活经历
|
|
| Dynamicpose of a dancer mid-leap,capturing motionandgracewithhigh-speed shutter
|
舞者跳跃瞬间的动态姿态,使用高速快门捕捉动作与优雅
|
| 尺寸和比例 | Aspectratio of21:9,optimizedforcinematic wide-screen displays
|
21:9纵横比,适合电影宽屏显示
|
|
| Squareformat(1:1),idealforInstagrampostsorsocial media profiles
|
正方形格式(1:1),适合Instagram帖子或社交媒体个人资料图片
|
|
| Panoramiclandscape orientation,suitableforlarge-scale wall artormurals
|
横向全景格式,适合大型墙面艺术品或壁画
|
| 色彩理论 | Colorpalette inspiredbynature's autumn hues, warm oranges and deep browns dominate
|
受自然秋色启发的颜色调色板,暖橙色和深棕色为主
|
|
| Monochromaticschemewithvarying shades of blue,evoking calmnessandtranquility
|
单色调方案,不同深浅的蓝色,营造平静和安宁的感觉
|
|
| Highcontrast blackandwhite,emphasizing formandtexture over color
|
高对比度黑白,强调形式和质感而非颜色
|
| 构图原则 | Ruleof thirds applied to compose adynamiccityscapewithleading lines directing attention
|
应用三分法构图原则,使用引导线吸引注意力于城市景观
|
|
| Symmetricalbalance around a central axis,creating harmonyandstability
|
围绕中心轴的对称平衡,创造和谐与稳定感
|
|
| Framingwithin the frame technique,usingnatural elements to frame the main subject
|
在画面内框选技术,利用自然元素框选主要主题
|
| 光照条件 | Goldenhour lighting,softandwarm,castinglongshadows that add depth
|
黄金时段光线,温暖柔和,投射长影增添深度
|
|
| Harshsunlight during midday,creating stark contrastsandhighlights
|
中午强烈日光,形成鲜明对比和高光
|
|
| Twilightambiance,cool tonesanddiffused lightfora mysterious atmosphere
|
黄昏氛围,冷色调和散射光营造神秘气氛
|
当然,也可以使用在线提供的提示词服务,下面是一些在线的提示词网站:
- IMI Prompt: Midjourney Prompt Generator v5
- OPS 提示词工作室 | 可视化编辑提示词 | 一键翻译 AIGC 提示词 | Midjourney 提示词 | OpenPromptStudio made by Moonvy 月维
什么是模型
Stable Diffusion 是一种深度学习模型,特别设计用于生成高质量的图像。它基于扩散模型(Diffusion Model)的概念,这是一种生成式模型,通过逐步添加噪声到数据中,然后学习逆转这个过程来去除噪声,从而生成新的样本。
Stable Diffusion 模型旨在优化这一过程,使其更稳定、更有效,并且能够产生更加逼真和多样化的图像。
下面是一些在线的模型网站:
- 首页 · 魔搭社区
- Models – Hugging Face
文生图示例
下面的图片,都使用了 Stable Diffusion WebUI 制作。因制作时间较早,无法与现阶段的图像成果相比较。
为了帮助大家更好地掌握 ComfyUI,我在去年花了几个月的时间,撰写并录制了一套ComfyUI的基础教程,共六篇。这套教程详细介绍了选择ComfyUI的理由、其优缺点、下载安装方法、模型与插件的安装、工作流节点和底层逻辑详解、遮罩修改重绘/Inpenting模块以及SDXL工作流手把手搭建。
由于篇幅原因,本文精选几个章节,详细版点击下方卡片免费领取
一、ComfyUI配置指南
- 报错指南
- 环境配置
- 脚本更新
- 后记
- …
二、ComfyUI基础入门
- 软件安装篇
- 插件安装篇
- …
三、 ComfyUI工作流节点/底层逻辑详解
- ComfyUI 基础概念理解
- Stable diffusion 工作原理
- 工作流底层逻辑
- 必备插件补全
- …
四、ComfyUI节点技巧进阶/多模型串联
- 节点进阶详解
- 提词技巧精通
- 多模型节点串联
- …
五、ComfyUI遮罩修改重绘/Inpenting模块详解
六、ComfyUI超实用SDXL工作流手把手搭建
- Refined模型
- SDXL风格化提示词
- SDXL工作流搭建
- …
由于篇幅原因,本文精选几个章节,详细版点击下方卡片免费领取
评论(0)