Stable Diffusion是重要的AI图像生成模型,它的发布标志着AI文本图像生成技术的日益普及和易用。 最近,有人用这个模型来训练真人照片,生成的结果非常假,很难区分是人工智能生成的还是真人拍摄的。 如果你对此感兴趣免费建网站程序,这篇文章将教你如何从头开始完善一个人类人工智能网站。 本教程分为5个目录,帮助您学习构建本地化的Midjourney(稳定扩散)
1. 搭建自己的AI网站
2. 模型下载安装
3. 汉化插件下载安装
4. 生成模拟真人图片
4.1 生成模拟真人图片
4.2 不同风格图片生成
4.3 动画视频生成
5. 生成的图片开口说话
01:建立自己的人工智能网站
第一步,我们可以直接使用GitHub仓库:
stable-diffusion-webui
第一步在你的笔记本上安装python环境,版本3.10.6,如果你已经安装了其他python版本,可以使用conda
安装3.10的虚拟环境版本:
conda create -n novelai python==3.10.6
下载仓库代码:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
安装对应GPU版本的Pytorch,打开网址:
https://pytorch.org/get-started/locally/
复制对应的命令。
进入刚刚创建的novelai虚拟环境文件夹
执行命令行:
./python -m pip install torch torchvision torchaudio --extra-index-url https://download
环境安装成功,测试pytorch版本是否可以正确运行
进入下载的Github仓库的代码文件夹,安装第三方依赖:
python -m pip install -r requirements.txt
02:下载并安装模型
有了网站,还需要下载相应的AI模型。 已经有同学在网站上分享了用大量图片训练的模型,比如:
这个网站叫“C站”,里面有很多意想不到的模特
网站上可以找到很多预训练的模型,找到一个生成真实图片的模型:ChilloutMix。 从网页下载相应的模型后,将模型放在您的项目目录中:models/Stable-diffusion。
03:中文插件下载及安装
stable-diffusion-webui 这个UI后端框架项目也支持第三方插件,我们可以下载对应的中文插件。 下载链接:
https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN
登录里面的网站后,可以下载插件的安装包:
然后解压文件并将其放入扩展目录中:
解压后需要重启网页:
在扩展中,检查插件:
在“设置”选项中,找到zh_CN,最后需要重启网页才能生效:
04:生成模拟现实生活图片
启动主程序“launch.py”,稍等片刻,命令行中会出现一个Local URL。 将此链接复制到浏览器即可访问。
打开URL,有时模型可能无法更新或加载。 因此需要多次尝试、多次重启。 您需要选择刚刚下载的模型:ChilloutMix。
这样前期需要做的工作就部署好了免费建网站程序,接下来我就详细教大家如何生成自己想要的图片。
4.1 生成模拟现实生活图片
在上面提到的网站上,很多网友借助promt生成了很多图片,我们可以直接参考。 找一张好看的图片,复制下面的提示语:
其中,提示词放在提示词框中,否定提示词放在相应的框中。 同时调整相应的参数,最后就可以生成真实的图片了:
4.2 不同风格图片的生成
在互联网上,有许多 Lora 模型可供下载。 这是一个可以帮助你调整画风的小模型。 主要用在提示中。 例如我们可以在网站上下载Lora原版模型:
下载完成后,将模型放在models/Lora路径下:
按照图中步骤操作,选择型号后,会在框中听到具体提示:
这里添加步骤4.1中的提示词,生成原神风格的图片:
4.3 动画视频生成
首先,你需要安装插件**“deforum”**,这个插件可以根据多张生成的图片构造一个视频动画。
https://github.com/deforum-art/deforum-for-automatic1111-webui
在当前stable-diffusion目录下执行以下命令,你会发现extensions中多了新的插件:
git clone https://github.com/deforum-art/deforum-for-automatic1111-webui extens
同时,重新启动新网页,你会发现导航中多了一个defforum选项:
可以先进行简单的生成。 提示词上,已经默认填写了句子:
{
"0": "tiny cute swamp bunny, highly detailed, intricate, ultra hd, sharp photo, crepuscular rays, in focus, by tomasz alen kopera",
"30": "anthropomorphic clean cat, surrounded by fractals, epic angle and pose, symmetrical, 3d, depth of field, ruan jia and fenghua zhong",
"60": "a beautiful coconut --neg photo, realistic",
"90": "a beautiful durian, trending on Artstation"
}
生成的视频如下:
提示词模板解释如下:
//Abstracted Example
{
"0": "Prompt A --neg NegPompt"
"12": "Prompt B"
}
其中“0”和“12”表示注册中解析的关键帧。 提示A和B为正向提示,NegPrompt为负向提示。 当然,你也可以直接使用之前C站下载的模型,
生成真人表演
05:生成的图片说话
我们已经获得了之前生成的图片,我们可以利用这张图片来制作我们自己的AI对话视频。 打开网址:,选择刚才生成的图片,然后输入你想说的话,就会生成:
最终,你可以获得更真实的实时AI对话视频。
稳定的扩散工作