在RAD Studio中内置了令人惊叹的解决方案吗?让我们知道.寻找折扣?访问我们的特别优惠第页!
德尔福FireMonkey公司生产力Windows(窗口)

如何使用Delphi的Dreambooth?

dreamboothpc(梦引导hpc)

如果你是一名开发人员,你很可能听说过Dreambooth。但它是什么?你如何利用它为自己谋利?

Dreambooth是一个可以让你微调现有生成人工智能模型的模型,比如稳定扩散这样,它可以用来围绕主题在图像中生成定制的艺术品,您可以使用这些艺术品微调模型。换言之,它允许您使用自己的照片训练模型,以便您可以使用提示根据微调模型的照片创建艺术品。

让我们来看看如何在Delphi中利用Dreambooth在您自己的项目中。

什么是Dreambooth?

Dreambooth是一种独特的深度学习模式,在人群中脱颖而出。Dreambooth的目的是利用现有的文本到图像模型,并通过微调技术进一步增强它们。文本到图像人工智能生成的艺术是一种令人印象深刻的新形式的数字艺术,它是在基于文本的人工智能和计算机的帮助下创建的。人工智能生成的文字到图像艺术由计算机算法创建,它接受用户的文字输入,然后生成视觉艺术品来表示文字。 

通过使用自然语言处理和机器学习,这些算法可以创建反映文本的惊人视觉效果——从抽象图形到超现实图像。技术仍在发展,但人工智能生成的文字到图像艺术为艺术家和设计师提供了一种令人兴奋的新方式,以创造性的方式将文字和视觉效果结合在一起。

 

什么是稳定扩散?

生成性文本到图像艺术是一种艺术形式,其中使用计算机程序从文本生成图像。有许多不同的解决方案可用于实现这一点,包括稳定扩散、DALL-E和Midtrivel。它使用人工智能和自然语言处理技术,根据用户提供的文本输入创建图像。生成性文本到图像艺术在2022年和2023年变得越来越流行,因为它允许对不同视觉风格进行更具创造性的表达和探索。 

Stable Diffusion本身是一个革命性的深度学习文本到图像模型,旨在将您最疯狂的想象力带到生活中。凭借先进的语言技术和人工智能功能,用户可以在几分钟内从任何文本提示中创建令人惊叹的视觉效果。从补漆和脱漆到生成图像到图像的转换,稳定扩散是一种帮助您探索更多可能性的方法!

阅读关于稳定扩散的完整博客文章。

如何在Delphi中使用Dreambooth?

有许多不同的API提供程序,您可以通过简单的API运行Dreambooth。使用Delphi的TRESTClient,连接到他们的API并用Dreambooth训练自己的模型非常简单。在这篇博客文章中,我们将讨论如何在Replicate.com上实现这一点。Replicate的Dreambooth API可以在这里找到https://replicate.com/replicate/dreambooth/api他们也有一个博客帖子这更详细地解释了这一点。他们的API甚至支持国际货币基金组织使用您创建的微调Dreambooth模型。Img2img是一种方法,在该方法中,除了创建新图像时的文本提示外,您还可以提供自己的图像作为模型要遵循的种子或源。

在撰写本文时,基于StableDiffusion1.5或2.1微调定制模型大约需要2.50美元。这也需要大约20-25分钟。一旦对模型进行了训练,您就可以使用微调模型生成新图像,每张图像大约需要10秒。在撰写本文时,每幅图像的生成成本不到一美分。

其他Dreambooth API提供商也有类似的定价,但也可能提供批量定价。

Dreambooth Windows客户端

我应该在本地运行Dreambooth还是通过API?

Stable Diffusion和Dreambooth对GPU和VRAM的要求非常高。稳定扩散通常需要具有至少8GB VRAM的GPU,而Dreambooth可能需要24GB或VRAM。这些是一些繁重的硬件要求,如果您没有这样的硬件,那么使用API是一个简单的选择。

如何使用Delphi内置的Dreambooth桌面客户端?

这个Dreambooth桌面客户端随附指导,指导您完成整个过程。您首先需要的是来自Replicate.com的API密钥。您可以使用Github帐户登录到他们的站点。获得API密钥后,可以将其放置在客户端的“配置”选项卡上。

第1步,第2步

在步骤#1和步骤#2中,客户端允许您选择包含JPEG图像的ZIP文件并将其上传到Replicate。如果您已经有了一个包含您想在其他地方使用的图像的ZIP,您可以跳过此步骤,只需输入ZIP文件的URL即可。Replicate.com只接受JPEG图像,它会自动将其裁剪为512×512,并将512×212放在图像中检测到的任何人脸的中心。

步骤#3

在步骤#3中,您可以提供要创建的新模型的名称。它的格式为username/modelname,例如fmxexpress/mymodel。

步骤#4

在步骤#4中,一旦完成https://dreambooth-api-experital.replicate.com/v1/训练API端点可以与您上传的ZIP的URL一起使用,以微调Dreambooth模型。训练大约需要20分钟。

步骤#5

在步骤#5中,您可以使用verify按钮检查模型是否已完成生成。

训练完模型后,可以转到Generation选项卡,开始使用新的微调模型生成txt2img图像。在这一步中,您将希望在文本提示符中使用“cjw”作为关键字,以便将主题从微调渲染到生成的图像中。例如,你可以写“cjw的照片”。

准备好开始使用Dreambooth、Stable Diffusion和Delphi生成微调艺术了吗?

使用Delphi和API,Dreambooth可以很容易地合并到您的管道中。有很多方法可以使用Dreambooth,但最重要的是开始并享受乐趣。通过一点练习,您将能够使用Stable Diffusion创作出令人惊叹的、经过微调的艺术。那你还在等什么?立即开始使用Delphi!

下载一个用Delphi构建的开源Dreambooth Desktop Client。

Embarcadero还在Delphi reddit上举办数字粉丝艺术和AI粉丝艺术比赛。您可以创建图像并将其提交到德尔福reddit有资格获得奖品。了解有关Delphi Fan艺术竞赛.


使用RAD Studio、Delphi或C++Builder缩短开发时间并更快地推向市场。
设计。代码。编译。部署。
开始免费试用   立即升级

   免费Delphi社区版   免费C++Builder社区版

关于作者

FMXExpress.com有600多篇文章,提供了有关Android、IOS、OSX、Windows和Linux上Delphi FireMonkey的各种提示和技巧。

留下回复

该网站使用Akismet来减少垃圾邮件。了解如何处理您的评论数据.

在文章中