大专学网站开发,邢台网站建设报价多少钱,c 网站开发需要学什么,网站缩略图尺寸今天给大家介绍一种自动化生成时尚图像数据的方法Prompt2Fashion。 首先创建了一组描述#xff0c;比如“适合婚礼的休闲风格服装”#xff0c;然后用这些描述来指导计算机生成图像。具体来说#xff0c;他们使用了大型语言模型来写出这些服装的描述#xff0c;接着将这些描…今天给大家介绍一种自动化生成时尚图像数据的方法Prompt2Fashion。 首先创建了一组描述比如“适合婚礼的休闲风格服装”然后用这些描述来指导计算机生成图像。具体来说他们使用了大型语言模型来写出这些服装的描述接着将这些描述输入到另一个模型中生成出实际的服装图像。为了确保这些图像看起来好看且合适研究人员还请了一些人来检查这些图像确保它们符合时尚的标准。因此该方法可以快速有效地创造出符合不同场合和风格需求的时尚图像。 相关链接
论文地址http://arxiv.org/abs/2409.06442v1
项目地址https://github.com/georgiarg/Prompt2Fashion
论文阅读 Prompt2Fashion自动生成的时尚数据集
摘要
人工智能 (AI) 与时尚的结合正在通过增强创造力、个性化和效率来彻底改变行业。从设计服装到预测趋势人工智能正成为时装设计师、零售商和营销人员不可或缺的工具。然而将人工智能融入时尚面临着重大挑战特别是在评估人工智能生成的内容方面这通常需要领域专业知识来确保相关性、风格和吸引力。
在这项工作中我们展示了一个自动生成的时尚图像数据集专注于个性化。该数据集涵盖了各种要求包括性别、体型、场合和风格以及它们的组合。通过利用大型语言模型 (LLM) 的功能以及扩散模型我们提供了一种可扩展的时尚图像生成解决方案。我们的方法消除了设计最终服装时需要人工干预甚至扩散模型的条件提示的需要。
LLM 和扩散模型促进了生产的可扩展性确保可以高效生成各种时尚图像。语言生成中的 LLM 以及图像生成中的扩散模型提供的质量保证由人类评估员验证。此验证过程反映了潜在消费者如何看待这些 AI 生成的服装确保内容不仅在技术上精湛而且还与当前的时尚趋势和消费者偏好产生共鸣。
鉴于人工智能正在创意领域取得重大进展人类监督对生成内容的监管至关重要。毕竟时尚图像合成框架最终是为该领域的专家例如时装设计师设计的。这些人工智能生成的图像很可能是创意过程的初步步骤而不是最终产品。因此人工智能生成的时尚内容必须由具有领域专业知识的个人进行评估。为此在这项工作中我们不仅为创意人员和工程师提供了一个开放的、自动生成的数据集而且还强调了让专家参与评估过程的重要性这不仅基于上述概念还基于实验结果。
方法 本研究采用了大型语言模型LLMs和扩散模型Diffusion Model相结合的方法生成时尚图像。首先通过构建包含“风格、场合、性别”或“风格、场合、类型”的变量三元组形成定制的提示模板。然后这些提示被输入到LLMs中如Mistral-7B和Falcon-7B生成对应的服装描述。这些描述随后被用作扩散模型的输入以生成最终的时尚图像。在实验中研究者们创建了2000个样本每个样本包含LLM输出的描述、原始三元组以及扩散模型生成的图像。为了确保生成的图像质量研究者们还通过人类评估者进行评审确保生成的时尚内容不仅在技术上可行同时符合当前时尚趋势。
实验 由Stable Diffusion生成的图像用5种不同的方法生成描述 由 Stable Diffusion 生成的描述和图像其中的描述由 2 个不同的 LLM 生成用于零样本学习、小样本学习和思维链左栏为 Falcon-7B 模型右栏为 Mistral-7B 模型。 由 Stable Diffusion 生成的描述和图像以及由 2 个不同的 LLM 为 RAG 生成的带有 PDF 的描述 并以 BLOG 作为来源左栏为 Falcon-7B 模型右栏为 Mistral-7B 模型。
图像评价 描述评价 结论
本研究提出了一种生成由 2,000 张图像和描述组成的综合时尚数据集的新方法。通过利用 LLM 和扩散模型我们创建了适合各种场合、风格和体型的多样化时尚内容集合。我们的评估表明生成的图像和描述既相关又美观。虽然非专家的反馈证实了它们的吸引力但专家评估对于确保高标准的时尚质量和适销性至关重要。因此未来的工作将侧重于结合专家评级以进一步完善数据集并增强其实用性。总体而言该数据集代表了人工智能驱动的时装设计的重大进步为行业进一步研究和应用提供了宝贵的资源。
未来工作 目前正在创建 Hugging Face 数据集以便研究人员和开发人员更轻松地访问和使用 Prompt2Fashion 数据集。Hugging Face 上的数据集将包括图像、其相应的描述和元数据从而实现与机器学习框架和工具的无缝集成。 为了进一步帮助用户浏览和使用 Prompt2Fashion 数据集我们还将提供 Excel 指南。该指南将结合描述和图像提供一种便捷的方式来探索数据集。Excel 文件中的每个条目将包括 生成的图像。 相关描述。 元数据例如使用的模型Mistral 或 Falcon、风格类别和评估分数如适用。