pokemon-blip-captions：用于训练宝可梦文本到图像模型的数据集

提示工程技术（Prompt Engineering Techniques）

来源: | 作者:DE.Tech | 发布时间: 2024-04-29 | 1399 次浏览 | 🔊 点击朗读正文 ❚❚ ▶ | 分享到:

pokemon-blip-captions：用于训练宝可梦文本到图像模型的数据集

在人工智能领域，将文本描述转换为图像的生成模型是一个激动人心的研究方向。lambdalabs/pokemon-blip-captions数据集为此提供了一个独特的资源，它包含了宝可梦图像的BLIP生成的标题。这个数据集是用于训练文本到图像模型的，特别是针对宝可梦这一流行主题。

关键技术元素：

BLIP生成的标题：使用预训练的BLIP模型为宝可梦图像生成的标题。
Few Shot Pokémon数据集：原始图像来源于FastGAN论文中介绍的Few Shot Pokémon数据集。
图像和文本：数据集为每行提供了image和text键，其中image是不同大小的PIL jpeg图像，而text是相应的文本标题。
训练集划分：目前仅提供了训练集划分。

数据集描述：

数据集摘要：包含宝可梦图像和相应的BLIP生成标题，用于训练文本到图像的模型。
数据集结构：数据集中的每个实例都包含图像和文本字段，图像为PIL jpeg格式，文本为对应的标题。

示例：

数据集包含多样化的宝可梦描述，例如“一个画有绿色宝可梦和红色眼睛的图画”、“一个绿色和黄色的玩具，有一个红鼻子”、“一个红色和白色的球，脸上带着愤怒的表情”。

引用信息：

如果您使用此数据集，请按照以下格式引用：

@misc{pinkney2022pokemon,        author = {Pinkney, Justin N. M.},
        title = {Pokemon BLIP captions},
        year={2022},
        howpublished = {url{https://huggingface.co/datasets/lambdalabs/pokemon-blip-captions/}}
}