7. 专业README中文文档
1. 项目简介
Augmentor是一个用于机器学习的Python图像增强库,旨在成为一个独立于平台和框架的库,提供更精细的控制和最真实世界相关的增强技术。
2. 快速开始
安装
pip install Augmentor
# 或升级现有版本
pip install Augmentor --upgrade
基本用法
import Augmentor
p = Augmentor.Pipeline("/path/to/images")
p.rotate(probability=0.7, max_left_rotation=10, max_right_rotation=10)
p.zoom(probability=0.5, min_factor=1.1, max_factor=1.5)
p.sample(10000) # 生成10000张增强图像
3. 核心功能
弹性变形
使用弹性变形技术,可以从单张图像生成许多真实可行且保留标签的图像。
透视变换
提供12种不同类型的透视变换,包括倾斜、旋转等。
保持尺寸的旋转和剪切
旋转和剪切操作默认保持原始图像的文件尺寸。
随机擦除
随机擦除技术可用于训练对遮挡具有鲁棒性的模型。
4. 高级功能
多线程处理
p.sample(100, multi_threaded=True) # 默认启用多线程
真值数据增强
p = Augmentor.Pipeline("/path/to/images")
p.ground_truth("/path/to/ground_truth_images") # 添加真值数据目录
p.rotate(probability=1, max_left_rotation=5, max_right_rotation=5)
p.sample(50)
Keras和PyTorch集成
# Keras生成器
g = p.keras_generator(batch_size=128)
images, labels = next(g)
# PyTorch转换
transforms = torchvision.transforms.Compose([
p.torch_transform(),
torchvision.transforms.ToTensor(),
])