AutoTrain 文档
目标检测
并获取增强文档体验
开始使用
目标检测是一种监督式学习形式,其中模型被训练来识别和分类图像中的物体。AutoTrain 简化了此过程,让你只需上传带标签的示例图片,就可以训练一个最先进的目标检测模型。
为了确保你的目标检测模型得到有效的训练,请遵循以下准备数据的准则
Archive.zip ├── 0001.png ├── 0002.png ├── 0003.png ├── . ├── . ├── . └── metadata.jsonl
metadata.jsonl 的示例
metadata.jsonl
{"file_name": "0001.png", "objects": {"bbox": [[302.0, 109.0, 73.0, 52.0]], "category": [0]}} {"file_name": "0002.png", "objects": {"bbox": [[810.0, 100.0, 57.0, 28.0]], "category": [1]}} {"file_name": "0003.png", "objects": {"bbox": [[160.0, 31.0, 248.0, 616.0], [741.0, 68.0, 202.0, 401.0]], "category": [2, 2]}}
请注意,边界框必须采用 COCO 格式 [x, y, width, height]。
[x, y, width, height]
格式:确保所有图像均采用 JPEG、JPG 或 PNG 格式。
数量:至少包含 5 张图像,为模型提供足够的学习范例。
独占性:zip 文件应仅包含图像和 metadata.jsonl。不得包含任何其他文件或嵌套文件夹。
需要谨记的一些要点
当 decompress train.zip 时,它不会创建任何文件夹:只创建图像和 metadata.jsonl。
( data_path: str = None model: str = 'google/vit-base-patch16-224' username: Optional = None lr: float = 5e-05 epochs: int = 3 batch_size: int = 8 warmup_ratio: float = 0.1 gradient_accumulation: int = 1 optimizer: str = 'adamw_torch' scheduler: str = 'linear' weight_decay: float = 0.0 max_grad_norm: float = 1.0 seed: int = 42 train_split: str = 'train' valid_split: Optional = None logging_steps: int = -1 project_name: str = 'project-name' auto_find_batch_size: bool = False mixed_precision: Optional = None save_total_limit: int = 1 token: Optional = None push_to_hub: bool = False eval_strategy: str = 'epoch' image_column: str = 'image' objects_column: str = 'objects' log: str = 'none' image_square_size: Optional = 600 early_stopping_patience: int = 5 early_stopping_threshold: float = 0.01 )
参数