基于Python的YOLO数据集管理软件设计与实证研究
林静敏1, 魏松林2※
(1.厦门城市职业学院 人工智能学院,福建厦门361008;2.厦门海洋职业技术学院 信息工程学院,福建厦门361100)
摘 要:随着YOLO目标检测技术的广泛应用,多源数据集的标签定制与高效融合成为提升模型训练效率的关键挑战。现有工具存在标注分散、格式转换繁琐、缺乏统一管理平台等问题,导致数据准备效率低且易出错。为此,文章通过集成多源数据集格式转换、标签动态映射、子集划分及合并等核心功能,支持用户通过配置文件灵活定制标签,拟设计一款基于Python的YOLO数据集管理软件,以解决标签命名冲突与类别冗余等问题。实证结果表明,该软件在融合4个异构数据集(15.8万张图像)时,内存占用仅99.8 MB,平均每生成一个标注文件约耗时12.74 ms,验证了其在复杂场景与大规模数据下的高效性;该软件支持跨平台运行,为YOLO算法开发者提供了一套轻量化、可扩展的工具,成功实现了多源数据集标签定制与融合,对推动目标检测技术的工程化应用具有实践价值。
关键词:目标检测;YOLO数据集管理;数据集融合;标签定制
上一篇: 基于稀疏学习的去余弦窗跟踪算法
上一篇: 量子动力学框架的隐含并行性研究