刘 锐 ( 北京航空航天大学计算机学院 )
王 锐 ( 北京航空航天大学计算机学院 )
周彧聪 ( 北京航空航天大学计算机学院 )
刘 轶 ( 北京航空航天大学计算机学院 )
在深度学习应用中,大量且准确标注的训练数据是保证模型准确性的关键因素之一。在图像识别应用 中,为减少人工标注工作量,常常采用从互联网抓取大量图像并自动标注的方法。这带来两方面的问题:首先,引入 的错误标注数据将影响整体训练效果,其次,图像数量众多导致训练所需计算量庞大。本文在神威高性能计算机上设 计实现了一种基于Caffe的大规模有噪声图像训练系统,该系统采用多进程并行和数据预取方法以充分发挥申威众核处 理器和神威高性能计算机的性能优势,进而提升神经网络模型的训练速度,同时采用一种校准训练方法以降低噪声数 据给模型训练带来的不利影响。实验数据表明,该系统可在保证训练效果的前提下,大幅减少训练所需时间,同时具 有良好的性能可扩展性。
图像识别;高性能计算;分布式训练;噪声标签Full Text
Copyright © 2022 刘 锐,王 锐,周彧聪,刘 轶

This work is licensed under a Creative Commons Attribution 4.0 International License