Có bốn khuyết điểm phổ biến trong cấu hình nhôm, đó là vết trầy xước, rò rỉ, vết lõm và bột lồi. Bộ dữ liệu hình ảnh profile nhôm trong bài viết này được lấy từ một công ty nhôm ở tỉnh Giang Tô. Bộ dữ liệu hình ảnh hồ sơ nhôm ban đầu bao gồm tổng cộng 342 hình ảnh khuyết tật hồ sơ nhôm. Có rất ít mẫu hình ảnh bị lỗi và tỷ lệ một số lỗi trong toàn bộ tập dữ liệu quá nhỏ và dữ liệu bị lỗi không cân bằng. Khi deep learning được huấn luyện, nếu tập dữ liệu nhỏ sẽ khiến mô hình gặp vấn đề overfitting.


Để giải quyết các vấn đề trên, bài báo sử dụng phương pháp tăng cường hình ảnh để mở rộng tập dữ liệu hình ảnh profile nhôm bị lỗi. Công nghệ tăng cường hình ảnh thực hiện một loạt các điều chỉnh độ tương phản, xoay vòng ngẫu nhiên, v.v. trên dữ liệu ảnh gốc để tạo ra dữ liệu huấn luyện tương tự nhưng khác nhau nhằm mở rộng kích thước của tập ảnh huấn luyện, đồng thời giảm sự phụ thuộc của mô hình vào một số tính năng nhất định và cải thiện tính tổng quát của mô hình . khả năng hóa.
