The Korean Fashion and Textile Research Journal
[ Article ]
The Korean Fashion and Textile Research Journal - Vol. 27, No. 6, pp.586-595
ISSN: 1229-2060 (Print) 2287-5743 (Online)
Print publication date 31 Dec 2025
Received 03 Nov 2025 Revised 09 Dec 2025 Accepted 19 Dec 2025
DOI: https://doi.org/10.5805/SFTI.2025.27.6.586

패션 산업의 인공지능 전환을 위한 패션 이미지 라벨링 자동화 기법 연구

최우진1) ; 최봉준 ; 임준오2)
1)군산대학교 의류학부
동서대학교 소프트웨어학과
2)동서대학교 컴퓨터공학과
AI-Based Automation of Fashion Image Labeling: Toward Digital Transformation in the Fashion Industry
Woojin Choi1) ; Bongjun Choi ; Junoh Lim2)
1)Research Professor, School of Clothing and Textiles, Kunsan National University
Professor, Dept. of Software, Dongseo University
2)Student, Dept. of Computer Engineering, Dongseo University

Correspondence to: Bongjun Choi Tel. +82-53-320-4288 E-mail: bongjun.choi@dongseo.ac.kr

©2025 The Korean Fashion and Textile Research Journal(KFTRJ). This is an open access journal. Articles are distributed under the terms of the Creative 52 Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.

Abstract

In response to the growing emphasis on digital transformation (DX) and artificial intelligence (AI) transformation (AX) within the fashion industry, this study develops an AI-based fashion image-labeling system aimed at improving the efficiency and accuracy of large-scale data processing. Given the dominance of visual information in fashion, both the systematic extraction and structuring of meaningful attributes from image data are essential for trend forecasting and demand prediction. Therefore, this study proposes a two-step labeling framework based on the YOLO object-detection algorithm. First, a 1-depth AI model was trained on approximately 20,000 fashion images from the AI Hub to detect and classify garments into broad categories, specifically “top” and “bottom.” Second, a 2-depth model was constructed using 10,000 image-text pairs from the online platform Musinsa to assign fine-grained attribute values (e.g., “blouse,” “pants”) to each detected item. The experimental results demonstrated a labeling success rate of 96.29%, indicating the strong potential of the system for high-performance, automated labeling at scale. This study contributes to the development of scalable fashion data-annotation methods, offering practical implications for online retailers aiming at efficient visual data structuring. It also lays a foundation for more accurate and real-time AI-driven fashion trend analytics, thereby supporting both academic research and industry innovation.

Keywords:

fashion image labeling, digital transformation, YOLO, object Detection, fashion bigdata analysis

키워드:

패션이미지 라벨링, 디지털트랜스포메이션, 욜로, 객체 탐지, 패션 데이터 분석

1. 서 론

빠르게 성장하는 글로벌 패션 시장 속에서 디지털 전환(Digital transformation; DX)과 인공지능 전환(Artificial intelligence transformation; AX)은 패션 산업의 핵심 트렌드로 자리매김하고 있다(Choi et al., 2025). 특히 온라인 패션 커머스의 급속한 확산은 오프라인 중심의 리테일러들로 하여금 온라인 유통 채널로의 확장을 촉진시키며, 패션 산업의 전반적인 디지털 전환을 가속화하고 있다. 이와 같은 패션 산업의 디지털화는 온라인상에서 방대한 규모의 패션 데이터를 생성하고 있으며, 이는 새로운 산업적 기회를 창출하는 기반이 되고 있다. 패션 산업에서는 그 중에서도 이미지 데이터가 핵심적인 역할을 하며, 시각적 정보를 풍부하게 담고 있다는 점에서 중요성이 더욱 강조된다. 이에 따라 패션 이미지의 디지털화와 디지털화된 이미지 데이터를 효율적으로 관리하고 활용하는 문제는 온라인 리테일러들에게 중요한 과제로 부상하고 있다(Bertola & Teunissen, 2018). 패션 이미지의 효율적인 활용을 위해서는, 비정형 이미지 데이터로부터 유의미한 정보를 추출하여 텍스트 형태로 변환하는 데이터 라벨링(labeling) 과정이 필수적이다. 이러한 정보에는 제품의 아이템 종류, 실루엣, 컬러 등과 같은 속성이 포함된다. 디지털화된 이미지 데이터는 머신 러닝과 같은 인공지능 기반의 빅데이터 분석을 통해 트렌드 예측이나 소비자 수요 예측 등 다양한 방식으로 활용될 수 있으며, 이에 따라 그 중요성은 점차 증대되고 있다(Bharati, 2021). 이처럼 데이터의 효과적인 사용은 패션 산업의 다양한 서비스 품질을 향상시킬뿐만 아니라 패션 산업의 디지털 전환을 통한 혁신을 위한 중요한 자원으로 사용될 것으로 기대되고 있다(Choi et al., 2024; Kim & Lee, 2018).

패션 이미지 데이터를 AI 모델에 효과적으로 활용하기 위해서는, 해당 이미지에 포함된 시각 정보를 텍스트 형태로 구조화하고, 이를 AI 학습에 적합한 방식으로 가공하는 과정이 필수적이다. 비정형 데이터인 패션 이미지를 별도의 텍스트 데이터 없이 그대로 AI 모델에 활용할 경우 비지도 학습 방식에 의존하게 된다. 그러나 이러한 방식은 AI 모델이 이미지 내에서 무엇을 식별해야 하는지 또는 어떤 특성을 학습해야 하는지에 대한 명확한 가이드라인이 부족하여 분석의 정확도가 저하되는 한계가 있다. 따라서 비정형 패션 이미지 데이터를 AI 모델의 학습에 활용하기 위해서는, 이미지 데이터에 대한 텍스트 정보를 기반으로, 이미지 데이터로부터 유의미한 특성을 사전에 추출하고 이를 학습시키는 과정이 필수적이다(Lim et al., 2024). 구체적으로, 패션 이미지에서 등장하는 아이템을 식별하고 이를 텍스트 형태로 라벨링하는 작업이 선행되어야 하는 것이다. 라벨링은 비정형 데이터인 패션 이미지에서 아이템의 위치를 정확히 추출한 뒤, 해당 아이템의 구체적 속성값(value)을 태깅(tagging)하는 작업이다. 이처럼 라벨링 과정을 거친 이미지 데이터는 ‘텍스트’ 형태의 데이터로 분석에 바로 사용할 수 있을 뿐만 아니라, AI 모델 학습의 기반이 되는 학습 데이터로도 활용되어 보다 고도화된 분석을 가능하게 한다(Choi, 2023; Gu et al., 2020; Klostermann et al., 2018; Lim et al., 2024). 라벨링 과정을 통해 패션 이미지의 구체적이고 명확한 분석이 가능하며, 이는 패션 산업의 데이터 기반 혁신을 촉진하는 데 기여할 것으로 기대된다.

하지만, 패션 분야에서 패션 이미지 라벨링 작업을 자동화해주는 정확도 높은 시스템은 많지 않은 상황이다. 이러한 이유로 정확도 높은 라벨링 작업은 결국엔 수작업을 거치고 있으며, 결과적으로 대량의 이미지에 대한 라벨링 작업은 상당한 시간과 인력을 요구한다(Fredriksson, 2023; Mots'oehli, 2024; Tan et al., 2024). 최근 일부 연구에서는 YOLO(You Only Look Once)와 같은 객체 탐지 모델을 활용하여 패션 이미지 라벨링을 시도하였으나 텍스트와 이미지를 1:1로 매칭하는 방식으로 라벨링을 수행하였으나, 계층적 속성 구조를 반영하지 못하며, 이미 구축된 라벨링 데이터셋에 존재하는 속성값만을 학습하고 라벨링할 수 있다는 제약을 지닌다(Lim et al., 2023). 이러한 방식은 새로운 데이터나 미지의 속성값에 대한 자동 라벨 생성이 어렵다는 한계점을 가지고 있다. 또한 Park et al.(2024)은 YOLO 기반으로 의류 객체를 17개 카테고리(e.g., 블레이저, 코트, 카디건 등)로 분류하는 연구를 수행하였으나, 이는 단일 수준의 카테고리 분류에 머물러 있으며, 이미지 속 의류 제품에 대해 ‘상의—블라우스’와 같은 계층적 라벨링 구조를 구현하지 못한다는 한계가 있다. 즉, 기존 연구들은 주로 사전에 구축된 라벨을 예측하거나 단일 수준의 범주만을 분류하는 방식에 머물러 있으며, 기존 데이터셋 없이도 이미지–텍스트 정보를 기반으로 새로운 라벨을 자동 생성할 수 있는 계층적 라벨링 시스템에 관한 연구는 극히 드문 상황이다.

한편, 정확도가 낮거나 일관성이 부족한 라벨링은 데이터 분석의 정확도와 AI 모델 학습에 부정적인 영향을 미칠 수 있다. 예를 들어, Shi et al.(2021)의 연구에서는 AI 모델을 활용하여 패션 이미지 약 10,000여 장에서 패션 속성을 추출하여 트렌드 분석을 진행하였다. 하지만, 학습을 위해 사용된 데이터(패션 속성값이 라벨링 된 이미지 데이터)에 60% 이상의 오류가 존재하여 분석 결과의 신뢰성이 떨어진다는 한계점을 가지고 있다. 뿐만 아니라 Zhao et al.(2024)의 연구에서도 패션 데이터 라벨링을 위한 알고리즘 구축하여 트렌드 컬러, 패션 아이템, 스타일 속성값 추출하여 패션 트렌드를 분석하였다. 하지만, 라벨링된 속성값의 범위가 일관성이 없다는 한계점이 존재하였다. 비록, 옴니어스 태거 API와 같이 라벨링을 도와주는 서비스가 존재하지만, 세부적인 카테고리 설정과 데이터 항목 당 드는 비용, 그리고 패션 아이템 특유의 다양성과 복잡성으로 인해 접근성에 한계가 있다. 이처럼 패션 분야에서 AI에 기반하여 정확도 높은 데이터 분석을 하기 위해서는 고성능의 데이터 라벨링 모델이 필요한 상황이다.

따라서, 본 논문에서는 이러한 문제를 해결하기 위해 객체 탐지의 대표적인 모델 중 하나인 YOLO를 활용하여 이미지 속 패션 아이템을 정확하게 식별하여 그 속성값을 계층적으로 라벨링 하는 과정을 자동화하고 개선하는 것을 목표로 한다. 더 나아가, 의류 속성값이 사전에 학습된 상태가 아니더라도, 패션 리테일 플랫폼에서 제공되는 텍스트 기반 속성 정보를 활용하여 새로운 라벨을 자동 생성할 수 있는 알고리즘을 제안함으로써, 기존 라벨링 데이터셋에 대한 의존도를 줄이고 보다 확장 가능한 라벨링 방식을 제안하고자 한다. 본 연구에서 개발한 패션 이미지 라벨링 시스템은 이미지 속 상의 및 하의의 위치를 이미지의 크기, 배경 이미지에 상관 없이 높은 정확도로 식별할 수 있으며, 이렇게 식별한 패션 아이템의 속성값을 자동으로 라벨링 할 수 있는 알고리즘을 개발하고자 한다. 특히 본 연구에서는 패션 제품 이외의 다른 객체(e.g., 배경, 장애물 등)가 라벨링의 정확도를 떨어뜨리지 못하도록 학습시켰다. 나아가 본 연구에서는 온라인 패션 플랫폼에서 리테일러들이 직접 업로드하는 패션 이미지와 상품명(텍스트 데이터)을 동시에 학습시켜, 다양한 종류의 패션 아이템과 그 속성값을 라벨링 할 수 있도록 하였다.


2. 이론적배경

2.1. 패션 산업의 디지털 전환과 데이터의 중요성

기술의 비약적인 발전은 산업 현장에 디지털 전환을 본격적으로 촉진시키는 변화를 가져왔다. 디지털 전환 (DX)은 기업이 보유한 정보를 디지털화하여 혁신적이고 새로운 비즈니스 모델을 구축하고, 이를 제품 생산 방식과 서비스 체계 전반에 적용함으로써 기업의 운영 방식을 근본적으로 변화시키려는 활동으로 정의할 수 있다(Kim et al., 2022). 더 나아가 국내에서는 AI 전환 (AX)이 산업 전반의 핵심 키워드로 부상하고 있다(Park, 2025). 이는 단순한 디지털화 수준을 넘어, 인공지능 기술을 중심으로 한 기업 구조와 전략의 재편을 의미한다(Kwon, 2024). 최근 생성형 AI의 보편화로 인해 다양한 산업 분야에서 AI를 적극적으로 도입·활용하려는 움직임이 확산되고 있으며, 이와 같은 흐름 속에서 ‘데이터’의 중요성이 더욱 부각되고 있다. 이는 양질의 데이터가 있어야만 정확하고 신뢰할 수 있는 AI 모델을 구축할 수 있고, 이를 기반으로 예측 모델을 개발하거나 미래 트렌드 분석 및 전략적 의사결정이 가능하기 때문이다(Clunix, 2024).

DX와 AX는 다양한 산업군에서 기술적 혁신을 이끌고 있으며, 패션 산업도 큰 변화를 겪고 있다. 이에 패션 분야에서도 데이터의 중요성이 커지면서 기존의 데이터를 디지털화하고, 디지털화된 방대한 양의 데이터를 분석하는 기술이 이제 기업의 성패를 가르는 중대한 가치로 떠오르고 있다(Kim et al., 2022; Seo, 2018). 특히, 패션 산업에 최적화된 기술의 발전은 디자인, 생산, 유통, 마케팅 전반에 걸쳐 혁신을 주도하고 있다(Bertola & Teunissen, 2018). 실제로, CES 2025(소비자 가전 전시회)에서 처음으로 패션 테크 분야가 신설되는 등, 전세계적으로 패션 분야에서 AI 기반 혁신이 빠르게 추진되고 있는 실정이다(Kim, 2025). 뿐만 아니라, AI와 데이터 분석 기술을 기반으로 한 패션 테크 기업들이 빠르게 증가하고 있으며, 이들은 이미지 인식, 수요 예측, 개인화 추천 등 다양한 데이터 기반 서비스를 통해 기존 패션 산업의 혁신을 촉진시키고 있으며, 보다 나아가 ‘데이터’가 패션 산업 경쟁력을 결정짓는 핵심 자원으로 작용하고 있음을 보여주는 것이기도 하다. 구체적으로, 패션 데이터를 효과적으로 활용하면 온라인 리테일 데이터나 소셜미디어 데이터를 기반으로 패션 트렌드를 보다 정밀하게 예측할 수 있으며, 이는 수요 예측 및 재고 관리와도 밀접하게 연관된다(Rudniy et al., 2024). 특히 패션 산업은 시각 중심의 산업으로, 이미지 데이터가 제품 인식과 소비자 의사결정에 중요한 영향을 미친다(Choi et al., 2024). 이에 따라 최근에는 이미지 기반 인공지능 기술—예를 들어, 컴퓨터 비전을 활용한 스타일 분류, 색상 분석, 상품 유사도 판별, 착용 이미지 기반 추천 시스템 등—이 활발히 적용되고 있다(Cheng et al., 2021). 이러한 기술은 소비자 경험을 향상시키는 동시에, 브랜드의 기획 및 마케팅 전략 수립에도 기여하고 있다. 나아가, PLM(Product Lifecycle Management) 시스템과 연동되거나 단독으로 활용되는 디지털 솔루션들은 디자인에서부터 생산, 유통, 소비자 응대에 이르기까지 전반적인 업무 프로세스를 디지털화하며, 패션 산업 내 DX 및 AX를 실현하는 중요한 수단이 되고 있다(neXt generation MerchanDising [XMD], 2024).

2.2. 패션 분야에서의 빅데이터 분석

AI에 기반한 방법론과 데이터에 기반한 의사 결정은 산업뿐만 아니라 학계에서도 주목하고 있다. 특히 텍스트 마이닝, 이미지 마이닝과 같이 데이터 분석 기술을 포함하는 빅데이터 분석은 기존의 연구에서 사용했던 설문 척도나 질문지법에서의 측정 제약을 벗어나 컴퓨터 프로그램을 통해 비정형 데이터 속의 정보를 정량화 시킬 수 있다는 장점을 가지고 있어 학계에서 많은 관심을 기울이고 있다(Moon & Kamakura, 2017). 이러한 흐름은 패션 분야의 연구자들과 컴퓨터 공학(computer science) 분야의 연구자들과의 융합 연구를 이끌었으며, 국내외 연구자들은 빅데이터를 활용한 다양한 패션 분야의 연구를 진행하였다(Getman et al., 2021; Hogn et al., 2016; Shi et al., 2021; Zhao et al., 2024). 특히 패션 분야에서 이미지 데이터는 색상, 형태 등의 정보를 포함하고 있기 때문에 텍스트 데이터보다 풍부한 정보를 제공할 수 있다는 장점을 가지고 있다(Dai et al., 2022). 이에 많은 연구자들은 비정형 이미지 데이터 속에서 텍스트 및 다양한 정보를 추출하여 분석하는 텍스트 마이닝 및 이미지 마이닝 기술과 같은 빅데이터 분석에 큰 관심을 가지게 되었다.

패션 이미지에서 보다 많은 정보를 추출하여 분석하기 위해서는 패션 이미지를 라벨링하는 과정이 선행되어야 한다. 라벨링은 각 이미지에 명확한 속성값 (e.g., 아이템 종류, 색상, 소재 등)을 부여함으로써, 데이터의 구조화된 해석을 가능하게 하며, 지도학습 기반의 AI 분석을 통해 보다 정밀하고 신뢰도 높은 결과를 도출할 수 있게 한다. 반면, 비지도학습을 통한 이미지 분석은 명시적인 정답 (ground truth)이 없는 상태에서 패턴을 스스로 탐색하기 때문에, 복잡하고 세분화된 패션 속성 정보를 정확하게 추출하는 데 한계가 있다(Song et al., 2023). 하지만 아직까지 패션 이미지에서 패션 아이템과 관련한 속성값을 높은 정확도로 추출할 수 있는 알고리즘이 많지 않은 상황이다. 이에 일부 연구자들은 직접 패션 이미지를 의류 속성값에 기반한 텍스트 데이터로 변환하는 AI 알고리즘을 구축하기도 하였다. 예를 들어, Getman et al.(2021)은 야구 모자의 유무를 라벨링하여 야구 모자를 추출해낼 수 있는 알고리즘을 직접 구축하여 약 20년 동안 특정 아이템(야구 모자)의 출현 빈도를 도출하였다. 뿐만 아니라 Shi et al.(2022)와 Zhao et al.(2024)의 연구에서도 학습 데이터를 사용하여 패션 아이템의 속성값을 추출할 수 있는 알고리즘을 구축하였고, 이를 기반으로 아이템, 스타일 속성값을 추출하였다.

하지만 이러한 알고리즘을 학습시키기 위해서는 패션 분야 전문가들이 직접 태깅한 데이터 셋(data set)이 사전에 준비되어야 하며, 학습에 사용되어야 한다는 어려움이 존재한다(Gu et al., 2020; Klostermann et al., 2018). 패션 속성값이 태깅된 대용량의 패션 데이터셋이 무료로 배포되기도 하여, 일부 연구자들은 이를 사용하지만, 일관된 분류체계를 가지고 있지 않고 데이터 셋의 50% 이상에 오류가 포함되어 있다는 한계점이 존재한다(Shi et al., 2021). 이와 같이 데이터 셋에 내포된 오류는 패션 이미지 분석에서 신뢰도 높은 AI 모델을 개발하기 위한 주요 장애 요소로 작용하고 있다. 따라서, 패션 분야에서 AI에 기반하여 정확도 높은 데이터 분석을 하기 위해서는 고성능의 데이터 라벨링 모델이 필수적이다.

2.3. 패션 이미지 데이터 라벨링 (labeling)

데이터 라벨링은 AI 모델 학습을 위해 원시 데이터(raw data)를 텍스트 형태의 메타 데이터로 변환하는 과정으로, 라벨링을 통해 AI가 학습할 수 있는 형태로 구조화하는 것을 의미한다(Cheng et al., 2021; Lee, 2022). AI 모델 학습용 데이터는 크게 텍스트, 이미지, 비디오, 오디오로 나눌 수 있다. 이러한 데이터를 AI 모델이 인식할 수 있도록 가공하는 작업이 데이터 라벨링인 것이다. 특히 패션 산업에서도 이미지 데이터를 활용한 AI 모델 개발이 증가하면서, 패션 이미지의 정밀한 라벨링 기술이 중요한 이슈로 떠오르고 있다(Choi et al., 2024). 그러나 패션 이미지 라벨링 기법에 대한 연구는 아직 부족한 실정이다. 데이터 라벨링 기술이 AI 모델 구축의 핵심 역할을 한다는 중요성에도 불구하고, 패션 이미지의 정확도 높은 라벨링 기법에 대해서는 많은 연구가 이루어지지 않은 상황이다.

패션 이미지 데이터의 라벨링은 비정형 데이터에서 객체를 인식한 후, 해당 객체의 속성값을 다중으로 라벨링하는 과정으로 이루어진다. 즉, 하나의 패션 아이템이 여러 개의 속성값을 가질 수 있으며, 이를 통해 이미지 데이터에서 의미 있는 정보를 추출할 수 있다. 예를 들어, ‘청바지’라는 패션 아이템은 패션 제품 중 ‘하의’에 해당하며, 동시에 ‘블루,’ ‘스트레이트 핏’ 등 다양한 속성값을 동시에 가질 수 있다. 그렇기 때문에, 이를 체계적으로 라벨링하는 것이 중요하다(Gu et al., 2020; Klostermann et al., 2018). 이처럼 라벨링 과정을 거친 이미지 데이터는 구조화된 데이터로 분석에 바로 사용할 수 있을 뿐만 아니라, AI 모델 학습의 기반이 되는 학습 데이터로도 활용되어 보다 고도화된 분석을 가능하게 한다(Lim et al., 2024).

일반적으로, 패션 이미지 데이터를 효과적으로 라벨링하기 위해서는 기본적으로 객체 탐지(object detection)와 영역 구분(segmentation) 기술이 필요하다(Vijayaraj et al., 2024). 객체 탐지 기술은 패션 이미지 내에서 특정 패션 아이템을 식별하고, 해당 아이템이 존재하는 위치를 경계 상자(bounding box)로 표시하는 기술이다. 반면, 영역 구분 기술은 객체의 단순한 위치 탐지에서 나아가, 패션 아이템의 정확한 윤곽을 픽셀 단위로 구분하는 기술을 의미한다. 즉, 패션 이미지에서 특정 아이템을 탐지한 뒤, 그 윤곽을 정밀하게 분할하고, 이후 각 객체에 대해 속성값(e.g., 카테고리, 색상, 소재 등)을 부여하는 과정을 거쳐 라벨링이 이루어진다.

이러한 AI 기반 라벨링 모델을 구축하기 위해서는 사전에 라벨링이 완료된 대량의 고품질 데이터셋이 반드시 필요하다(Bernhardt et al., 2022). 즉, AI에 기반하여 새로운 이미지에 대해 자동으로 라벨을 부여할 수 있으려면, 먼저 사람이 직접 다양한 이미지에 속성값을 부여해둔 학습용 데이터 셋이 선행되어야 하는 것이다. 예를 들어, Lim et al.(2023)의 연구에서는 YOLO 모델을 사용해 1:1 라벨링 시스템을 구축하는 연구를 진행하였으나, 이미 구축된 라벨링 데이터셋에 존재하는 속성값만을 학습하고 라벨링할 수 있다(Lim et al., 2023). 하지만 정확도 높은 데이터 셋을 구축하는 것은 상당한 인력과 시간을 요구하기 때문에, 현재 대부분의 패션 이미지 라벨링 시스템은 이미지 데이터만을 단독으로 활용하여 모델을 학습시키는 데 집중해왔다. 이로 인해 이미지의 시각적 정보만으로는 구별이 어려운 유사 아이템이나 복합적인 스타일 요소를 정밀하게 분류하는 데 한계가 존재한다. 또한, 현재 대부분의 라벨링 시스템은 정해진 속성 체계에 기반하여 작동되기 때문에, 기존에 정의되지 않았던 새로운 패션 아이템의 속성이나 특징을 유연하게 추가하거나 반영하는 데 어려움이 따른다. 예를 들어, 새로운 실루엣이나 신소재, 혹은 최근 유행하는 스타일 요소 등이 등장하더라도, 기존 AI 모델에서는 해당 속성값이 존재하지 않기 때문에 즉각적으로 이를 반영하기 어렵다. Park et al. (2024) 의류 객체를 17개 카테고리로 분류하는 연구를 수행하였으나, 학습이 이루어지지 않은 속성값은 분류가 불가하다는 제약을 가지고 있다. 이처럼 기존 패션 라벨링 시스템은 정확한 자동 라벨링을 위해 대규모의 사전 라벨링 데이터셋에 강하게 의존하며, 이에 따라 사전에 정의되거나 학습되지 않은 속성값에 대해서는 라벨링 자체가 불가능하다는 구조적 한계를 지닌다. 또한 하나의 의류 제품은 상위 범주(e.g., 상의, 하의)부터 하위 세부 속성(e.g., 블라우스, 셔츠, 조거팬츠 등)에 이르기까지 계층적으로 구성되어 있음에도, 이를 자동으로 반영하여 라벨링할 수 있는 계층적 라벨링 시스템에 관한 연구는 부족한 실정이다. 따라서 사용자가 원하는 방식으로 새로운 속성값을 자유롭게 추가·수정하면서도, 이미지와 텍스트 정보를 기반으로 유연하게 확장 가능한 라벨링 시스템을 구축할 필요성이 제기되고 있다.


3. 연구 방법

3.1. 연구 문제 도출

실제 패션 데이터는 텍스트 정보와 함께 제공되는 경우가 많으며, 온라인 패션 리테일 플랫폼에서도 패션 이미지는 설명 텍스트와 함께 제공되는 것이 일반적이다. 이에 본 연구에서는 패션 이미지 라벨링 시스템 구축 과정에서 텍스트 데이터를 함께 학습하도록 설계함으로써, 기존 라벨링 시스템이 대량의 학습 데이터를 필요로 하는 한계를 보완하는 것을 목표로 한다. 본 연구는 다양한 패션 속성 가운데 ‘아이템’ 범주 중에서도 특히 ‘상의’와 ‘하의’에 초점을 맞추어 진행되었다. 이는 패션 이미지에서 가장 기본적이고 등장 빈도가 높은 핵심 카테고리이기 때문이다. 이에 따른 연구 문제는 다음과 같다.

  • 연구문제 1: 패션아이템에대한자동라벨링시스템을구축한다.
  • 연구문제 2: 본 연구에서 개발한 자동 라벨링 시스템의 유효성을 검증한다.

3.2. 연구 절차

패션 이미지 내 객체를 정확히 탐지하고 정밀하게 분류하기 위해서는, 우선적으로 속성값(attribute value)의 정의와 범주를 명확히 설정할 필요가 있다. 이는 학습 과정에서 속성 간 혼동을 최소화하고 분류 정확도를 향상시키는 핵심 전처리 단계이다. 또한 속성값을 계층적 수준(level)으로 구분하여(e.g., 상위 레벨의 ‘상의’와 하위 레벨의 ‘티셔츠’) 라벨링할 경우, 데이터의 체계적인 구조화를 통해 관리 및 확장 가능성을 높일 수 있다. 이러한 계층적 라벨 구조는 추천 시스템 고도화, 패션 트렌드 분석, 수요 예측 등 다양한 응용 연구에서 데이터의 재사용성과 해석 가능성을 향상시키는 기반이 된다(Choi et al., 2023). 따라서 본 연구에서는 먼저 패션 제품을 상위 레벨로서 ‘상의’와 ‘하의’로 구분하여 학습시키고, 이후 각 범주에 포함되는 세부 속성값을 단계적으로 학습시키는 방식으로 AI 라벨링 모델을 구축하였다.

본 연구는 AI에 기반한 패션 이미지 데이터 라벨링 모델을 구축하기 위해 다음 네 가지의 절차를 거쳤다. 첫 번째 단계에서, AI-hub와 무신사 플랫폼에서 다량의 패션 이미지를 수집한다. 두 번째 단계에서는 AI-hub에서 수집한 이미지를 활용하여, 아이템 속성값 분류 기준 중 가장 상위 레벨에 해당하는 ‘상의’와 ‘하의’를 탐지하고 분류하는 기본 AI 모델 (1-depth AI 모델)을 구축한다. 세 번째 단계에서는 무신사에서 수집한 이미지와 함께 제공된 텍스트 속성값 정보를, AI 모델을 통해 추출한 경계 상자 정보와 정밀하게 연결(mapping)하는 2-depth AI 모델을 구축한다. 마지막으로, 학습된 모델의 유효성을 실증적으로 검증한다. 각 단계에서의 데이터 처리 및 모델 구축 과정에 대한 구체적인 내용은 이후 절에서 자세히 설명하였다. 본 연구에서 제안하는 시스템은 Python으로 이루어졌으며, 접근성과 편의성을 고려하여 Fast API를 사용한 백엔드 API 서버 구축과 Svelte를 활용한 웹 기반 플랫폼을 통해 실험을 진행하였다. 또한 HP Z1 G9 4E883AV 워크스테이션 (Intel Corei9-12900 프로세서)을 사용하여 로컬 환경에서 시행되었다.


4. 연구 결과

4.1. 데이터 수집

먼저 상의와 하의 두 개의 속성값으로 라벨링하는 AI 모델을 구축하기 위해 약 40,000장의 패션 이미지 데이터를 수집하였다. 먼저, 국내 인공지능 학습용 데이터를 제공하는 플랫폼인 AI-Hub에서 제공하는 약 20,000장의 패션 이미지로, 해당 이미지는 ‘상의’, ‘하의’ 정보가 반영된 학습 데이터로, ‘상의’와 ‘하의’에 해당하는 속성값을 라벨링하는 AI 시스템을 학습시키기에 적합하였다.

이어서 한국 최대 규모의 온라인 패션 플랫폼인 무신사(www.musinsa.com)를 이미지 수집 채널로 선정하여 ‘상의’와 ‘하의’ 카테고리 내의 이미지와 텍스트 데이터 약 20,000 세트를 수집하였다 (수집 기간: 2023년 6월-2024년 5월). 무신사는 국내 최대 규모의 패션 플랫폼으로 방대한 양의 데이터를 보유하고 있을뿐만 아니라, 데이터는 다양한 촬영 각도와 자연스러운 착용 컷이 포함되어 있어 모델의 실제 서비스 환경 적합성을 강화하는 데 기여하였다. 또한 실제 산업에서 사용하는 이미지 데이터이기 때문에, 유효성을 검증함에 있어서도 적합하다 판단하였다. AI-hub 데이터와 무신사에서 수집한 10,000의 데이터를 학습 데이터로 사용하였으며, 무신사에서 수집한 나머지 10,000의 데이터는 유효성 검증을 위해 사용하였다. 본 연구에서 사용한 패션 플랫폼 기반 이미지–텍스트 데이터의 예시는 Fig. 1에 제시하였다.

Fig. 1.

Examples of image and text data provided by fashion platforms. www.musinsa.com

4.2. 기본 AI 라벨링 모델 구축: 1-depth AI 모델

패션 이미지 내 객체를 탐지하고 정밀하게 분류하기 위해서는 속성값의 정의와 범주가 명확하게 정립되어야 한다. 이는 AI 모델의 학습 과정에서 속성 간 혼동을 최소화하고, 분류의 정확도를 높이기 위한 핵심적인 전처리 단계이기 때문이다. 나아가, 속성값을 레벨별로 구분하여 라벨링함으로써 데이터의 계층적 구조를 확보할 수 있으며, 이를 통해 보다 체계적이고 유연하게 데이터를 관리하고 활용할 수 있다. 이러한 구조는 고도화된 추천 시스템 개발, 트렌드 분석, 수요 예측 등 다양한 응용 분야에서 데이터의 재사용성과 해석 가능성을 높이는 데 기여할 수 있기 때문에, 명확한 분류 기준의 설정은 필수적이라 할 수 있다(Choi et al., 2023).

본 연구는 보다 체계적인 라벨링 모델을 구축하기 위해, 먼저 ‘상의’와 ‘하의’에 해당하는 속성값을 정확하게 라벨링하는 기본 AI 모델을 구축하였다. 본 연구에서는 이를 1-depth AI 모델이라 명칭하였다. 1-depth AI 모델은 입력값으로 대량의 패션 이미지를 받으며, 상의와 하의를 탐지한 이후, 탐지된 상의와 하의의 경계 상자를 출력한다. 이때, 출력된 경계 상자들 중에서 상의와 하의 두 개의 패션 아이템 중 하나라도 탐지되지 않은 경우, 상의와 하의가 아님에도 잘못 탐지된 객체가 존재하는 경우, 그리고 하나의 객체에 여러 개의 경계 상자가 존재하는 경우가 발생할 수 있다. 이를 방지하기 위해 본 연구에서는 전처리 과정을 거쳤다.

본 연구에서는, 경계 상자가 가지고 있는 요소 중 하나인 신뢰도 점수(confidence score)를 사용하여 전처리를 하였다. 기본 객체 탐지 모델을 통해 출력된 각각의 경계 상자는 고유한 신뢰도 점수를 가지며, 이는 각 경계 상자가 객체를 얼마나 정확하게 탐지하였는지를 보여주는 수치이며, 신뢰도 점수는 0에서 1 사이의 값을 가진다. 이러한 신뢰도 점수의 성질을 이용하여, 상의와 하의 각각의 경계 상자들 중에서 가장 높은 신뢰도 점수를 가지는 경계 상자를 선별한다. 이를 통해, 잘못 탐지된 객체의 경계 상자를 제거하고, 하나의 객체에 존재하는 여러 개의 경계 박스 중 가장 정확한 경계 상자를 추출하게 된다 (Fig. 2). 최종적으로 추출된 경계 상자의 신뢰도가 0.5 이하일 경우, 이미지 속에서 정확한 경계 상자를 추출하지 못했다고 간주하였다. 이와 같은 전처리 과정을 거친 패션 이미지는 최종적으로 상의와 하의에 정확하게 해당되는 경계 박스만을 포함하게 된다. 즉, 해당 패션 이미지에서 탐지된 상의와 하의는 사용자가 원하는 카테고리를 부여하여 새로운 속성값으로 라벨링될 준비를 마치게 된다.

Fig. 2.

Preprocessing example based on confidence scores (drawn by authors).

4.3. 속성값 매칭을 통한 2단계 AI 모델 구축: 2-depth AI 모델

1-depth AI와 경계 상자를 통해 패션 이미지 속 ‘상의’와 ‘하의’를 정확하게 탐지하고 분류할 수 있도록 하였다. 이어지는 2단계 AI 모델은 이미지와 텍스트 데이터 약 10,000세트를 활용하여, 탐지된 ‘상의’와 ‘하의’에 대해보다 세부적인 속성값을 매핑하도록 알고리즘을 학습시켰다. 텍스트 데이터는 Jang et al.(2022)에서 제시한 패션 속성과 속성값에 대한 데이터들을 기반으로, 아이템 속성값에 해당하는 단어들이 자동으로 매핑되도록 설계하였다. 즉, 앞서 수집한 데이터 세트로부터 ‘상의’와 ‘하의’보다 더 세분화된 레벨의 아이템 속성값 정보를 불러오도록 알고리즘을 구축한 것이다. 이를 바탕으로, 텍스트에 포함된 패션 아이템 속성값과 경계 상자를 연결한다. 매칭 과정을 보다 구체적으로 설명하면 다음과 같다. 탐지된 경계 상자의 상위 속성값이 ‘상의’인 경우, 시스템은 이를 상의로 인식하고, 텍스트 데이터에서 ‘상의’에 해당하는 하위 속성값(e.g., 블라우스)을 불러와, 탐지된 ‘상의’ 이미지와 매핑한다. 이를 통해, 각 경계 상자가 어떤 패션 아이템에 해당하는지를 명확하게 식별할 수 있다. 본 연구에서 제안하는 패션 이미지 라벨링 AI 모델은 Fig. 3에 제시하였다.

Fig. 3.

Schematic diagram of the proposed AI-based fashion image labeling model (drawn by authors).

이러한 방식은 단순히 단일 수준의 라벨링에 그치지 않고, ‘상의’– ‘블라우스’와 같이 계층적 구조에 기반한 다중 레벨 라벨링을 자동으로 수행할 수 있다는 점에서 의의가 있다. 뿐만 아니라, 이와 같은 계층적 라벨링은 데이터의 구조적 일관성과 활용도를 높인다. 나아가, 이처럼 매핑된 데이터는 단순 출력 결과에 그치지 않고, 다시 AI 모델의 학습 데이터로 활용되어, 특정 아이템(e.g. ‘블라우스’)에 대한 이미지-텍스트 간 연관성이 보다 정밀하게 학습된다. 이 과정을 통해 2-depth 모델은 세분화된 패션 아이템에 대한 식별 역량을 지속적으로 고도화할 수 있으며, 학습의 반복을 통해 정확도 또한 향상된다. 결과적으로, 본 시스템은 데이터의 체계적 구조화는 물론, 라벨링–재학습–정밀화로 이어지는 순환 구조를 통해 AI 기반 패션 데이터 처리의 효율성과 정밀도를 동시에 확보할 수 있다.

4.4. 유효성 검증

본 연구에서 개발한 패션 이미지 데이터 라벨링 시스템의 성능을 평가하기 위해, 앞서 수집한 10,000장의 패션 이미지 및 텍스트 데이터를 대상으로 유효성 검증을 진행하였다. 그 결과, 제안된 시스템은 총 9,629장의 이미지에서 라벨링을 성공적으로 수행하였으며, 이는 96.29%의 성공률에 해당한다. 보다 구체적으로, 라벨링 시스템의 Precision은 96.84%, Recall은 95.92%로 나타나 전반적으로 안정적인 분류 성능을 확인하였다. 또한, 이미지 1장당 평균 처리 시간은 약 0.15초로 측정되었으며, 전체 10,000장의 이미지를 처리하는 데에는 약 25분이 소요되었다. 이러한 결과는 대규모 이미지 데이터를 처리하는 데 있어 본 시스템의 자동화 수준과 실용성을 입증하는 것이다.

추가적으로, 라벨링에 실패한 사례 371장을 분석한 결과, 이 중 185장의 경우 이미지 내에서 상의와 하의를 탐지한 경계 상자의 신뢰도 값이 임계값인 0.5 미만으로 나타난 것이 주요 원인이었다. 객체 탐지 모델에서는 일반적으로 신뢰도 0.5를 기준으로 성능을 평가하는데(Hsu & Lin, 2020), 지나치게 낮은 신뢰도는 과탐지(false positives)의 문제를, 지나치게 높은 신뢰도는 누락 탐지(false negatives)의 문제를 불러일으키기 때문이다. 예를 들어, 모델 포즈가 지나치게 역동적이거나 신체가 크게 기울어진 이미지에서는 상의와 하의의 경계가 불명확하게 촬영되어 신뢰도 값이 0.5 미만으로 산출되었다. 또한, 상의와 하의가 여러 겹으로 착용된 레이어드 스타일(e.g., 자켓–후드집업–이너를 동시에 착용)에서는 모델이 어느 부분을 ‘상의’로 판단해야 하는지 명확한 기준을 적용하기 어려워 신뢰도가 낮게 산출되기도 하였다.

한편, 나머지 186장의 이미지에서는 상의 또는 하의가 전혀 탐지되지 않아 라벨링이 불가능했다. 이러한 실패는 본 연구가 ‘상의’와 ‘하의’만을 대상으로 AI 모델을 학습시켰기 때문에, 상하의가 명확히 구분되지 않는 이미지에서는 탐지가 어려웠던 것으로 해석된다. 예를 들어, 가방이나 신체의 일부가 상의나 하의를 가리는 경우(e.g., 크로스백이 하의를 절반 가림), 혹은 손·팔이 상의를 넓게 가리는 포즈에서는 탐지 박스가 불완전하게 생성되어 라벨링이 실패하였다. 또한, 레이어드 스타일링으로 인해 상의가 하의를 가리는 경우 (e.g., 원피스와 청바지를 함께 매치하는 경우), 하의의 영역을 탐지하지 못하는 것으로 확인되었다.


5. 결론 및 시사점

패션 산업 역시 전 산업에서 이루어지고 있는 DX 및 AX 흐름에 맞추어 기술 기반의 혁신이 일어나고 있다. 이러한 전환 과정에서 데이터의 중요성이 점차 강조되고 있으며, 이는 패션 분야에서도 예외가 아니다. 이에 본 연구는 패션 이미지 데이터를 보다 효율적으로 활용하고 산업 현장에 적용할 수 있도록, 패션 이미지의 ‘데이터 라벨링’ 과정에 주목하였고, AI에 기반한 효율적인 데이터 라벨링 모델을 개발하였다. 특히, 본 연구는 온라인상에 존재하는 방대한 양의 패션 데이터가 이미지와 텍스트 형태로 함께 제공된다는 점에 착안하여, 이를 활용한 AI 라벨링 시스템을 설계하였다. 객체 탐지 기술인 YOLO를 활용해 상의·하의 등 주요 아이템을 정밀하게 탐지하고, 해당 객체에 텍스트 기반 속성값을 자동으로 연결함으로써, 기존 라벨링 방식의 한계—높은 수작업 의존도, 낮은 확장성—를 극복하고자 하였다. 연구 결과, 본 연구에서 개발한 AI 기반 패션 이미지 라벨링 시스템은 기존 방식 대비 높은 정확성과 일관성을 유지하면서도, 라벨링에 소요되는 시간과 비용을 효과적으로 절감할 수 있는 것으로 나타났다. 이를 통해 본 연구는 패션 산업 뿐만 아니라 패션 테크 및 빅데이터 분석을 시행하는 연구자들에게도 실질적인 활용 가능성을 제시하며, 데이터 기반 패션 산업 혁신에 기여할 수 있는 기반을 마련하였다. 본 연구의 보다 구체적인 학문적, 실무적 시사점은 다음과 같다.

5.1. 학문적 시사점

첫째, 본 연구는 패션 이미지 데이터 라벨링 시스템을 개발하기 위해 패션 분야의 연구자와 컴퓨터 공학 분야의 연구자가 협업하여, 보다 패션 분야에 최적화된 AI 기반 라벨링 시스템을 구축하였다는 점에서 학문적 의의를 가진다. 기존 패션 빅데이터 연구에서는 패션 이미지를 활용한 다양한 분석 방법을 제안하였으나, 데이터 라벨링의 정확성과 효율성이 낮아 연구 결과의 신뢰도를 저하시킨다는 한계가 있었다. 그럼에도 불구하고, 패션 분야에서 체계적인 라벨링 시스템을 구축하려는 연구 시도는 매우 제한적이었다. 이에 본 연구에서는 패션 연구 및 산업에서 활용할 수 있는 AI 기반 패션 라벨링 시스템을 제안하고, 이를 실증적으로 검증하였다. 특히, 본 연구는 체계적이고 일관된 계층 구조에 기반한 라벨링 시스템을 제안하고 있으며, 이는 향후 패션 데이터 분석 연구의 정밀도를 향상시키는 데 기여할 수 있을 것으로 기대된다. 나아가, 본 연구에서 개발한 AI 기반 패션 이미지 라벨링 시스템은 높은 정확도를 보였으며, 반복 학습을 통해 더욱 향상된 성능을 기대할 수 있음을 확인하였다. 특히, 본 연구는 기존의 단순한 객체 탐지 및 분류 시스템과 달리, 속성별 태깅의 정확성을 높이고 일관성을 유지하는 방법론을 제시하였다는 점에서 차별성을 가진다. 비록 본 연구는 상의와 하의라는 기본 의류 카테고리에 국한된 탐지 실험이지만, 딥러닝 기반 자동 라벨링 방법론을 패션 이미지 분석에 체계적으로 적용할 수 있음을 실증적으로 보여주었다는 점에서 학문적 의의를 갖는다. 특히 기존 패션 연구에서 주로 수작업에 의존하던 이미지 라벨링 과정을 정량화하고 자동화할 수 있는 기초적 절차와 평가 프레임워크를 제시하였다는 의의를 가진다.

둘째, 본 연구는 패션 분야에서 객체 탐지 모델 YOLO의 적용 가능성을 검토하고, 이를 활용하여 패션 아이템의 속성을 보다 정교하게 인식하고 태깅하는 방법을 제시하였다. 기존 연구에서 사용된 패션 이미지 라벨링 방법은 주로 수작업이나 사전 정의된 태그 세트를 기반으로 수행되어, 새로운 아이템이나 트렌드 변화를 반영하는 데 한계가 있었다. 반면, 본 연구는 이미지와 텍스트 데이터를 함께 활용하여 YOLO 기반 라벨링 시스템의 효율성과 적응성을 높이고자 하였으며, 이는 패션 산업의 급변하는 트렌드에 실시간으로 대응할 수 있는 데이터 구축 방식으로서 의의를 가진다. 특히, 본 연구에서 제안한 AI 기반 라벨링 방법론은 지속적인 학습을 통해 새로운 패션 아이템과 신조어가 등장하는 환경에서도 유연하게 적용될 수 있으며, 이는 패션 데이터 분석의 지속 가능성을 확보하는 데 기여할 수 있을 것으로 보인다. 또한, 향후 AI 기반 패션 데이터 분석 연구에서 보다 정교한 데이터 전처리 기법을 개발하는 데 중요한 기초 자료로 활용될 수 있을 것이다.

5.2. 실무적 시사점

본 연구의 실무적 시사점은 다음과 같다. 첫째, 본 연구에서 제안한 AI 기반 패션 이미지 라벨링 시스템은 온라인 패션 리테일러 및 플랫폼이 대량의 패션 이미지 데이터를 보다 효율적으로 관리하고 활용하는 데 기여할 수 있다. 패션 기업과 브랜드가 성공적으로 DX와 AX를 실현하기 위해서는 보유한 자사 데이터를 체계적으로 관리하는 것이 필수적이다(Kim et al., 2022). 이에 따라 본 연구의 라벨링 시스템은 제품 데이터를 자동으로 정리하고, 이를 기반으로 소비자 관리 및 검색·추천 시스템의 정확도를 높이는 데 도움을 줄 수 있다. 나아가, 해당 시스템은 패션 산업 내 데이터 구축 및 관리 프로세스의 자동화를 통해 운영 효율성과 비용 절감이라는 두 가지 측면에서 실질적인 효과를 제공할 수 있다. 기존에는 패션 이미지 데이터를 정제하고 속성값을 부여하는 데 많은 인력과 시간이 투입되었으나, 본 연구에서 제안한 AI 라벨링 시스템은 반복적이고 수작업 중심의 라벨링 과정을 자동화함으로써 인적 자원 소모를 최소화하고 전체 업무의 생산성을 향상시킬 수 있을 것으로 기대된다.

둘째, 패션 이미지 라벨링은 트렌드 분석 및 수요 예측 모델 구축의 핵심 기반으로 작용할 수 있으며, 이를 통해 보다 정교하고 실효성 높은 예측이 가능해질 것으로 기대된다. 실제로 Choi et al.(2024)의 연구에서도, 방대한 이미지 데이터를 라벨링하여 분석할 경우 트렌드를 보다 효과적으로 예측할 수 있음을 확인한 바 있다. 그러나 기존 연구들은 대규모 데이터를 높은 정확도로 라벨링하는 데 있어 높은 인력 의존도와 처리 시간의 한계를 내포하고 있었다. 이에 반해, 본 연구는 라벨링 자동화를 통해 이러한 한계를 극복하고, 효율적이고 신뢰도 높은 데이터 구축이 가능함을 보여주었다. 결과적으로, 본 연구에서 제안한 AI 기반 패션 라벨링 시스템은 트렌드 분석 및 예측을 위한 데이터 기반을 효과적으로 마련함과 동시에, 패션 산업 내 데이터 관리의 효율성을 극대화할 수 있는 실질적인 방안을 제시하였다. 이는 궁극적으로 패션 기업의 운영 및 전략 수립 과정에서 유용하게 활용될 수 있을 것이다. 특히, 본 연구에서 제안하는 알고리즘은 패션 플랫폼에서 사용하는 비정형 이미지 데이터를 기반으로 유효성을 검증하였고, 높은 성능을 확인하였기 때문에, 인플루언서 이미지, 스트리트 패션 이미지, 사용자 업로드 이미지 등 실제 패션 산업에서 생산되고 사용되는 다양한 비정형 이미지에도 적용 가능성이 높다. 이러한 점에서 본 연구는 산업현장에서의 자동 라벨링 효율을 높이는 동시에, 패션 데이터 기반 서비스를 고도화할 수 있는 기반 기술로서 의미를 갖는다.

마지막으로, 본 연구에서 제안한 라벨링 시스템은 고객 경험 향상 및 개인화 마케팅 전략 수립에도 실질적인 기여를 할 수 있다는 시사점을 가진다. 패션 이미지에 자동으로 부여된 정교한 속성값은 소비자 행동 데이터를 보다 세밀하게 분석할 수 있는 기반이 되며, 이를 통해 소비자에게 맞춤형 제품을 추천하거나 개인의 취향에 부합하는 콘텐츠 큐레이션이 가능해진다. 예를 들어, 특정 소비자가 자주 검색하거나 구매하는 상품의 속성(e.g.,: ‘아우터’ 중 ‘롱코트’)을 자동으로 파악함으로써, 유사한 제품을 추천하거나 관련 마케팅 메시지를 효과적으로 구성할 수 있다. 이는 고객 만족도 및 재구매율을 높이는 데 기여하며, AI 기반 마케팅 자동화 시스템과 연계될 경우 브랜드의 디지털 경쟁력을 강화하는 수단으로 작용할 수 있다. 나아가, 본 연구의 라벨링 모델이 확보한 높은 정확도는 단순한 이미지 유사성 기반 추천을 넘어, 보다 정교한 속성 기반 패션 추천 시스템 구축으로 확장될 수 있다. 기존 패션 플랫폼의 추천 알고리즘은 주로 ‘시각적 유사도’에 의존하였기 때문에, 예를 들어 크롭티 제품이 입력된 경우 동일한 실루엣의 상의만 제시하는 데 그쳤다. 그러나 본 연구에서와 같이 상의·하의의 속성값을 구조화된 데이터로 축적할 수 있다면, 특정 아이템이 어떤 하의와 자주 스타일링 되는지, 어떤 코디 조합이 소비자 선호와 연결되는지를 학습한 추천 시스템이 가능해진다. 즉, ‘크롭티’라는 속성이 탐지된 이미지는 단순히 유사한 크롭티를 추천하는 것을 넘어, 소비자 구매 기반 데이터 또는 코디 빈도 데이터를 결합하여 ‘카고팬츠’, ‘와이드 데님’ 등 함께 스타일링 되는 아이템을 함께 제시하는 방식으로 확장될 수 있다. 비록 본 연구에서는 ‘아이템’ 속성에 한정하여 시스템을 설계했지만, 향후 이를 ‘스타일’, ‘디테일’, ‘소재’와 같은 다른 패션 속성으로 확장하여 학습할 경우, 소비자의 구매 이력을 기반으로 개인의 스타일 성향을 보다 정밀하게 파악할 수 있을 것이다. 이는 고객 맞춤형 추천의 정교함을 한층 높여, 보다 고도화된 개인화 서비스를 제공할 수 있는 기반이 될 것으로 기대된다.

5.3. 한계점 및 추후 연구

본 연구는 위와 같은 학문적·실무적 시사점을 제공함에도 불구하고 몇 가지 한계를 지닌다. 첫째, 본 연구는 AI 기반 패션이미지 라벨링 모델을 구축하는 초기 단계로, 1-depth AI의 정확도를 높이기 위해 학습 데이터를 ‘상의’와 ‘하의’로 제한하여 진행하였다. 이는 AI 모델의 활용 범위를 좁히는 한계로 작용할 수 있다. 따라서 추후 연구에서는 ‘풀바디’까지 포함하여 학습 데이터를 확장함으로써 보다 다양한 패션 이미지에 대한 인식 정확도를 향상시킬 필요가 있다. 둘째, 패션 속성에는 ‘실루엣’, ‘스타일’, ‘컬러’ 등 다양한 요소가 존재하지만, 본 연구는 ‘아이템’ 속성에만 초점을 맞추어 라벨링 시스템을 설계하였다는 한계가 있다. 특히, 시스템의 안정성 확보를 위해 ‘상의’와 ‘하의’에 초점을 맞추어 진행하였는데, 향후 연구에서는 이러한 한계점을 보완하여, 아이템의 카테고리를 확장하고, 보다 다양한 속성을 포괄적으로 반영한 멀티라벨 (1:N) 라벨링 체계를 구축할 필요가 있다. 다양한 속성이 동시에 반영된 정교한 라벨링 데이터셋을 구축하게 된다면, 이는 패션 이미지의 활용 가능성을 한층 확장시킬 수 있으며, 학술적 분석은 물론 실무적 응용 측면에서도 중요한 의의를 지닐 것이다. 마지막으로, 본 연구는 AI 기반 패션 라벨링 시스템의 개념을 제안하고 그 유효성을 검증하였으나, 실제 산업 환경에서의 적용 가능성은 검토하지 못하였다. 따라서 향후 연구에서는 온라인 패션 리테일러와 협업하여 본 연구의 라벨링 시스템이 실무에서 어떻게 활용될 수 있는지를 보다 구체적으로 분석할 필요가 있다. 특히 실제 소비자들의 패션 이미지들을 추가적인 학습 자료로 활용하여 다양한 체형의 모델에서도 안정적으로 작동하는지 확인할 필요가 있다.

References

  • Bernhardt, M., Castro, D. C., Tanno, R., Schwaighofer, A., Tezcan, K. C., Monteiro, M., ... & Oktay, O. (2022). Active label cleaning for improved dataset quality under resource constraints. Nature communications, 13(1), 1161. [https://doi.org/10.1038/s41467-022-28818-3]
  • Bertola, P., & Teunissen, J. (2018). Fashion 4.0. Innovating fashion industry through digital transformation. Research Journal of Textile and Apparel, 22(4), 352-369. [https://doi.org/10.1108/RJTA-03-2018-0023]
  • Bharati, S. (2021). Business intelligence and industry 5.0. Journal of the International Academy for Case Studies, 27, 1-3.
  • Cheng, W. H., Song, S., Chen, C. Y., Hidayati, S. C., & Liu, J. (2021). Fashion meets computer vision: A survey. ACM Computing Surveys (CSUR), 54(4), 1-41. [https://doi.org/10.1145/3447239]
  • Choi, W., Jang, S., Kim, H. Y., Lee, Y., Lee, S. G., Lee, H., & Park, S. (2023). Developing an AI-based automated fashion design system: Reflecting the work process of fashion designers. Fashion and Textiles, 10(1), 39. [https://doi.org/10.1186/s40691-023-00360-w]
  • Choi, W., Kim, H. Y., Choi, B., & Moon, J. (2025). Development of a fashion recommendation system with consumers’ zero-party data applying the CART decision-tree model. Journal of Fashion Marketing and Management: An International Journal, 1-25. [https://doi.org/10.1108/JFMM-07-2024-0284]
  • Choi, W., Lee, Y., & Jang, S. (2024). Diffusion of fashion trend information: a study on fashion image mining from various sources. Fashion and Textiles, 11(1), 30. [https://doi.org/10.1186/s40691-024-00394-8]
  • Clunix. (2024, March 13). AX(AI Transformation): 인공지능 시대를 선도하는 기업의 필수 전략 [Essential strategies for companies leading the ai era]. https://www.clunix.com/insight/it_trends.php?boardid=ittrend&mode=view&idx=770
  • Dai, Y., Chen, Y., Gu, W., Tan, Y., & Liu, X. (2022). Color identification method for fashion runway images: An experimental study. Color Research & Application, 47(5), 1163-1176. [https://doi.org/10.1002/col.22796]
  • Fredriksson, T. (2023). Opportunities, challenges and solutions for automatic labeling of data using machine learning. Chalmers Tekniska Hogskola.
  • Getman, R. R., Green, D. N., Bala, K., Mall, U., Rawat, N., Appasamy, S., & Hariharan, B. (2021). Machine learning (ML) for tracking fashion trends: Documenting the frequency of the baseball cap on social media and the runway. Clothing and Textiles Research Journal, 39(4), 281-296. [https://doi.org/10.1177/0887302X20931195]
  • Gu, X., Gao, F., Tan, M., & Peng, P. (2020). Fashion analysis and understanding with artificial intelligence. Information Processing & Management, 57(5), 102276. [https://doi.org/10.1016/j.ipm.2020.102276]
  • Hong, T., Kim, J., & Shin, J. (2016). A user sentiment classification using Instagram image and text analysis. Smart Media Journal, 5(1), 1-8.
  • Hsu, W. Y., & Lin, W. Y. (2020). Ratio-and-scale-aware YOLO for pedestrian detection. IEEE Transactions on Image Processing, 30, 934-947. [https://doi.org/10.1109/TIP.2020.3039574]
  • Jang, S., Kim, H. Y., Kim, S., Choi, W., Jeong, J., & Lee, Y. (2022). Development of online fashion thesaurus and taxonomy for text mining. Journal of the Korean Society of Clothing and Textiles, 46(6), 1142-1160. [https://doi.org/10.5850/JKSCT.2022.46.6.1142]
  • Kim, H. Y., Choi, W., Lee, Y., & Jang, S. (2022). Current status of development and practice of artificial intelligence solutions for digital transformation of fashion manufacturers. Journal of Fashion Business, 26(2), 28-47. [https://doi.org/10.12940/jfb.2022.26.2.28]
  • Kim, C. E, & Lee, J. H. (2018). Trends of big data and artificial intelligence in the fashion industry. Journal of the Korean Society of Clothing and Textiles, 42(1), 148-158. [https://doi.org/10.5850/JKSCT.2018.42.1.148]
  • Kim, S. (2025, February 12). 섬유패션산업의 AI 전환(AX) 혁신 방안 제시 [Proposing innovative AI transformation (AX) strategies for the textile and fashion industry]. Sanupin news. https://www.sanupin-news.kr/news/articleView.html?idxno=10436
  • Klostermann, J., Plumeyer, A., Böger, D., & Decker, R. (2018). Extracting brand information from social networks: Integrating image, text, and social tagging data. International Journal of Research in Marketing, 35(4), 538-556. [https://doi.org/10.1016/j.ijresmar.2018.08.002]
  • Kwon, H. (2024, March 10). 대세는 DX에서 AX로… IT 서비스 기업들 ‘AI 공략’ 가속 [The trend is shifting from dx to ax… it ser-vices companies accelerate their ai strategies]. Ddaily. https://www.ddaily.co.kr/page/view/2024031011414206266
  • Lee, W. Y. (2022). Analysis of fashion labeled data for artificial intelligence learning. Journal of Korean Society of Design Culture, 28(3), 355-369. [https://doi.org/10.18208/ksdc.2022.28.3.355]
  • Lim, J. O., Choi, W. J., & Choi, B. J. (2023, November). Automated fashion clothing image labeling system. International Conference on Intelligent Human Computer Interaction (pp. 3-8). Cham: Springer Nature Switzerland. [https://doi.org/10.1007/978-3-031-53830-8_1]
  • Lim, J. O., Choi, W. J., & Choi, B. J. (2024). Automatic fashion item labeling system using YOLO and a high-level object detection model. Journal of The Korea Society of Computer and Information, 29(11), 41-48. [https://doi.org/10.9708/jksci.2024.29.11.041]
  • Moon, S., & Kamakura, W. A. (2017). A picture is worth a thousand words: Translating product reviews into a product positioning map. International Journal of Research in Marketing, 34(1), 265–85. [https://doi.org/10.1016/J.IJRESMAR.2016.05.007]
  • Mots'oehli, M. (2024, July). Assistive image annotation systems with deep learning and natural language capabilities: A review. 2024 International Conference on Emerging Trends in Networks and Computer Communications (ETNCC) (pp. 1-9). IEEE. [https://doi.org/10.1109/ETNCC63262.2024.10767526]
  • next generation MerchanDising [XMD]. (2024, June 07). 패션 DX/AI 테크의 이해와 디지털 전환의 여정 [Understanding fashion DX/AI tech and the journey of digital transformation]. https://www.xmd.co.kr/board/news?viewMode=view&ca=&sel_-search=&txt_search=&page=11&idx=419
  • Park, J. (2025, May 2). 안정기 접어든 국내 AI 산업, 2024년 6.3조원 시장 형성 [South korea’s ai industry enters a stable phase, forming a 6.3 trillion Korean won (krw) market in 2024]. IT daily. http://www.itdaily.kr/news/articleView.html?idxno=232711
  • Park, S., Hwang, S., & Jang, B. (2024). Exploring data augmentation ratios for YOLO-based multi-category clothing image classification by model size. Journal of Internet Computing & Services, 25(5), 95-105. [https://doi.org/10.7472/jksii.2024.25.5.95]
  • Rudniy, A., Rudna, O., & Park, A. (2024). Trend tracking tools for the fashion industry: the impact of social media. Journal of Fashion Marketing and Management: An International Journal, 28(3), 503-524. [https://doi.org/10.1108/JFMM-08-2023-0215]
  • Seo, S. (2018). The fashion industry’s future image in the fourth industrial revolution according to consumer innovativeness -an application of frequentism approach and bayesian inference- . Journal of Korean Society of Costume, 68(5), 143-156. [https://doi.org/10.7233/jksc.2018.68.5.143]
  • Shi, M., Chussid, C., Yang, P., Jia, M., Dyk Lewis, V., & Cao, W. (2021). The exploration of artificial intelligence application in fashion trend forecasting. Textile Research Journal, 91(19-20), 2357-2386. [https://doi.org/10.1177/00405175211006212]
  • Song, X., Zhang, X., Ji, J., & Liu, Y. (2023). Multi-scale superpixel based hierarchical attention model for brain CT classification. Journal of Visual Communication and Image Representation, 91, 103773. [https://doi.org/10.1016/j.jvcir.2023.103773]
  • Tan, Z., Li, D., Wang, S., Beigi, A., Jiang, B., Bhattacharjee, A., ... & Liu, H. (2024). Large language models for data annotation and synthesis: A survey. arXiv preprint arXiv:2402.13446, . [https://doi.org/10.18653/v1/2024.emnlp-main.54]
  • Vijayaraj, A., Vasanth Raj, P. T., Jebakumar, R., Gururama Senthilvel, P., Kumar, N., Suresh Kumar, R., & Dhanagopal, R. (2022). Deep learning image classification for fashion design. Wireless Communications and Mobile Computing, 2022(1), 7549397. [https://doi.org/10.1155/2022/7549397]
  • Zhao, L., Li, M., & Sun, P. (2024). Neo-fashion: A data-driven fashion trend forecasting system using catwalk analysis. Clothing and Textiles Research Journal, 42(1), 19-34. [https://doi.org/10.1177/0887302X211004299]

Fig. 1.

Fig. 1.
Examples of image and text data provided by fashion platforms. www.musinsa.com

Fig. 2.

Fig. 2.
Preprocessing example based on confidence scores (drawn by authors).

Fig. 3.

Fig. 3.
Schematic diagram of the proposed AI-based fashion image labeling model (drawn by authors).