자율주행차(AV) 퍼셉션 시스템을 위한 객체 감지 모델 훈련 시 실제 데이터는 필수적입니다. 불행히도 실제 세계는 성공적인 훈련에 필요한 모든 데이터를 언제나 쉽게 제공해 주지 않습니다. 예를 들어, 자전거 및 오토바이 운전자와 같은 클래스는 보행자 및 자동차보다 빈도가 적기 때문에 실제 데이터를 통해 훈련된 퍼셉션 모델은 이를 정확히 감지하기 어렵습니다(그림 1). 마찬가지로 테스트 주행의 마지막 몇 퍼센트에 사고와 같은 가장 위험한 상황이 숨겨져 있을 수도 있습니다.

그림 1: 자전거 운전자는 종종 실제 데이터 세트에서 과소 대표됩니다.. 이런 이유로 실제 데이터로만 훈련된 퍼셉션 모델은 자전거 운전자를 감지하기 어렵습니다.
과소 대표되는 클래스와 롱테일 이벤트의 경우 실제 세계에서 발생하는 빈도는 적지만 객체 감지 모델은 더 일반적인 클래스 및 상황과 동일하게 이를 처리할 수 있도록 훈련되어야 합니다. 지난 몇 년 동안 퍼셉션 팀은 실제 데이터 세트의 이러한 한계를 일부 보완하기 위해 합성 데이터를 활용하기 시작했습니다. 현실 세계와 합성 데이터 사이에는 인정해야 하는 도메인 격차가 여전히 존재하지만 최근의 방식은 개선된 합성 데이터와 새로운 머신 러닝 훈련 전략을 결합하여 이 격차를 극복하고 있습니다.
이 사용 사례를 증명하기 위해 Applied Intuition의 퍼셉션 팀은 합성 데이터를 보완 훈련 리소스로 사용하여 실제 데이터 세트에서 발견되는 클래스 불균형을 해결하는 사례 연구를 수행했습니다. 이 연구는 합성 데이터를 통해 클래스 불균형을 완화하고 실제 데이터의 한계를 보완할 수 있다는 것을 보여줍니다.

본 사례연구 전체를 읽으려면 등록해 주십시오.
목표 및 범위
이 사례 연구에서는 모셔널(Motional)에서 일반적으로 사용하는 데이터 세트인
nuImages를 베이스라인 훈련 데이터 세트로 사용합니다. 데이터 세트에서 자전거 운전자 클래스는 자동차 및 보행자와 같이 현저히 많이 발생하는 클래스보다 170배 적게 발생합니다(그림 2).
.jpg)
그림 2: 사례 연구에 사용된 nuImages 훈련 세트의 전체 클래스 중 5개 클래스의 분포. 보행자와 자동차의 빈도가 더 높습니다(이 연구에서 사용된 5가지 클래스 총합의 약 90%). 자전거 운전자의 빈도는 0.3%밖에 되지 않습니다.
이 연구는 합성 데이터 세트를 생성하고 사용하여 자전거 운전자에 대한 퍼셉션 알고리즘의 객체 감지 성능을 개선하는 동시에 기타 클래스의 객체 감지 성능을 유지하거나 개선합니다. 또한 합성 데이터 사용을 통해 모델의 객체 감지 성능을 개선하는 데 필요한 실제 데이터의 양을 줄일 수 있는지 살펴봅니다.
구현
연구는 다음 단계로 구성됩니다.
- nuImages 데이터 세트의 실제 데이터로만 훈련된 베이스라인 모델을 분석합니다.
- 실제 데이터 세트에서 자전거 운전자 클래스의 대표성 부족을 특히 대상으로 하는 레이블링된 합성 데이터를 생성합니다. 자전거 운전자의 더 많은 예시가 합성 데이터 세트에서 생성됩니다.
- 위의 합성 데이터를 nuImages 데이터의 추가 훈련 리소스로 사용합니다.
1. 베이스라인 모델 분석
우선 퍼셉션 모델이 실제 nuImages 데이터의 클래스 불균형에 어떻게 반응하는지 측정합니다. Cascade Mask R-CNN 퍼셉션 모델은 이 데이터 세트를 통해 수렴될 때까지 훈련됩니다. 그 결과로 나타나는 자전거 운전자 클래스의 객체 감지 성능은 다른 모든 클래스에 비해 낮습니다(그림 3).
.jpg)
그림 3: nuImages 데이터를 통해 훈련하는 경우 베이스라인 퍼셉션 알고리즘의 객체 감지 성능. 바운딩 박스, 세그먼트에 대한 합산 성능과 클래스(자동차, 트럭, 사이클리스트, 모터사이클, 사람) 당 성능은 바운딩 박스와 분할 평균 mAP(mean average precision, 평균 정밀도) 점수(즉, 객체 감지 정확도)로 측정되며 0:5:0.95 IoU(Intersection-over-Union) 값(즉, 예측된 바운더리가 실제와 겹치는 정도)에 대한 평균으로 보고됩니다.
2. 합성 데이터 생성
다음으로, 과소 대표되는 자전거 운전자 클래스를 업샘플링하기 위해 합성 데이터가 생성됩니다(그림 4). 본 사례 연구에서는 이 프로세스를 활성화하기 위해 절차적 3D 환경 생성, 자동 시나리오 생성 및 합성 데이터 생성 파이프라인을 사용합니다.
.jpg)
그림 4: 자전거 운전자 클래스에 영향을 미치는 클래스 불균형을 대상으로 하는 합성 데이터 세트 예시. 이 데이터 세트에서 자전거 운전자는 27.4% 발생합니다.