自動運転車(AV)のパーセプションシステムの物体検出モデルを学習する際には、実世界のデータが不可欠です。しかし、現実の世界では、トレーニングに必要なすべてのデータを簡単に提供できないことがあります。例えば、自転車やオートバイといったクラスは、歩行者や自動車に比べて発生頻度が低いため、実世界のデータで学習したパーセプションモデルでは正しく検出することが難しい場合があります(図1)。同様に、事故のような最も危険な状況は、テストドライブの最後の数パーセントに隠されているかもしれません。

図1:実世界のデータセットでは、自転車の存在感が薄いことが多い。このため、実世界のデータのみで学習したパーセプションモデルでは、自転車を検出することは困難である。
現実の世界では、存在しないクラスやロングテールイベントの発生頻度が低いにもかかわらず、物体検出モデルは、一般的なクラスや状況と同様に、それらを処理できるように訓練する必要があります。ここ数年、いくつかのパーセプションチームでは合成データを利用して、実世界のデータセットの限界に対処しようとしています。実世界のデータと合成データの間には、まだドメインギャップがあることを認識しておく必要がありますが、最近の手法では、合成データの改良と新しい機械学習の学習戦略を組み合わせることで、このギャップを克服しつつあります。
この使用例を示すために、Applied Intuition のパーセプションチームは、実世界のデータセットで見つかったクラスの偏りに対処するための補助的なトレーニングリソースとして合成データを使用するケーススタディを実施しました。この研究では、合成データがクラスの偏りを緩和し、実世界のデータが限られている領域への対処に役立つ可能性があることを示しています。

ケーススタディの全文を読むためにはご登録が必要です。
目標と範囲
このケーススタディでは、Motional が提供しているデータセットである
nuImages をベースラインのトレーニングデータセットとして使用しています。このデータセットでは、自転車というクラスの出現頻度は、自動車や歩行者などの著名なクラスに比べて 170 倍も低くなっています(図2)。
.jpg)
図2:今回のケーススタディで使用したnuImagesトレーニングセットのクラス分布。人と車の出現頻度が高い(今回使用した5つのクラスのうち、合計で約90%)。自転車 (Cyclist クラス) は0.3%しか出現しません。
このケーススタディでは、合成データセットを生成して使用し、パーセプションアルゴリズムの自転車に対する物体検出性能を向上させるとともに、他のクラスに対する物体検出性能を維持または向上させます。また、合成データを用いることで、モデルの物体検出性能を向上させるために必要な実世界のデータ量を減らせるかどうかについても検討します。
実施内容
このケーススタディでは以下のステップで構成されています。
- nuImagesデータセットの実世界のデータのみで学習したベースラインモデルを分析する。
- 実世界のデータセットに含まれる Cyclistクラスの出現頻度が不足していることに着目し、ラベル付きの合成データを生成する。合成データセットでは、より多くのCyclistクラスの例を作成する。
- 上記の合成データを、nuImagesデータに加えて、補助的な学習リソースとして使用する。
1. ベースラインモデルの分析
まず、実世界のnuImagesデータにおいて、クラスの偏りに対してパーセプションモデルがどのように反応するかを測定します。Cascade Mask R-CNNのパーセプションモデルを、このデータセットで収束するまで学習しました。その結果、 Cyclist クラスでの物体検出性能は、他のすべてのクラスに比べて低くなりました(図3)。
.jpg)
図3:ベースラインパーセプションアルゴリズムを nuImagesデータで学習させた場合の物体検出性能。クラスを分類せずに計測した性能(バウンディングボックスやセグメンテーション結果)については平均再現率(mAP)スコア(すなわち、オブジェクト検出の精度指標)を測定結果として、クラス毎 (車両やトラック、自転車、オートバイ、歩行者など) の性能は 0:5:0.95 で測定した IoU 値(予測された領域がどれだけグランドトゥルースの領域と重なっているかを表す指標)の平均値を表示しています。
2. 合成データの生成
次に、合成データを生成して、割合の少ない Cyclist クラスをアップサンプルします(図4)。ここでは、手続き型の3D環境生成、シナリオの自動作成、合成データ生成パイプラインを用いて、このプロセスを実現しています。
.jpg)
図4:Cyclist クラスに影響を与えるクラス偏りを対象にした合成データセットの例。このデータセットでは、Cyclist クラスが27.4%の確率で出現しています。