10分の1以下の学習データで2倍の成功率、東芝がオフライン強化学習AI開発

画像:株式会社東芝より引用

株式会社東芝は2024年5月10日、同社が少量データを学習したAIで複雑なロボット制御するための「オフライン強化学習」による作業シミュレーションにおいて、従来比約10分の1以下の学習データで従来比約2倍の操作成功率72%を達成したと発表しました。

東芝によると、同社のAI技術は、ピッキングや物品の配置など工業用ロボットに導入し、業務の自動化を目指すために開発されました。従来、工業用ロボットは実際に作業した内容を記録し反復する「ティーチング」と呼ばれる手法が用いられてきましたが、動作が機械的になるため、状況変化への対応が求められたり、複数段階における作業を自動化することは難しく、複雑な機械への導入が課題となっていました。

そこで東芝は、あらかじめ作成されたデータを用いて学習を行う「オフライン強化学習」によるAI開発に着手しました。オフライン強化学習は精度維持のために多くのデータの準備や学習に労力が必要でしたが、同社は従来比約10分の1以下に相当する100程度の学習データで、高精度の作業成功率を誇るAI生成に成功。複数の操作を含む公開ベンチマーク環境でシミュレーション評価をしたところ、従来比約2倍の操作成功率72%を達成しました。

製造業は現在、少子高齢化による人手不足問題が課題となっている業界です。同社は解決策のひとつとしてAIによるロボット自動化を挙げており、実環境での有効性をさらに検証し、精度の向上と早期の実用化を目指すとしています。

参照世界初、少量データによる「オフライン強化学習」で複雑なロボット操作を高精度に制御するAIを開発