AI 研究の世界で、ゲーム領域から現実世界へ技術をスケールさせる挑戦は多く語られてきました。しかし実際に、ゲームで育てたAIを“公道を走る自動運転AI”に進化させた研究者はそう多くありません。
第5回京大ミートアップ<後編>は、強化学習の“限界”に挑むTuring妹尾氏のセッションをご紹介します。
目次
Session3 『強化学習の限界を探る E2E 自動運転開発』

妹尾 卓磨 氏
Turing株式会社 スタッフリサーチャー
SONY時代:ゲームの中に“最強レーサーAI”を生み出す
妹尾氏がまず向き合ったのは、ソニーのレースゲーム「グランツーリスモ」を舞台に、強化学習で世界最強レーサーを超えるAI「GT Sophy」を作るプロジェクトでした。このAIはただ速いだけでなく、レースマナーまで理解し、人間のトッププレイヤーを凌駕。成果はNature誌に掲載され、世界的に注目されました。特に象徴的だったのが、その学習環境です。
- SONY社内クラウドで大量の PlayStation を同時稼働
- AI が自力でレースを“何十万回も走り続ける”訓練環境
- 制御・戦略・接触回避など複雑な行動を統合的に学習
つまり「大規模シミュレーション × 強化学習 × 実行環境のスケール」の力を最大限活用した研究でした。この経験が、後の自動運転研究の大きな土台となります。
Turingでの挑戦:公道を走る“学習型ドライバーAI”へ
Turing転職後、妹尾氏が挑んでいるのは 画像入力のみで運転判断を行うEnd-to-End自動運転。技術はすでに高難度の走行レベルに到達していて、さらにその先を目指す技術基盤を構築しているとのことでした。
実写級3D再構成シミュレーター「ATLAS」
3D Gaussian Splatting技術を用いて、
- 実車走行の映像をそのまま3D化
- 任意の視点で自由に再シミュレーション
- “歩行者がいる左折1000シナリオ”などを自動生成
といった“現実をコピーして量産する”次世代シミュレーション環境を構築。
これにより、従来のゲームエンジンでは再現困難だった複雑な運転状況でも、大量の学習データを瞬時に生成できます。
大規模計算資源 × 強化学習
Turingでは全体として富岳の約40%に相当する計算リソースを保有しており、この計算基盤があるからこそ、必要なタイミングで数百〜数千並列の強化学習実験を回せる環境が整っています。
強化学習を活用することで、失敗から学ぶことや、運転行動の因果関係を捉えること、制御まで含めた最適化が可能になります。その結果、これまで苦手だった右折動作などについても改善が進み、入社後わずか3カ月で日本初となるE2E強化学習モデルの公道走行を実現しました。
次の一歩:VLA(Vision-Language-Action)モデルへ
Turingはさらに、画像・言語・制御を統合した VLAモデル へと研究を拡大しています。
これにより、
- シーンを言語で説明しながら状況判断
- レアケースにも柔軟に対応
- “説明可能な自動運転AI” の可能性
が開けつつあり、“どんな状況でも運転できるAIドライバー”へ向けた布石が打たれています。
強化学習は、ゲームを越え、現実へ踏み出した
ゲームの中で鍛えたAIが、現実世界で人と一緒に道路を走り始めようとしています。妹尾氏の挑戦は、強化学習が持つ“試行錯誤の力”を最大化しながら、その限界を押し広げていくプロセスそのものでした。
ゲームから公道へ。 AIが“運転を学ぶ”時代は、もう始まっています。
妹尾氏のセッション映像はこちらから
ブログの著者欄
採用情報
関連記事
KEYWORD
CATEGORY
-
技術情報(554)
-
イベント(201)
-
カルチャー(54)
-
デザイン(53)
-
インターンシップ(1)
TAG
- "eVTOL"
- "Japan Drone"
- "ロボティクス"
- "空飛ぶクルマ"
- 5G
- Adam byGMO
- AdventCalender
- AGI
- AI
- AI 機械学習強化学習
- AIエージェント
- AI人財
- AMD
- APT攻撃
- AWX
- BIT VALLEY
- Blade
- blockchain
- Canva
- ChatGPT
- ChatGPT Team
- Claude Team
- cloudflare
- cloudnative
- CloudStack
- CM
- CNDO
- CNDT
- CODEBLUE
- CODEGYM Academy
- ConoHa
- ConoHa、Dify
- CS
- CSS
- CTF
- DC
- design
- Designship
- Desiner
- DeveloperExper
- DeveloperExpert
- DevRel
- DevSecOpsThon
- DiceCTF
- Dify
- DNS
- Docker
- DTF
- Excel
- Expert
- Experts
- Felo
- GitLab
- GMO AIR
- GMO AIロボティクス大会議&表彰式
- GMO DESIGN AWARD
- GMO Developers Day
- GMO Developers Night
- GMO Developers ブログ
- GMO Flatt Security
- GMO GPUクラウド
- GMO Hacking Night
- GMO kitaQ
- GMO SONIC
- GMOアドパートナーズ
- GMOアドマーケティング
- GMOイエラエ
- GMOインターネット
- GMOインターネットグループ
- GMOクラウド]
- GMOグローバルサイン
- GMOコネクト
- GMOサイバーセキュリティbyイエラエ
- GMOサイバーセキュリティ大会議
- GMOサイバーセキュリティ大会議&表彰式
- GMOソリューションパートナー
- GMOデジキッズ
- GMOブランドセキュリティ
- GMOペイメントゲートウェイ
- GMOペパボ
- GMOメディア
- GMOリサーチ
- GMO大会議
- Go
- GPU
- GPUクラウド
- GTB
- Hardning
- Harvester
- HCI
- INCYBER Forum
- iOS
- IoT
- ISUCON
- JapanDrone
- Java
- JJUG
- K8s
- Kaigi on Rails
- Kids VALLEY
- KidsVALLEY
- Linux
- LLM
- MCP
- MetaMask
- MySQL
- NFT
- NVIDIA
- NW構成図
- NW設定
- Ollama
- OpenStack
- Perl
- perplexity
- PHP
- PHPcon
- PHPerKaigi
- PHPカンファレンス
- Python
- QUIC
- Rancher
- RPA
- Ruby
- Selenium
- Slack
- Slack活用
- Spectrum Tokyo Meetup
- splunk
- SRE
- sshd
- SSL
- Terraform
- TLS
- TypeScript
- UI/UX
- vibe
- VLAN
- VS Code
- Webアプリケーション
- WEBディレクター
- XSS
- アドベントカレンダー
- イベントレポート
- インターンシップ
- インハウス
- オブジェクト指向
- オンボーディング
- お名前.com
- カルチャー
- クリエイター
- クリエイティブ
- コーディング
- コンテナ
- サイバーセキュリティ
- サマーインターン
- システム研修
- スクラム
- スペシャリスト
- セキュリティ
- ソフトウェアテスト
- チームビルディング
- デザイナー
- デザイン
- テスト
- ドローン
- ネットのセキュリティもGMO
- ネットワーク
- ビジネス職
- ヒューマノイド
- ヒューマノイドロボット
- フィジカルAI
- プログラミング教育
- ブロックチェーン
- ベイズ統計学
- マイクロサービス
- マルチプレイ
- ミドルウェア
- モバイル
- ゆめみらいワーク
- リモートワーク
- レンタルサーバー
- ロボット
- 京大ミートアップ
- 人材派遣
- 出展レポート
- 動画
- 協賛レポート
- 基礎
- 多拠点開発
- 大学授業
- 宮崎オフィス
- 展示会
- 広告
- 強化学習
- 形
- 応用
- 情報伝達
- 技育プロジェクト
- 技術広報
- 技術書典
- 採用
- 採用サイトリニューアル
- 採用活動
- 新卒
- 新卒研修
- 日本科学未来館
- 映像
- 映像クリエイター
- 暗号
- 業務効率化
- 業務時間削減
- 機械学習
- 決済
- 物理暗号
- 生成AI
- 色
- 視覚暗号
- 開発生産性
- 開発生産性向上
- 階層ベイズ
- 高機能暗号
PICKUP