【後編】SECCON 14 電脳会議 イベントレポート|AI時代におけるCTFの意義&脆弱性診断への「活かし方」

GMOインターネットグループが協賛したSECCON 14 電脳会議。午前中に行われたワークショップに続いて、午後からはGMO Flatt Security株式会社(以下、Flatt)の石川による講演・「LLMがCTFと脆弱性診断をどう変えていくのか」が行われました。
会場の外まで立ち見が出るなど大盛況となった本講演。後編レポートでは、多くのSECCON参加者の注目を集めた講演の内容や会場の様子をお伝えします。

Open Conference

講演者:GMO Flatt Security株式会社 プロフェッショナルサービス部 石川 琉聖

講演タイトル:LLMがCTFと脆弱性診断をどう変えていくのか

日時:2/28(DAY1) 14:00-14:20
会場:Room0
詳細はこちらから

LLMが変えたCTFの「解き方」と「意義」

CTFプレイヤー・CTF運営者・脆弱性診断士という「三刀流」で活躍する石川は、FlattでWebの脆弱性診断やペネトレーションテストに従事するかたわら、SECCON Beginners CTFやDIVER OSINT CTFといったCTFの運営にも携わっています。

講演の始めに語られたのは、「LLMがどのようにCTFを変化させたか」について。従来のCTFでは、対象となるサービスの仕様チェックやフラグ位置の特定、攻撃ベクトルの検討、防御機構のバイパス確認といった複数のステップを「人間が思考しながら」進めていく必要がありました。

しかしLLMの登場により、「あらかじめLLMの手足となるツール環境さえ整えておけば、あとはLLMに委ねるだけ」というシンプルな流れに変わりつつあるそうです。

具体例として紹介されたのは、石川自身が参加した2つのCTFでした。1つ目は、リバースエンジニアリング・OSINTなど約50問が出題された総務省主催の全国型CTFコンテストです。国内から約500人が参加したこの大会において、Claude Agent SDKを用いてClaude CodeをCTF用にカスタマイズしたツールを準備し、実際に活用したとのこと。

大会ではさらにLSP・MCP等のツールやサンドボックス環境なども事前に整備したうえで、競技中はこれらのLLMツールを稼働させ続けたことで2位になれたと紹介。こうした動きについても、「最終的に人間が行ったのは問題文のダウンロードとフラグの提出のみでした。ここも自動化できたのですが、規約との兼ね合いを考えて人間がやるという方針を取りました」と振り返ります。

2つ目の事例は、SECCON CTF 14予選のJailジャンルで出題された「broken-json」という問題です。こちらも同様のLLM環境を用意したうえで、LLMが自身のコードをデバッグしやすいよう問題コードにprintデバッグを追加したという実例を示します。

このCTFでは、他にも問題に使われたサードパーティライブラリのリポジトリをあらかじめクローンしておくなどの準備を15分程度で行い、以降はLLMに解かせるだけで正解にたどり着けたという自らの体験を共有しました。

人力で行うよりも速く正確なLLMが課題を解くことに対して、CTFという競技はすでに「終わって」しまったのかという疑問を持つ方もいるなか、石川は「まだギリギリ役に立つ」と語り、その意義が失われていないと主張します。

複雑なCTFツールを使って解くような低級~中級レベルの問題こそ競技性が失われつつありますが、石川は「現在のLLMやツールの力では複雑な問題が結構解けないことがまだあります」と語ります。この講演の裏で行われているSECCON本選の問題も、LLMでは対処できない高レベルな問題です。

こうした問題を解くために求められる、「方針」を立てて解法を主導したりといった戦略的な部分は、まだ人間の領分なのです。

現状では「大きな1つの課題を細かい複数の問題に分解し、それぞれを1つ1つ解いていく」といった仕事は人間が行っている一方で、「来年には話が変わってくるかもしれない」と、AI技術の爆発的な進歩によって人間の果たす役割がさらに変化する可能性にも触れました。

CTFで培ったスキルは脆弱性診断でも活きる

続いて語られたのは、CTFで得られるスキルと実際の脆弱性診断の関連性です。石川さんは自らと同じくFlattでCTFプレイヤーとして活躍するhamayanhamayanさんのブログを引用しながら、「CTFで出題される脆弱性と実際のプロダクトセキュリティの課題には、ある程度重なる部分があります」と提示しました。

「各種脆弱性の根本原因への理解や、どのような実装が脆弱性を招くかという知識は、CTFと実務の双方で一定の関連性があります」と熱弁をふるう石川。実際の診断で役立つCTFスキルとして挙げられたのは、「問題の本質を見抜く力」と、診断時に仮説を立てて検証を繰り返していく「仮説検証の力」の2点だといいます。

とくに「問題の本質を見抜く力」については、「どこに脆弱性があるのか、攻撃された場合にはどのような影響が生じるのかを把握し、優先度を考えながらリスクの大きい箇所に重点を置いた診断ができる能力」(石川)と定義したうえで、LLMが台頭した現在においても極めて重要な能力だと強調しました。

さらに、現在ではこれらに加えて「LLMを使いこなす力」も不可欠のスキルになりつつあります。LLMが脆弱性を発見するために必要なContext Engineering能力や、診断環境に合わせてその場で適切なツールを作成するといった臨機応変さも求められているのです。

実際の診断現場では、Flattが展開するAIエージェントであるTakumiとClaude Codeを第2の診断員として活用し、AIと人間の診断を並列で進めるスタイルが定着しつつあるとのこと。

2025年11月から提供開始しているブラックボックス診断においても、Takumiがブラウザの立ち上げからWebサイトをクロールし、攻撃ペイロードの試行・修正までをすべて自動化したと紹介しました。

CTF運営として行う、4つの「LLM対策」

最後に語られたのは、CTFが今後どのように変わっていくのかという考察です。運営者の立場として、石川は「競技性の高いCTFほど、LLMを用いるプレイヤーを無視できなくなっている」と指摘します。

CTFはあくまで競技性のあるエンターテインメントであり、LLMで解ける問題ばかりになれば、LLMの性能や使用できるトークンが勝敗を左右する「Pay to Win」の環境となりかねません。そのためLLMの使用を規制するのも1つの方向性ですが、プレイヤー側がLLMを「使っていない」と証明する手段がないため、公平性の観点からも実現するのは困難です。

こうした状況の中で運営側が取れる対策として、4つのアプローチを提示しました。

1つ目は、さまざまなモデルやツールを使った事前レビューの実施です。これはClaudeやChatGPTをはじめとする複数のモデルやMCPツール等を組み合わせても解けないことを事前に確認するというものです。

しかし膨大な工数・時間をかけても完璧に確認することは現実的でなく、実質的な問題難化にもつながるのがデメリットです。石川は「スポンサーも巻きこんで、作問チーム全体でLLMを使えるような環境や仕組みを作ることも非常に重要です」と訴えます。

2つ目はLLMボット対策で、こちらは現在とくに深刻な問題が生じているOSINT系のCTFにおいて打てる対策です。

一般的なCTFではフラグの文字列を見つければ一目でわかりますが、OSINT系では座標や地名がフラグになるため、座標単体ではその文字列がフラグなのかを判別しづらいという特性があります。

「LLMの登場以前から、日時などを総当たりで列挙してスコアサーバに投げるといった行為は存在していました。しかしLLMの登場以降は、地名のような列挙しづらい情報についても確度の高い候補を100件単位で生成して、一斉送信できるようになったんです」と環境の変化を語ります。

こうした環境下でフェアな競技を実現するために、運営側に回ったDIVER OSINT CTFでは「3回連続の誤答で15分間の提出制限をかける」というレートリミットを導入し、参加者からも好評を得たと紹介しました。

3つ目は最新技術のキャッチアップです。AI技術は日進月歩のため、「作問から解説までの間に強力な新モデルが公開されると事前レビューをやり直す必要があります。なので、祈ることも大事ですね」とユーモアを交えて語り、会場からも笑いが起きました。

最後の4つ目は、「無理なものは無理」という諦めです。LLM対策が困難な場合には、競技コンテンツとしてのCTFや、解ける喜びを伝える教育的なCTFへと方向性を転換することも選択肢になりうると提案しています。

意義は変わっても、CTFの形は残る

そしてプレイヤー側の見解として、Flattに所属するCTFプレイヤー4名からの展望が紹介されました。

CTFの存続については「人間にしか解けない領域はある程度狭まるが、CTFは続いていく」「CTFはLLMでの挑戦と新テクニックを楽しむ場として残る」と好意的な見方を示しつつ、単に問題を解けたかどうかだけを楽しむのではなく、その過程(解法)を理解する楽しみも感じてほしいとしていたのが印象的でした。

また「LLMでいかに効率的に問題を解くかという方向にCTFの競技性そのものが変容していくのではないか」と、CTFの性質そのものが変化するのではないかという指摘もありつつ、「LLMを活用し、プレイヤーはより効率的に知識を吸収するようになるだろう」という見方も提示されています。

そして石川自身は「教育性の高いCTFほど問題の難度が上がり、相対的に教育的価値が増していく。問題が難化するにしたがって、初心者を含むチームの参加障壁が上がるでしょう」と、教育的側面の意義を強調しました。

また質疑応答では、「LLMで効率的に学習できるようになる一方で、答えだけをもらうプレイヤーが増えると基礎的な学問が疎かになるのではないか」という質問が飛びました。

これに対して石川は、「一部のプレイヤーは効率化によって多くの問題が解けるようになる一方で、LLMに頼りきるプレイヤーも出てくるだろう。プレイヤー間の能力差はさらに広がっていくかもしれない」と回答。質問者の懸念を正しいものだとしつつ、だからこそ教育的なCTFの意義があるのだとしています。

講演の最後に、石川は「LLMの台頭によって、深い知識が問われる問題がより残るようになっていること」「AI時代だからこそCTFで養われる問題解決力の重要性は変わらないこと」の2点を改めて強調しました。

CTFは今後、その方向性こそ大きく変化していくものの、一定の価値は今後も残り続けるとの展望が示され、セッションは締めくくられました。

ブログの著者欄

技術広報チーム

GMOインターネットグループ株式会社

イベント活動やSNSを通じ、開発者向けにGMOインターネットグループの製品・サービス情報を発信中

採用情報

関連記事

KEYWORD

TAG

もっとタグを見る

採用情報

SNS FOLLOW

GMOインターネットグループのSNSをフォローして最新情報をチェック