開発者向けブログ・イベント

エキスパート×SECCON実行委員長・三村が語る！SECCON 13 電脳会議2025開催レポート

2025年3月1日および2日の2日間、浅草橋ヒューリックホール＆カンファレンスにおいて SECCON の電脳会議が開催されました。電脳会議のイベントの様子について、SECCONの実行委員長でもありGMOインターネットグループのエキスパートとして活動する三村聡志よりお伝えします！ SECCON とは？実践的情報セキュリティ人材の発掘・育成、技術の実践の場の提供を目的として、競技やワークショップを提供するイベントです。世界でもトップレベルの技術力を競い合う CTF である「SECCON CTF」、CTF の入門者向けワークショップである「SECCON Beginners」や「CTF for GIRLS」、3月に開催される SECCON 最大のオフラインイベントである「電脳会議」などを中心として、あらゆる知見や機会が交わる「ハブ」になれるよう活動をしています。引用元： https://www.seccon.jp/ SECCON では上記で挙げたワークショップのメンバーはもちろん、それを支えるインフラチームやバックオフィス、そしてスポンサーの皆様と参加いただける皆様などなど、大変に多くの皆様によって成り立っています。 SECCON 電脳会議 SECCON のすべてのイベントと賛同いただける有志のワークショップが一箇所に集まる SECCON で一番大きなイベントです。今年は 2025年3月1日～2日の二日間で開催しました。元々は SECCON CTF 決勝戦で併催していたカンファレンスを 2020年から大きなイベントとして再定義して「電脳会議」としたのが始まりです。 CTF の決勝戦といえば、SECCON CTF 13 において GMOサイバーセキュリティ byイエラエのパートナーによるCTFチーム「GMOイエラエ」が1位をとりましたが、その熱い戦いもこのイベントの中で行われました。 ( GMOイエラエ、国内最大級のハッキングコンテスト「SECCON CTF 13 Finals」で世界1位を獲得 https://gmo-cybersecurity.com/news/20250314/ ) CTFの会場でもあるということや、そもそも情報セキュリティをテーマにしたイベントと聞くと何やら堅い雰囲気を感じるかもしれませんが、そんなことはありません！ SECCON の電脳会議は「フェス」のような雰囲気をとても大切にしていて、情報セキュリティに興味があれば誰でも参加出来ます！（参加費もすべて無料です！）例えば半田付けのワークショップ。SECCON の電脳会議の入場バッジは「基盤」になっていて、自分で改造が出来るようになっています。会場には基盤に取り付けるチップ類と半田付け工具が用意してあり、誰でも自由に取り付けることができるようになっています。もちろん取り付け方のマニュアルやスタッフもいますので、誰でも気軽にバッジを改造することができます。もちろん、CTFやペネトレーションテストなどに取り組みたいかた向けの企画もあります。そのうちのひとつに、AlpacaHack x SECCON CTF コラボイベントがあります。今回 AlpacaHack さんにご協力頂き、SECCON CTF の熱気を感じられる場所で CTF を体験出来るイベントを開催いただきました。 https://alpacahack.com/ctfs/seccon-13-finals-booth 解いた問題数に応じたグッズ配布があることに加え、CTF に挑戦できるということもあり連日かなりの盛り上がりを見せていました。そして Open Conference という名前で、外部からの発表者を募り知見を共有いただくカンファレンスも開催しました。詳しくは公式サイトのプログラムを見ていただきたいのですが ( https://www.seccon.jp/13/ep250301.html ) 守る技術の話から脆弱性の発見や攻撃キャンペーンに対する視点の共有まで幅広い発表が行われました。今回はほぼ英語発表となりましたが、英語・日本語の同時翻訳（文字起こし）を用意できたことで皆様に楽しんでいただけたように思います。 SECCON14 SECCON は「年度」で動いていますので、2025年の4月からが来年度になります。来年度は SECCON 14 として開催をする予定です。日程は下の画面の通り。2026年の2月28日と3月1日です。（プライバシーに配慮した形で出せる私の写真がこれぐらいしかありませんでした・・！）ちょっとでも興味を持ったかた、東京マラソンのついでに寄ってみたいというかた、ぜひ浅草橋ヒューリックホールにお越しください！私も当日いる予定ですので、ぜひお会いしましょう！（是非声を掛けてください！）

2025.05.19

技術情報

【Capybara×生成AI】自然言語によるブラウザ自動テストを試す

こんにちは。GMO NIKKO / GMOインターネットグループデベロッパーエキスパートの石丸です。2024年秋に開催された「Kaigi on Rails 2024」に参加しました。2日間にわたって様々なセッションに参加しましたが、特に印象に残ったのがイベント1日目のセッション「Capybara+生成AIでどこまで本当に自然言語のテストを書けるか？」です。本記事では、そのセッションで紹介されていた自然言語によるブラウザ自動テストを実際に試した結果や所感について紹介します。はじめに今回紹介する生成AIを活用した自動テストツールは「Charai」という名前でGitHubに公開されています。Charai(Chat + Ruby + AI) driver for Capybara. Prototype impl for Kaigi on Rails 2024 presentation このツールは主に以下の流れで動作します。自然言語でテストケースを記述生成AIが自然言語の指示や画面のキャプチャを受け取り、ブラウザからDOM情報を取得する受け取った情報やDOMデータを解析し、ブラウザ操作（クリック、テキスト入力、スクロールなど）を行うRubyコードに変換する生成されたコードをCapybaraドライバを利用して実行し、ブラウザを操作するユーザーは自然言語で直感的にテスト内容を記述でき、また、生成AIが実際のブラウザの状態をもとに次の動作を判断するため、人間が行うブラウザ操作に近い挙動を再現することが可能です。詳細は「Kaigi on Rails 2024」のセッションページ内の発表動画やスライドをご確認ください。 Capybara+生成AIでどこまで本当に自然言語のテストを書けるか？ | Kaigi on Rails 2024 検証用のアプリケーション自動テストの挙動確認用に、サンプルとして以下のようなアプリケーションを作成しました。記事投稿を行うシンプルなWebアプリケーションで、トップページには投稿の一覧を表示し、各投稿には編集や削除などの基本的な機能を実装しました。投稿の新規作成は画面右上の「New Post」から行います。セットアップ基本的なセットアップは README に書かれている通りですが、今回の検証にあたって私がやったことを一通り紹介します。 Gemfile 「Charai」はgemとして公開されているため、 Gemfile に gem 'charai' を追加し、bundle install を実行します。 Firefox Developer Edition macOS環境の場合は /Applications/Firefox Developer Edition.app にインストールします。 Capybara spec/support/capybara.rb ファイルを作成し、以下のように設定します。 require 'capybara/rspec' config = Charai::OpenaiConfiguration.new( model: 'gpt-4o-mini', api_key: ENV['OPENAI_API_KEY'] || 'xxxxxxx' ) Capybara.register_driver :charai do |app| Charai::Driver.new(app, openai_configuration: config) end Capybara.register_driver :charai_headless do |app| Charai::Driver.new(app, openai_configuration: config, headless: true) end Capybara.current_driver = :charai Capybara.javascript_driver = :charai RSpec.configure do |config| config.around(:each, type: :feature) do |example| Capybara.current_session.driver.callback = { on_chat_conversation: ->(_content_hash, answer) { formatted_answer = answer.gsub(/```/, '').strip puts "🤖 ChatAI Response:\n-------------------------" puts formatted_answer puts "-------------------------\n\n" } } example.run end end RSpec 実際のテストは以下のように書きました。page.driver.additional_instruction にテスト対象のページ構成を記述し、page.driverにテストしたい内容を自然言語で指定します。今回は新規記事の投稿処理を実行するように自然言語で指示しました。必要なDSLは visit のみです。 require 'rails_helper' RSpec.describe '投稿編集のE2Eテスト', type: :feature do before do page.driver.additional_instruction = <<~MARKDOWN * Posts一覧画面には、投稿の一覧と各投稿ごとの「Edit」「Delete」ボタン、および画面右上の「New Post」ボタンが表示されています * 画面右上の「New Post」ボタンをクリックすると、新規作成画面（New Post）に遷移します * New Post画面には「Title」入力欄と「Body」入力欄があり、右下に「Create Post」ボタンがあります * Edit Post画面には「Title」入力欄と「Body」入力欄があり、右下に「Update Post」ボタンがあります * Posts一覧画面へ戻るには、画面下の「Back」ボタンをクリックします MARKDOWN end it 'New Post 画面で投稿を作成し、一覧にタイトルと本文が表示されること' do visit 'http://localhost:3000/' page.driver << <<~MARKDOWN * Posts一覧画面で「New Post」ボタンをクリックしてください * New Post画面に遷移したことを確認してください * 「Title」入力欄に「Sample Title」を入力してください * 「Body」入力欄に「This is a sample body.」を入力してください * 「Create Post」ボタンをクリックしてください * Posts一覧画面に戻り、「Sample Title」というタイトルが一覧に表示されていることを確認してください * 同じ行に「This is a sample body.」という本文が表示されていることを確認してください MARKDOWN end end テスト実行セットアップが完了したため、早速テストを実行してみます。以下の画面に対して、投稿の新規作成が成功するかどうかを検証してみます。新規作成ボタンのクリック spec/support/capybara.rb でOpenAIからのresponseをコンソールに出力するように設定したため、リアルタイムで以下のようなレスポンスを確認することが可能です。 $ rspec spec/web/charai_sample_spec.rb 🤖 ChatAI Response: ------------------------- driver.execute_script('JSON.stringify(document.querySelector(".new-post-button").getBoundingClientRect())') ------------------------- 🤖 ChatAI Response: ------------------------- driver.execute_script('JSON.stringify(document.querySelector(".new-post").getBoundingClientRect())') ------------------------- 🤖 ChatAI Response: ------------------------- driver.execute_script('JSON.stringify(document.body.innerHTML)') ------------------------- 🤖 ChatAI Response: ------------------------- driver.click(x: 100, y: 100) driver.sleep_seconds(2) driver.capture_screenshot ------------------------- 🤖 ChatAI Response: ------------------------- driver.execute_script('JSON.stringify(document.querySelector(".btn.btn-outline-primary").getBoundingClientRect())') ------------------------- 🤖 ChatAI Response: ------------------------- driver.click(x: 910, y: 126) driver.sleep_seconds(2) driver.capture_screenshot ------------------------- 上記のレスポンスは、新規作成ボタン「New Post」の位置を特定するまでの過程です。まず初めに、新規作成ボタンに .new-post-button や .new-post のクラスを持つ要素の位置とサイズを取得しようとしていますが、実際の画面ではこれらのクラスは付与されていないため、最初のクリック処理が失敗していることがわかります。その後、対象ページのHTMLを取得し、最終的には .btn.btn-outline-primary というクラスを持つボタンの位置情報から正確なクリック位置 (x: 910, y: 126) を特定することで、新規作成画面への遷移が成功しました。 TitleとBodyの入力「New Post」をクリックすると以下のような画面に遷移します。この画面に対しては、自然言語で以下のように指示しました。「Title」入力欄に「Sample Title」を入力してください「Body」入力欄に「This is a sample body.」を入力してください「Create Post」ボタンをクリックしてください OpenAIのレスポンスは以下のようになりました。 🤖 ChatAI Response: ------------------------- driver.execute_script('JSON.stringify(document.querySelector("input[name=\'title\']").getBoundingClientRect())') ------------------------- 🤖 ChatAI Response: ------------------------- driver.execute_script('JSON.stringify(document.querySelector("input").getBoundingClientRect())') ------------------------- 🤖 ChatAI Response: ------------------------- driver.execute_script('JSON.stringify(document.body.innerHTML)') ------------------------- 🤖 ChatAI Response: ------------------------- driver.execute_script('JSON.stringify(document.querySelector("#post_title").getBoundingClientRect())') ------------------------- 🤖 ChatAI Response: ------------------------- driver.click(x: 512, y: 233) driver.type_text("Sample Title") driver.execute_script('JSON.stringify(document.querySelector("#post_body").getBoundingClientRect())') ------------------------- 🤖 ChatAI Response: ------------------------- driver.click(x: 512, y: 368) driver.type_text("This is a sample body.") driver.execute_script('JSON.stringify(document.querySelector(".btn.btn-outline-primary").getBoundingClientRect())') ------------------------- 🤖 ChatAI Response: ------------------------- driver.click(x: 905, y: 469) driver.sleep_seconds(2) driver.capture_screenshot ------------------------- タイトル、ボディそれぞれの入力欄の位置とサイズを取得し、取得したフォームに対してクリックやテキストを入力するコードが生成されていることが確認できます。最後に .btn.btn-outline-primary の位置情報をもとに「Create Post」のクリック位置を特定し、無事にクリック処理が完了したことが確認できました。投稿の新規作成が完了し、トップの一覧画面に先ほど作成した投稿が表示されていることを確認できました。まとめ今回は、生成AIを活用した自然言語によるブラウザ自動テスト「Charai」をご紹介しました。今回の記事ではテストの成功例を紹介しましたが、実際の成功率は50%ほどで精度面ではまだ発展途上な印象です。なお、今回の記事で紹介したテストは約35秒で完了し、 gpt-4o-mini を指定した場合、1回あたりの実行コストは0.01ドル以下でした。速度面でも課題はありますが、精度と速度が改善されれば実用レベルに大きく近づく印象です。個人的にも、今回紹介した生成AIを活用したブラウザ自動テストや、AIエージェントによるブラウザ操作などの技術に非常に興味があるため、今後も面白い技術や事例があればこのブログで紹介させていただきます。生成AIの進化に伴い、数年後にはE2Eテストの環境も大きく変わっているかもしれませんね。

2025.05.14

技術情報

【暗号のおねぇさんこと酒見由美】「高機能暗号とそれを支える物理・視覚暗号シンポジウム」に登壇しました

激化するサイバー攻撃を背景に、セキュリティ事業へ本格的に注力するGMOインターネットグループ。「ネットのセキュリティもGMO」をスローガンに掲げる中、2025年3月10日に開催された「高機能暗号とそれを支える物理・視覚暗号シンポジウム」では、GMOインターネットグループのエキスパートである酒見由美（GMOサイバーセキュリティ byイエラエ所属）が登壇。注目が高まる高機能暗号について、一般にもわかりやすく解説しました。当日の講演内容とシンポジウムの様子をレポートします。 GMOサイバーセキュリティ byイエラエをはじめとするGMOインターネットグループでは、「ネットのセキュリティもGMO」をスローガンに、セキュリティ分野でさまざまな取り組みを進めています。2025年2月には、世界初の24時間利用可能な総合ネットセキュリティサービス「GMOセキュリティ24」の提供を開始。今後も新たなソリューションの展開を予定しています。そんななか、2025年3月10日に開催されたのが、産業技術総合研究所サイバーフィジカルセキュリティ研究センター主催の「高機能暗号とそれを支える物理・視覚暗号シンポジウム」です。近年注目を集める高機能暗号について、技術者はもちろん、一般の方にもわかりやすく解説する講演が多数行われ、会場では登壇内容をきっかけに技術者同士が活発に意見交換する姿も見られました。数多くの登壇者が高機能暗号の最新技術や取り組みを紹介するなか、「暗号のおねぇさん」として知られるGMOサイバーセキュリティ byイエラエ株式会社の酒見由美が登壇。今回は、酒見さんの講演内容を中心に、シンポジウムの様子をお届けします！秘匿計算による安全な組織間データ連携技術の社会実装最初に演壇に立ったのは、産業技術総合研究所の花岡悟一郎氏。個人のプライバシー情報を秘匿したままでユーザーごとの特性に応じたサービスを提供する方法や、企業間の機密データを秘匿したまま統合分析ができる秘匿計算技術についての説明がありました。こうした秘密計算はすでに複数の企業との連携が進んでおり、社会実装への道筋もつけられているとのこと。また講演内では、秘密計算においてデータを隠したまま処理を実行できるサービスとして「視覚秘匿マッチング」が紹介され、その仕組みや機能・安全性を把握できるショートドラマも放映されました。「暗号のおねぇさん」による高機能暗号技術の紹介酒見さんの講演「Missing Linkの打開策！高機能暗号が創出する未来」では、高機能暗号とユーザーとの間に存在するギャップ（Missing Link）について言及し、その解決策として物理・視覚暗号の可能性を紹介しました。学⽣時代から高機能暗号に関わり続けてきた酒見さんは、とくにペアリングと呼ばれる暗号演算の高速化・安全性評価から社会実装に向けた検証などに長年取り組んできました。その実績と専門性が評価され、現在はGMOインターネットグループの全パートナー（社員）8,000人の中から、暗号応用領域のエキスパートに選出。GMOサイバーセキュリティ byイエラエに所属しながら、暗号技術の安全性と、それがもたらす利便性を伝えるために、日々精力的に活動しています。高機能暗号を広めるため、企業研究所からGMOインターネットグループにジョインした酒見さん暗号技術はSuicaなどのオフラインで使われるものから、ECサイトでのショッピングといったオンラインサービスまで、日常のさまざまな認証や通信に活用されています。ところが酒見さんによると、SIerをはじめとする一般の利用者に高機能暗号の説明をすると、「ロジックがよく分からないので、キツネにつままれたような気分になる。実は裏で復号されて処理されているのでは？」などの不信感を持たれがちだそうです。歯がゆい経験を通じて、「利用者と暗号技術の間には『4つのギャップ』があり、技術的な理解と実際の運用設計の両方をバランスよく考える必要がある」という考えに至った酒見さん。「4つのギャップ」とは、以下のようなものです。要件でのギャップセキュリティモデルの違い性能とコストのギャップ保守・運用での影響「とっつきにくい」「わかりにくい」という声もある暗号技術昨今ではテクノロジーの進化により、暗号技術に対する要求も高度化しています。具体的には、「個人を特定しないまま、正当な持ち主であることを証明したい」「機密情報が含まれるデータを、機密性は損なわずに幅広く活用したい」といったニーズも発生しているといいます。こうしたニーズに対して酒見さんは、「今使われている暗号技術だけでは両立できないケースが多くある」としたうえで、そうした課題を解決する技術について「ブラインド署名やゼロ知識証明などの高機能暗号は、研究レベルや社会実装レベルでは既に存在する」と希望を語ります。多様なニーズに応えるための暗号技術たちこのうち、酒見さんが中心的に触れるのは「秘密計算」。これには、秘密情報をいくつかの断片（＝シェア）に分け、所定の数を集めることで元に戻せる「秘密分散」や、暗号化されたままでも加算や乗算といった演算が可能な「準同型暗号」といった手法が含まれます。そして、秘密分散を視覚的に理解できるのが、2つの画像を重ね合わせることで特定の図像が浮かび上がる「Visual Secret Sharing」です。ランダムな砂嵐のような画像は、それぞれ単体ではノイズにしか見えず、元の図像が何かはまったく分かりません。しかし2枚を重ねると、「酒」という文字が出現。まもなく開かれるネットワーキングパーティを彷彿とさせる演出に、会場からは笑いが起こります。難解な技術を、ユーモアを交えて直感的に伝える工夫として、高い関心を集めていました。このままではノイズにしか見えない2枚だが、重ね合わせると特定の図像が出現高機能暗号技術とデータ保護の革新話題は高機能暗号へと移ります。高機能暗号とは、従来の暗号技術よりも高度な機能を備えた暗号技術の総称であり、「情報を保護しながら、情報を活用するための手段を提供できる」点に大きな特長があります。これらは「情報セキュリティの向上とデータ利活用を両立できる重要な技術」（酒見さん）とされており、秘密分散や準同型暗号に加えて、暗号化されたままデータ検索が可能な検索可能暗号（Searchable Encryption）にも、その実現可能性が見出されています。検索可能暗号は、「預けたデータや検索クエリの秘匿性を維持しつつ、データの検索を可能にする」ことを目指した技術です。従来の方式では、暗号化を行う鍵がサーバ側にあるため、サーバがデータの中身を参照できてしまう問題がありました。また、利用者側の鍵で暗号化すると、今度はサーバ上で検索処理が行えないという課題も抱えていました。こうした課題の解決策として、講演では情報通信研究機構（NICT）が研究開発を行った「ESKS（Enhanced Searchable Keyword System）」が紹介されました。ESKSは、保存時に「検索候補となるキーワード」を自動抽出し、それらを利用者の鍵で乱数変換・暗号化したうえで、暗号文とともにサーバに送信します。サーバ側はこの乱数をキーに検索処理を実行し、該当する暗号文を返却。利用者は手元の鍵を用いて復号し、データ内容を確認するという仕組みです。なお、検索可能暗号の仕組みを理解しやすくするため、会場ではその構造を模した物理展示も。データの保存・検索処理を視覚的に体験できるこの展示は、技術の直感的理解を助け、多くの来場者の注目を集めていました。検索可能暗号の仕組みを物理的な箱で再現した展示もうひとつ、秘密計算の応用領域として、近年とくに注目されているのが「プライバシー保護連合学習」です。これは、連合学習技術と呼ばれる技術と秘密計算を組み合わせた技術です。連合学習は、スマートフォンなどの各端末がローカルでモデルを学習し、その学習結果（パラメータ）だけを集約サーバに送信。サーバ側で統合・更新したモデルを各端末に再配布することで、「データを中央に集めることなく分散学習を実現する」という仕組みです。さらに、クライアント・サーバ間でやりとりする学習結果を秘密計算により秘匿化することで、より安全性を高めます。この技術は、AIを活用するうえで不可欠な大量のデータを、複数の組織や個人からセキュアに活用できる点で注目されています。近年、単一の組織だけでは十分なデータ量が確保できないという課題のもと、複数の組織が協力して機械学習を行う場面も増えてきました。しかし、そこで扱うデータには個人情報や機密情報が含まれる可能性があるため、安全な方法での連携が求められます。プライバシー保護連合学習は、こうしたリスクを軽減しながらも学習精度を高めることが可能な技術であり、ビッグデータやDXの潮流のなかで、その存在感を高めつつあるそうです。デジタル時代の新たな暗号活用事例 NICTでも、この分野における研究開発が進められており、2018年に始動した「DeepProtect」プロジェクトでは、金融分野における不正取引の検知に関する実証を重ねてきました。とくに銀行での送金の不正検出において成果を上げており、2022年にはその技術がGMOサイバーセキュリティ byイエラエに技術移転され、実用化に向けた活動が進んでいます。従来の連合学習では、クライアントから送られた学習結果がサーバ側に平文で見えてしまうというプライバシー上の課題がありました。これに対しDeepProtectでは、準同型暗号を用いることで、学習結果を暗号化したままサーバに送信し、サーバ側では復号せずに集約処理を実行。最終的に、暗号化されたまま学習モデルを更新してクライアントに返すという方式を採用しています。このような構成により、学習結果およびモデル自体の秘匿性を確保したまま、連合学習を成立させることに成功しています。講演の締めくくりに酒見さんは、「高機能暗号は徐々に普及しつつあるものの、提案を行う研究者と、それを実装に落とし込むエンジニアとのあいだには依然として深い溝がある」と現場に根差した課題を指摘しました。そのうえで、「このギャップを埋めるには、物理・視覚暗号といった手法を活用し、技術を直感的に理解できるようにすることが鍵となる」と強調し、講演を締めくくりました。高機能暗号に関心を寄せる多くのエンジニアが来場した本イベントは、特に、暗号技術の重要性を非IT系の関係者にどう伝えるかに悩む参加者にとって、大きなヒントを得られる場となったのではないでしょうか。酒見さんが講演を通じて示した課題意識や、分かりやすく伝えるための工夫は、各参加者にとって有益なナレッジとなり、今後のセキュリティ意識や暗号技術への理解促進につながっていくはずです。安全なシステム開発や信頼性の高い取引の実現に向けて、具体的な一歩を踏み出す契機とも言えるイベントでした。 GMOインターネットグループでは、こうした未来の実現に向けて、高機能暗号の社会実装を引き続き推進し、ネットセキュリティ分野のリーディングカンパニーとして、安全で利便性の高いインターネット環境の構築に貢献していきます。

2025.05.12

技術情報

業務の生産性を向上させるSlack活用術

多くの企業がチャットツールとしてSlackを導入しています。しかし、単に導入するだけでは十分な効果を得ることはできません。本記事では、Slackをより効果的に活用するための具体的なテクニックを紹介します。 1. ワンクリックで絵文字リアクションを追加 Slackでは、メッセージに対して絵文字リアクションをすることで、簡単にフィードバックを行えます。しかし、頻繁に使用する絵文字を毎回選択するのは手間がかかります。「ワンクリック絵文字リアクション」を活用することで、ワンクリックで意思表示や承認ができ、コミュニケーションの効率を向上させることができます。設定方法デスクトップ版Slackで、サイドバーのプロフィール写真をクリック。「環境設定」を選択。「メッセージ＆メディア」を開く。「絵文字」の項目で、「メッセージにワンクリック絵文字リアクションを表示する」にチェックを入れる。この設定により、よく使用する絵文字がワンクリックで追加できるようになります。 🔗 詳しくはこちら：ワンクリック絵文字リアクションについて 2. SlackとOutlookカレンダーを連携リモートワークの普及に伴い、チームメンバーの在席状況を把握することが重要になっています。SlackとOutlookカレンダーを連携することで、以下のようなメリットがあります。 SlackのステータスをOutlookカレンダーと同期 → 自動的に「会議中」「外出中」などのステータスが更新。会議の開始前にSlackで通知を受け取れる → 参加忘れを防止。設定方法 Slackアプリストアで「Outlook Calendar」アプリをインストール。Slack内の「アプリ」から「Outlook Calendar」を検索し、Microsoftアカウントで認証。会議リマインダー通知を設定 → 会議開始前にSlackへ通知を送るよう設定。自動ステータス更新を設定 → 会議中は「In a meeting」、外出時は「Out of office」など、カレンダーの予定に応じてSlackのステータスを自動更新。この設定を行うことで、ステータス更新の手間を省き、チームメンバーとスムーズに連携できるようになります。 🔗 詳しくはこちら：SlackとOutlookカレンダーの連携方法 3. GitHubのスケジュールリマインダーを設定開発業務では、プルリクエスト（PR）や課題（Issue）の管理が重要です。SlackとGitHubを連携し、スケジュールリマインダーを設定することで、レビューの遅延を防ぎ、プロジェクトの進行をスムーズにすることができます。設定方法 GitHubの右上隅のプロフィール写真をクリックし、「設定」を開く「統合」セクションの「スケジュールされたリマインダー」をクリック。「リマインダーの追加」をクリックし、Slackワークスペースを承認。通知スケジュールや通知条件などを設定。設定を保存すると、指定したタイミングでSlackにリマインダーが送信されるこの機能を活用することで、PRやIssueの対応漏れを防ぎ、開発チームの生産性を向上させることができます。 🔗 詳しくはこちら：スケジュールされたリマインダーを作成するまとめ本記事では、Slackを活用した業務効率化のための3つのテクニックを紹介しました。 ✅ ワンクリック絵文字リアクション → 簡単なフィードバックでコミュニケーションを効率化。 ✅ SlackとOutlookカレンダーの同期 → 会議の参加忘れを防ぎ、在席状況を自動更新。 ✅ GitHubのスケジュールリマインダー → PRやIssueの対応漏れを防止。これらの方法を実践することで、Slackを単なるチャットツールではなく、業務効率を向上させる強力なツールとして活用できます。ぜひ試してみてください！

2025.04.28

技術情報

【NW設定自動化】をAnsible+ChatGPTで知識ゼロからできるのか？試してみた【前編】

Ansibleでネットワークを構成管理・自動化、なんて話を多く聞く昨今！NWエンジニアの皆さん如何お過ごしでしょうか。NWエンジニアはプログラムに触れる機会が少なめで、"コードを書いて自動化"みたいなアクションが苦手な方が多いのではないでしょうか？そんな中、AIツールも流行ってて『ChatGPTでプログラムを書ける』と聞きます。「じゃあ、ChatGPTにAnsibleやらせれば、とっつきやすく簡単にできるんじゃないの？」と思い、実際にやってみました。今回はそんなAnsible＋ChatGPTの実験レポートをお届けします。【NW設定自動化】をAnsible+ChatGPTで知識ゼロからできるのか？ー前編はshowコマンド編です。いちおうツール説明 ChatGPTとは？ ChatGPTのロゴ、WikipediaCommonsより引用言わずと知れたOpenAI社の作った生成AI。基本は言語モデルであり、言語を受け付け、言語で返事をします。この入力言語の事を「プロンプト」と呼びます。プロンプトを細かく記載することで詳細な指示が可能。せっかくなのでChatGPTに自己紹介を依頼してみましょうか、プロンプトはこんな感じで。すると、以下のような感じで返事が返ってきました。おっ！いいこと言いますね今回はこれを使って、Ansibleというツールのコードを自動的に作ってもらいます。 Ansibleって何？ Ansibleのロゴ、WikipediaCommonsより引用構成管理ツールの一つ。オープンソースであるため自由に利用可能。SSH経由などで操作対象機器に接続し、あらかじめ決められた処理を行う事が出来ます。 "知識ゼロから"とは言うものの、最低限のAnsibleの構成くらいは知っておいた方が分かりやすいかな？ということで、構成要素とファイル構成について書いておきます。 Ansibleの構成要素 Ansibleの構成要素はざっくり書き出すと以下の通り。・Ansibleコマンド … コマンドラインで実行するコマンド。プレイブックを指定する・プレイブック … Ansibleの骨組み、ここに処理を記載する　・HOSTS … 対象ホストを定義する箇所、IPアドレスなどを指定する　・VARS … 変数を定義する箇所、ログインIDやパスワードが変数に該当する　・TASKS … 処理内容。"モジュール"と呼ばれる定義済みのプログラムを利用する　　　　　用途ごと様々なモジュールが存在し、柔軟かつ正確な処理が可能図にしてみました。こんな感じかな？この構造を理解したり、漏れのないようコードを書いたりするのが大変！また星の数ほどあるAnsibleモジュールから適切なものを探して組み込むのも時間がかかります。今回はこの辺をChatGPTにやらせることで簡単に知識ゼロからできるのか？という実験をやります。レッツトライ！ AnsibleをChatGPTで自動化してみる始める前に、今回の環境の前提条件を書いておきます。こんな感じでやらせて下さい。 ■前提条件・ChatGPTはGPT-4を利用・オペレーションはLinuxサーバで行う・Ansibleはオペレーションサーバにインストール済み・操作対象にはSSHで接続して実行する・操作対象はAristaのEOSで動作・操作内容はシンプルなshowコマンド ※本記事掲載のホスト名など固有情報はマスクします。掲載されている値はChatGPTが出力したサンプル値です。以上、すごく簡単なshowコマンドでやってみます。これができなければ始まらない。 Ansible＋ChatGPTでshowコマンドをとってみるさっそくChatGPTにAnsibleのコードを出力させてみましょう。以下のような簡単なプロンプトを入力、 ■プロンプトArista機器をAnsibleを用いて操作する方法を教えて下さい。初心者にもわかるシンプルなAnsibleのプレイブックで、インターフェイス「Eth49/1」の設定をshowコマンドで確認したいですどのようなやり方があるか教えて下さいおっ、親切に前提条件から教えてくるようです。しんせつ。続いて、インベントリファイルを生成してくれました。そしてプレイブック。実行コマンド、以上、ふむふむ。arista.eos.eos_commandモジュールでshowコマンドを送り、結果を debugモジュールで表示させてくれるようです。ファイル構成のイメージとしては、こんな感じ。知識ゼロなので、コピペでファイルを作成していきましょう。オペレーションサーバでカタカタ。プレイブックとインベントリを作成。プレイブックファイル.yml インベントリファイル.ini　※上記はサンプル値です（コンプラ対策）ファイルができたら、指定されたとおりのAnsibleコマンドを実行してみます。ぽち！あっ！？失敗？赤文字でfatalメッセージを吐いて、failed=1 となっています知識ゼロということで、デバッグもChatGPTにやらせますよ。エラーメッセージをそのままChatGPTのプロンプトに打ちこみます。すると、何かわかったらしく改善案を提案してきました。上記のような対処方法が提案されました。なるほど、そもそも今回はSSHで接続する想定でしたが、eAPI(HTTP)で接続の設定になっていたようです。ChatGPTに修正を依頼します。ふむふむ。ansible_connection: の箇所が"httpapi"から"network_cli"に変わりました。指示されたとおりインベントリを修正して、再度実行してみます。今度は緑で OK=2 と表示、うまくいったようです。"show interface"コマンドの結果が出力されました。 OK。ひとまず、ChatGPTの指示どおりのコードでAnsibleを動かすことに成功しました。えらい。 ChatGPTにAnsibleの機能を追加させてみる続いて、コードの改修をさせてみましょう。ログを吐き出す機能をつけてもらおうかな？プロンプトで依頼していきます。さぁどうだ？以下のようなプレイブックが出力されました。ふむふむ。"file"、"copy"の二つのモジュールが追加されています。新たにプレイブックを作成し、実行。エラー無く実行できましたし、指定したとおりのファイル名でログファイルが出力されています。グッド。もう一つ頼んでみましょう。自動化っていうと複数の機器に実行するものですよね。二台に対応するよう依頼してみましょうか。おぉ！やり方を教えてくれたうえに、ファイル名にIPを入れる方法まで教えてくれました。しんせつ。しかし、適用して実行してみると失敗。1台にしか適用されません。すかさずChatGPTにツッコミを入れていきましょう。うまくいかないよ！「ナイス気付きです！」ではなく、最初からChatGPT君が教えてくれたらよかったのですが、まぁいいでしょう。プレイブックを修正します。実行。うーーーん。二台にはできましたが、不完全。 arista1 が ok=3 なのに対して、arista2 が ok=1 になっています。結果を見てみると、ログファイルが生成されていませんでした。再度ChatGPT聞こうとしたら、何か言ってます。ふむふむ。作業中のプレイブックを貼ればもっと正確な結果が出せると。依頼事項と一緒に、前回ChatGPTから出力されたプレイブックを貼り付けてみます。ぺたり。原因がわかったらしく、新しいプレイブックが届きました。こちらを実行すると… いけました！だいぶやりとりに時間がかかりましたが、"二台に対して特定のログを採取するAnsible"が完成。この可変値の「ホスト名」「コマンド」を本番の値に書き換えるだけ（ここは手作業）で、ログとりツールとして使えるのではっ！応用して、・Ansibleをcronで動かして定時ログとり・障害試験とかで全機器のログをとるとかは知識ゼロでも簡単に自動化できるのではないでしょうか？【検証結果】Ansible＋ChatGPTで知識ゼロからshowコマンドの自動化はできました。が、一発で出来ない場合があり、ChatGPTとやりとりが必要。丁寧にプロンプトを書いたり、Ansibleの基礎知識がわかっていると早いかも。というところでしょうか、慣れてきたら、テラタームマクロを書くよりかんたんかも？おまけ：ChatGPTにAnsibleのshowプレイブックを書いてもらうサンプルプロンプトおまけで、一撃で出力できそうなサンプルプロンプトを書いておきます。【サンプルプロンプト】以下の要件を満たすAnsibleのプレイブックとインベントリファイルを作成して下さい。■前提条件・Arista機器を対象にする・SSHで接続して実行する・シンプルな構造にする・オペレーションはLinuxサーバで行う・オペレーションサーバにAnsibleはインストールされているものとする■実行内容・複数台の機器に複数のコマンドを実行・結果をログファイルに保存・ログファイルはディレクトリ YYYYMMDD を作成しその配下に保存する・ファイル名は YYYYMMDD_HHMMSS_IPアドレス.txt とする※YYYYは西暦4桁、MMは月を2桁、DDは日を2桁、HHは時間を2桁、MMは分を2桁、SSは秒を2桁■機器192.168.1.1192.168.1.2■コマンドshow int statusshow int version ※回答にゆれがあるので、思った通りにいかないときはプロンプトをよしなに変えたり、追加で依頼したりしてみてください。以上、長くなったのは今回はここまで！後編ではChatGPT＋Ansibleで設定変更自動化にチャレンジしてみたいと思います。まとめ Ansible＋ChatGPTで知識ゼロでもshowコマンドを実行させるプレイブックとインベントリの出力に成功。機能追加や困ったときのデバッグにも対応できました。欠点としては、ChatGPTとのやりとりに時間がかかること。ひとむかし前は非対応だったはずなのですが、進歩しましたねChatGPT。えらい。 Ansibleに抵抗感があるNWエンジニアのみなさん、ひとまずChatGPTに依頼してみて、だまされたと思って言われた通りやってみたらラクできるかもしれませんよ。お試しあれ。ご拝読ありがとうございました。【NW設定自動化】Ansible+ChatGPTでネットワーク機器の設定変更はできるのか？試してみた【後編】【NW構成図】は一周まわってエクセルで書けば良いのでは？という提案

2025.04.22

技術情報

技術広報として、現場の熱を感じ続けたい-RubyKaigi 2025 参加レポート

2025年4月16日〜18日、愛媛県松山市で開催された RubyKaigi 2025。世界中のRubyistが集う祭典に、GMOインターネットグループもカスタムスポンサーとして協賛いたしました。本編では技術広報としての参加レポートをお届けいたします。 Ferry Sponser提供の背景──“旅”を通じてつながるコミュニティ今回のRubyKaigiの舞台は四国・愛媛県松山市。そこでGMOインターネットグループからはGMOペパボプレゼンツで、東京から徳島へのフェリー移動を“出会いと交流の場”に変えるという目的でカスタムスポンサーとしてFerry Sponserを拝命。「Rubyist bulk Load」というタイトルで、オーシャン東急フェリーを活用した約18時間の船旅を提供いたしました。とても広々としたラウンジ、大浴場、そして静かな客室──船内で過ごす時間の中で、Rubyistたちはコードだけではなく、価値観や思想を語り合いながら、目的地へと向かっていきました。このような「つながりの機会を提供する」ことこそが今後のコミュニティ支援にとって重要なことであると考えています。「DevRel機能がなくなった」その先にある、グループの技術広報のかたち余談にはなりますが、私が所属するGMOインターネットグループは、2025年1月に持株会社体制へと移行しました。それに伴い、大きなミッションの転換があり、これまで約5年間にわたって携わってきた「DevRel」という役割で活動を継続することができなくなりました。しかし、これまでの活動を通じて技術コミュニティへの協賛や支援には大きな意義があると実感していたので、多くの技術コミュニティとの関係値や実績をゼロにしてしまうことはしたくなかったのです。そこで、グループの技術広報として新たな目標を掲げました。「グループ各社の技術広報を支援し、横断的なDevRel活動を支えていく」。これが、今の私の立場であり、技術広報としての新たなミッションです。そんなリスタート第1弾の協賛イベントがRubyKaigi2025でした。 RubyKaigiにGMOインターネットグループとして協賛するのは、実は2019年以来となります。私がGMOに入社したのはちょうどその年。DevRel立ち上げメンバーとしてジョインしたのですが、RubyKaigi 2019の開催直後だったため、これまで現地での参加経験はありませんでした。そんな私にとって、今回のRubyKaigi 2025が初参加。会場の熱気と活気、エンジニアたちの“語りたい”という想いやセッションへの期待値の高さが交差する空気感に、思わず胸が高鳴りました。そして何より驚いたのは、ソーシャルメディアでの盛り上がりのすごさ。全国どこにいても参加者が楽しんでいる様子がとても伝わるコミュニティだなぁと思いつつ、現地でその温度感に触れることができてとてもうれしかったです。数字だけでは測れない現場の熱量と価値技術広報のミッションは、ブランドの技術的信頼性を社内外に正しく伝えていくことだと理解しています。そのためにはKPIの設定やマーケティング視点も、もちろん重要な要素です。各社と企画連携をする上でも共通目標となりうるよう丁寧にすり合わせをするようにしています。ただ、DevRelに携わる中で私が実感したのは、コミュニティ支援の本質は、数字だけでは語れないということでした。プロダクトや企画への賞賛・疑問などをきっかけに交わされる技術へのこだわり、エンジニア同士がぶつけ合う熱量。現場に身を置き、それを目の当たりにすることは、技術広報としても多くの学びがあります。そして、「今年も会えた！」というコミュニティならではの同窓会のような温かく仲睦まじい様子はうらやましいなぁという気持ちにもなります！笑正直に言えば、どれだけ努力してもエンジニアのみなさまと同等にすべての技術を100%理解することはできません。かつて私は、「100％理解できないことを広報することは無責任ではないか」と悩んでいた時期がありました。そのとき、あるエンジニアのパートナーに相談すると、こんなことを言われました。「それはお互いさま。それぞれの仕事にリスペクトがあれば、それでいいんじゃない？」その一言はとても腑に落ちて、救われたのを覚えています。だから、私は“現場で”その熱量を自分の目で見つめ、リスペクトをもって広報活動につなげていくことにこだわり続けたいと思っています。ただ現場に行くことにこだわった結果、今回のRubyKaigiには諸々のスケジュールの関係でDay1に約6時間の現地滞在しかかなわず、、正直不完全燃焼感は否めないのですが・・笑たとえ6時間でも、、やっぱり「行ってよかった！」と思います。現地の熱量を体感でき、普段は会えないグループのエンジニアとの関わりが持てたことで、グループの技術広報として今後の活動における役割と私自身が目指したい方向性を再確認できましたし、何よりRubyコミュニティのみなさまと直接お話できたことがとても有益な時間でした。弊社ブースに足をはこんでくださったまつもとゆきひろ氏まつもとゆきひろ氏を囲むGMOペパボパートナー一同さいごに GMOインターネットグループの各社を支える技術広報として、さまざまなコミュニティ支援のハブとなり現地出会う熱量、技術、登壇する自社エンジニアの姿、その一つひとつを見逃さず、技術がつなぐ信頼とブランド価値を言葉にし、グループ各社の技術広報推進の一助となれるよう邁進したいと思います。そして最後に、真面目なレポートとはまったく関係のない話をひとつ。今回の松山滞在、実は24時間もなかったのですが──あまりのバタバタに「観光どころでは…」と思いきや、しっかり楽しみました。宇和島の鯛めしをいただき、閉店3分前に滑り込んで噂の蛇口みかんジュースを飲み比べ、なんとホテルにチェックインする前に道後温泉にも入れました！笑普段は3歳児の母業も担っている分、出張中は”身軽に動ける”という意味でご褒美タイムでしたので限られた時間の中でも、最大限効率的に愛媛を満喫しました！どんなに忙しくても「地のもの」は外せない。それが現場主義（？）の技術広報です。笑またどこかでお会いできることがあればうれしいです！

2025.04.18

技術情報

Creators MIX 2025 登壇レポート「クリエイティブとAIの最前線 2025」

2025年3月19日、神田明神ホールで開催された「Creators MIX 2025」におけるセッション「クリエイティブとAIの最前線 2025」にて、GMOインターネットグループの内野皓太がモデレーターを務めました。セッションでは、アドビ株式会社の阿部成行氏と株式会社サイバーエージェントの洞ノ上茉亜子氏をパネリストに迎え、AI技術の進化によって変わりつつあるクリエイティブ業界の現状と未来についての活発な議論が行われました。本ブログでは、講演内容を中心にレポートし、後半にてGMOインターネットグループのAI推進の取り組みについてもご紹介しています。トークセッション「クリエイティブとAIの最前線 2025」 ①AI活用で進む多様性&市場拡大まず口火を切ったのは、アドビ株式会社・阿部成行氏です。「テクノロジーとクリエイティブは非常に密接に連携している」という所感に始まり、クリエイティブ領域のフロントランナーとして、長きにわたって見つめてきた業界の変化を語りました。アドビ株式会社・阿部成行氏阿部氏が「クリエイティブの工業化」の一例として紹介するのは、コンテンツサプライチェーンです。これは需要予測に応じてコンテンツを作成・提供し効果測定を行う仕組みであり、「予測や作成といった各工程に、非構造化データも含めた分析や提案・実行までを担う自律的AIエージェントが組み込まれることで、効率化・自動化が進むだろう」との展望を語ります。阿部氏はパソコン登場前のデザイン会社を例に挙げ、「DTPの一般化までは、"定規で1ミリ単位の線が引けること"がクリエイティブの質に直結していた」と話します。「ところがテクノロジーの進歩により、綺麗に線が引けるだけのデザイナーや製版業の仕事はなくなってしまった。生成AIにも、まさにこれと同じ波を感じる」と、技術発展が仕事のあり方に与える影響を熱弁しました。クリエイティブ×分析といえば、インターネット広告事業の雄であるサイバーエージェントもまた、深い知見を有するフロントランナーです。株式会社サイバーエージェント・洞ノ上茉亜子氏は、同社でのAI活用について「"予測AI"と"生成AI"を両輪としてコンテンツ制作を行っている」と紹介。同社の「極予測AI」では、作成した成果物（広告）について、現在配信しているコンテンツよりも効果が見込めるかどうかを事前に予測できるそうです。多彩な領域で活用できるAIは「自分の能力を拡張する武器」同社の現場ではこのスコアをベースとしたクリエイティブ体制を確立しているといい、「極予測AIで現状の広告物にスコアが勝たない（良くない）ものは納品しません、とクライアントに宣言している」（洞ノ上氏）とのこと。大量のパターンを生成できることで、広告素材を潤沢に生み出せる点も「配信スピードの速いインターネット広告には好適」と話し、AIの活用はもはや「前提」になりつつあるという実感を述べられました。株式会社サイバーエージェント・洞ノ上茉亜子氏 AIを活用することで、1〜2年目の若手でもベテラン以上のアウトプットを出せることもある、と語る洞ノ上氏。「極AIをリリースして以降、"人間とAIでクリエイティブを作る"ことが普通になり、いまでは文化となっている」と、AIとの共働体制の在り方を示しました。 ②クリエイターに求められるスキルと心構えこれからのクリエイターに必要なスキルと心構えについて、阿部氏は「今後は経営やブランディングなど、自分の領域を飛び越えたものづくりが必要になる」と提言し、従来の分業化された役割を超えた統合的アプローチの重要性を説きます。背景にあるのは、生成AIという「道具」がカバーする範囲の広大さです。道具としての生成AIはあくまで1つのテクノロジーですが、活用領域はクリエイティブからビジネスまで多岐にわたります。そのため阿部氏は「今までデータサイエンティストなどの専門家に任せていた領域が、生成AIによって民主化される」と予測。現在分業化されているフロントエンジニアリングやUI設計などの垣根も曖昧になり、誰もが高品質なプロトタイプングを瞬時に作成して、その優劣をデータで検証できるようになるだろうと語りました。現代の広告クリエイティブは“思考の偏り”がない方が強い一方、洞ノ上氏は「AIという存在に怖さを感じるクリエイターもいる」としつつ、まずはAIを知ろうとする姿勢が大事だと強調。また、AIがアウトプットしたものが実際に使えるかどうかについては、依然として人間の判断力が求められると示します。また、現在のインターネット広告はプラットフォーム側のアルゴリズムで品質の判断が行われるため、「人間から見て素晴らしい広告を作るのはもちろん大切だが、お客様に効果で還元するためにも、Googleやメタといったプラットフォーム側のアルゴリズムに合わせて柔軟に対応できるクリエイティビティが問われる」と話し、固定観念に縛られない表現のあり方が若手クリエイターの強みになると激励しました。 ③クリエイティブ×AI領域の進化によるビジネスの変化ビジネス面への影響については、「消費者行動の変容」が大きなポイントとして挙げられました。この点についても、阿部氏は「スマホとともにインターネットが大きく普及したことで、大多数の人々の生活スタイルが大きく変わった。これと同様に、生成AIが本格普及すれば生活スタイルが変わると予測される。顧客体験が様変わりするタイミングだ」と話します。たとえば、ユーザーの意図に基づいて情報収集や予約などを自動で行う「パーソナルAIアシスタント」が一般化すれば、ユーザーがブラウザにアクセスしたり、スマホを操作したりする機会自体がなくなる可能性もあるとのこと。阿部氏はこうした未来も想定し、「これまでの顧客体験のあり方や、クリエイター自身の持つ素養を一から見直さなくてはならない」と警鐘を鳴らしました。一方で、顧客体験ビジネス全体を統合的にプロデュースする役割の重要性が高まることで、クリエイターとしてのチャンスも広がるとの見方を示しました。 AI時代の「顧客体験」はよりシビアなものへと変化する洞ノ上氏は広告代理店の視点から、「（代理店に委託しなくとも）インハウスですべてのクリエイティブをまかなえるようになる未来」も想定し、厳しい局面に備えるようにと強調。「『広告を作る』という表面的な作業のみでなく、『テクノロジーで価値を還元する』という意識のもと、さらに強いアドテックカンパニーに生まれ変わっていくべきだ」と提言しました。内野は、お二方のお話を時折うなずきながら拝聴するとともに、必要に応じて質問を投げかけるなど、進行をサポート。非デザイナー職であるからこその視座で、参加者の皆様にも分かりやすいセッションを実現するべく努めました。セッションが円滑に進むようモデレートする内野モデレーター｜GMOインターネットグループ　内野皓太　セッションにてモデレーターを務めたGMOインターネットグループ内野皓太は、既存の枠組みに捉われない自由な発想で新しい事業やサービスを生み出すなど、高いパフォーマンスが期待できる優秀な人財に対して年収710万円（2年間）をお約束する「新卒年収710万プログラム」で入社したスペシャリストの1人です。2023年に新卒入社後、GMOインターネットグループ全体のAI活用推進プロジェクトや「AI 熊谷正寿」用のデータセット作成など、AI領域全般を担当しています。 GMOインターネットグループ内野皓太 GMOインターネットグループのAI推進の取り組みさて、そんな内野が在籍するGMOインターネットグループでは、2024年2月新キャッチコピー「AIで未来を創るNo.1企業グループへ」を発表すると同時に、AIによる業務効率化目標や100億円規模のGPUサーバー取得も公表しました。 GMOインターネットグループは2015年から本格的なAI研究開発に着手しており、とりわけChatGPTのサービス開始以降は全社を挙げてさまざまなAI活用施策を推進しています。内野が現在注力している業務も、まさにこの流れのなかに位置付けられます。ここではセッションが実現した背景として、取り組みの一部をご紹介します。 AI（愛）しあおうぜ！ChatGPT業務活用コンテスト GMOインターネットグループ全体でのAI活用推進の第一歩は、AI活用実例やアイデア、PoC開発や商材へのAI導入事例などをグループから集める「コンテスト」でした。賞金総額1,000万円という規模で行われたコンテストはグループ全体でのAI活用の起爆剤となり、パートナー（社員）の関心を高め、実践的な活用事例を共有する場を創出することができました。そして、このコンテストをきっかけに、AI活用を推進するプロジェクトとして「AI（愛）しあおうぜ！」がスタートしました。内野は入社直後よりこのプロジェクトにおける実務の大部分を担っており、「生成AIに対する全パートナーの盛り上げや啓蒙活動が達成でき、手応えを感じている」と話します。賞金総額1,000万円超！4つの部門で毎月開催！「AI（愛）しあおうぜ！ChatGPT業務活用コンテスト」開始！全社で行うAI教育 GMOインターネットグループでは、AI活用促進のため上述した「AI（愛）しあおうぜ！」の一環として、最新情報をリアルタイムで共有するSlackチャンネルの開設や、定期的なAIセミナーなどを開催しています。とくにセミナーに関しては、必須参加／任意参加の両方を設けることで、全パートナーがそれぞれの興味・関心に応じてAIリテラシーを高められる環境を整えました。さらにGMOインターネットグループ全体では、AI活用に必須の知識を問うオリジナルテスト「GMO AIパスポート」を実施し、AIリテラシーの底上げ・向上のため、在籍・入社するパートナー全員の合格必須を徹底してきました。加えて、今後はどんな職種・業種の人財でもAI活用が必須になるという考えから、非エンジニア向けリスキリング施策「虎の穴」を開始。3ヶ月間の短期AI人財育成プログラムとして、基礎知識からプロンプトエンジニアリング、実践的業務活用までを学べる内容を提供しています。なお、2025年4月からは対象範囲を拡大し、エンジニアやデザイナーにより有用な講義も充実させたうえ、オンデマンドで必要な分だけ受けられるように改善し提供する予定です。 GMO AI＆ロボティクス商事株式会社 2024年6月には、「GMO AI＆ロボティクス商事」（通称：GMO AIR）を設立しAI・ロボット事業に本格参入しました。内野はこの会社にも出向中で、AI関連領域全般を担当しています。この新会社では、AIとロボット技術を活用した製品・サービスを通じて、日本企業のDX推進や人手不足解消に貢献していきます。 AI 熊谷正寿『GMOイズムくん』さらに直近（2024年12月）では、GMOインターネットグループ代表・熊谷の経営ノウハウや意思決定プロセスをAIに学習させた「AI 熊谷正寿『GMOイズムくん』」をグループ内向けにリリースしました。熊谷代表の思考や判断基準をAI化することで組織文化の維持・発展を図るとともに、パートナーの「相談役」として、日々の業務における意思決定の質と速度向上を目指しています。セッション終了後にはAsk the Speaker（登壇者への質疑応答タイム）が設けられましたが、参加者から内野へは、やはりこの「AI 熊谷正寿『GMOイズムくん』」に関する質問が多く寄せられました。参加者からも多くの質問が寄せられました今回のセッションを振り返ってセッション終了後、モデレーターを務めた内野さんに感想を聞きました！内野今回のセッションでは、自分の専門ではないデザインの領域について、プロフェッショナルのお話を近くで聞くことができ、非常に大きな学びを得ました。特に印象に残ったのは、AIに対する向き合い方として「AI時代のデザイナーが価値を発揮していくためには、データやAIの力を借りて、既存の業務や知識の領域から抜け出していくことが重要」という旨のご提言でした。さらには、ある意味でAIの台頭に危機感を募らせておられるからこその、「AIと上手に付き合い、ディレクションやオーケストレーション（指揮）を行う、あるいは自分の経験以上の成果を出せるようにならなければならない」というお言葉にも、大変気が引き締まりました。AIによって自らの能力を拡張できる時代は夢があるようでいて、知識の守備範囲を広げなければならないというプレッシャーもあります。クリエイティブの最前線でバリューを発揮されている2社様から貴重なお話を伺えたことで、気が引き締まりました。すでにGMOインターネットグループではAIに関する取り組みを多数行っていますが、今後も気を抜かずに、全パートナーの意識・スキル向上に向けて尽力していきます！セッション終了後には懇親会が行われ、内野さんも壇上から挨拶をしましたまとめ Stable DiffusionやDALL-Eをはじめとする画像生成AIの台頭以降、予測モデルの作成など、クリエイティビティにおいてもAIが存在感を発揮するようになったことが緊張感を持って語られた本セッション。日進月歩で新たなテクノロジーが生み出される領域だけに参加者の熱意も高く、熱心に講演に聞き入る方が多かったのがとても印象的でした。 GMOインターネットグループは、これからもAI活用のトップランナーとして、「AIで未来を創るNo.1企業グループへ」というキャッチコピーのもと、クリエイティブ領域を含めたさまざまな分野でAI技術の可能性を追求していきます！

2025.04.16

技術情報

DevSecOps文化を育てる：少しずつ、でも着実にチームと前進するために

はじめに：文化は、導入するものではなく、育てていくものこの記事は、複数のチームが関わる中規模〜大規模な開発組織で、DevSecOpsを推進しようとしている方々に向けて書いています。横断チームのマネージャーとして、組織をまたいで文化を育てるという難易度の高いテーマに向き合ってきました。 DevSecOpsという言葉に初めて出会ったとき、定義や概念には納得感がありました。でも、いざ現場に落とし込もうとすると、「で、うちのチームでは何から始めるべきなのか？」が見えてこない。本や記事では「継続的な価値提供」「セキュリティのシフトレフト」などの美しいフレーズが並んでいます。しかし、それをどう実現するか──現場と一緒に、泥臭く、迷いながら、どこまで進めるのか？その答えは、自分たちで見つけるしかありませんでした。この記事は、私たちがその中で見えてきたもの、失敗したこと、気づいたことを丁寧に綴った記録です。 1. DevSecOpsを手探りで始めた私たちの第一歩最初のきっかけは、クラウドやAIなどの新しい技術を取り入れてみることでした。・GitHub Copilotによる補完体験・CodeRabbitを活用したAIコードレビュー支援・クラウドCI/CDの導入・セキュリティチェックツールの連携正直なところ、「とりあえず使ってみよう」というノリでした。でもやってみると、自分たちのチームや組織に“合う・合わない”があることにすぐ気づきます。例えば、AIレビューは便利だけど、出てくる指摘の意味が分からなければ信頼されません。CI/CDも、パイプラインの構成が複雑すぎると定着しない。つまり、“使える技術”と“文化として根づく技術”には距離があるということです。 🧭 図解：DevSecOps文化醸成のステップ 2. ツール導入と現場とのギャップ技術を導入するだけでは文化は変わりません。最初は、「便利そう」と感じてくれるチームもありました。しかし、誤検知の多い静的解析や、ブラックボックスに見えるAIの指摘に戸惑い、“なぜやるのか”が見えなくなる瞬間が多くありました。私たちはそこで、「まずは実感できる成功体験を届けよう」と考えました。・Copilotが実際にバグを予防した例を共有する・セキュリティチェックで見つけた課題を可視化して「よかった」と言える空気をつくる・PR作成時に自動で走るCIを“当たり前”にする構成を用意する文化は機能よりも「習慣」によって育ちます。“気づいたら使っていた”が、“なぜか定着していた”に変わる。そんな状態を目指しました。 3. チームの状態を可視化する仕組みをつくった定着し始めたツールや仕組みを次に活かすには、「今、どうなってるのか」を見えるようにする必要があります。私たちは、4Keysをもとにした社内向けの可視化ツールを内製しました。・チーム単位で数値を出す（可能な限り負担は軽く）・数字を競わせるのではなく、「きっかけ」として使う・状態を見て、対話し、課題があれば一緒に考えるこのサイクルが、チームを“自分たちで変えていく”文化への入口になっていきました。 📊 図解：4Keys活用による改善サイクル 4. 改善を“自分ごと”にする文化づくり改善を文化として根づかせるには、やらされ感をなくし、「自分たちで選んだ」感覚を持ってもらう必要があります。そこで私たちが大切にしたのは以下の3つです：１．目標はチームが自分たちで決めること２．KPIではなく“会話”を中心に運用すること３．改善アクションを称え合う空気をつくることこの3つを軸にすることで、改善は押し付けから、自発的な営みへと変化していきました。改善そのものを“文化”と呼べる状態が少しずつ育ち始めたのです。 5. 一人では進めない。だから仲間と進む横断チームのマネージャーとして、旗を振ることはできます。でも、進めるのは現場のメンバーたちです。そこで私たちは、各チームにセキュリティ担当や推進開発改善リーダーを置き、共に進める仲間を増やしました。・成功事例は小さくても共有・工夫や悩みを安心して話せる場づくり・重複する課題は横断で引き取り、仕組み化して展開文化は、一人の声では育ちません。たくさんの「共感」から生まれる小さな行動の連鎖が、やがて“チームの空気”になります。 🤝 図解：横断チームとプロダクトチームの関係性 6. よくあるつまずきと、私たちの乗り越え方（FAQ）よくある悩み私たちのアプローチ何から始めれば？小さなテストや自動化から着手チームの温度差が大きい状態を可視化して対話を促進セキュリティ教育のハードル「ちょっと気にする」会話から始める 7. そして今、文化を「つくる」フェーズへ 2024年は、土台を整え、仕組みを準備した年でした。2025年は、いよいよ文化を“定着させていく年”です。・ツールを“使う”から“使いこなす”へ・チームが自律的に改善サイクルを回す状態へ・各チームにあった形で、改善が“当たり前”になるように一歩ずつ、着実に前へ進んでいます。おわりに：まだ道の途中。でも、確かな手応えがある DevSecOpsは、技術だけではありません。それは、「価値を届ける力を、チームで育てる文化」だと思っています。うまくいかないこともある。迷うこともある。でも、仲間と一緒に考え、小さくても前に進む。 👉 これからも、変化を楽しみながら、チームとともに文化を育てていきます。この記事が届いてほしい人へこの記事は、こんな方に届けばと思っています。・DevSecOpsを導入しようとしているが、最初の一歩に悩んでいる方・技術だけでなく、文化として根づかせたいと願っている方・横断的な立場で、各チームをどう巻き込むかに悩んでいる方あなたの悩みや迷いに、少しでも寄り添えたなら嬉しいです。もし共感いただけたら、ぜひ社内やSNSでも共有してください。

2025.04.08

技術情報

今更ですが、改めてLLMの何がすごいのかをおさらいしてみた ─Word EmbeddingからReasoningまで─

はじめに大規模言語モデル(LLM, Large Language Model)は、近年とても注目を集めています。しかしネット上の資料を見ていると、数式や数学的な手法の解説が多く「そもそもなんでこんなことをしているの？」という根本的な部分の説明が意外と少ないように感じます。私も最初に勉強したときはなかなかイメージを掴めず苦労しました。そこで、今さらですが、LLMの基本的なアイデアや背景を振り返り、自分なりに整理してみました。正確さよりも直感的な理解を重視し、イメージを中心に書いています。細かい数式ではなく、概念や流れを掴むための参考として読んでいただければ幸いです。私たちが機械学習を使うとき、いったい何をしているのか？突然ですが、「機械学習の本質とは何か？」と考えたことはありますか？私の捉え方としては、「データをもとに、与えられた条件下で望ましい結果を導くための“仕組み”を学習し、それを新たな状況にも応用できる能力を機械に持たせること」だと思っています。そして、私が特に重要だと考えるのは次の2点です。 “仕組み”を理解するに当たって十分なデータがあること学習の方向性が明確で、モデル自身が答え合わせをしながら最適化していけること現実社会だと、上司や取引先から「データも目標もないまま『いい感じでやっといて』と言われる」ような状況がよくありますよね。そうなると、人間だって何をどう頑張ればいいのか分からないものです。同じように機械学習でも、たくさんのデータと「どんな目標を目指すのか」という明確なゴール設定がないと、モデルはうまく学習できません。さらに、機械は人間の五感とは違いあくまで「0」と「1」の情報（コンピュータが扱う数値）でしか物事を認識できません。たとえそれを拡張していろんな数値を扱えるようにしても、最終的にやり取りされるのはあくまでも数値のみです。つまり、現実世界の問題を機械学習モデルに解かせるには、以下の要件を満たす必要があります。条件としての「入力」と結果としての「出力」を数値（ベクトル・マトリックスなど）で表現できること「入力」と「出力」の関係性を、何らかの数値計算（例：最も基本的な線形モデル y = wx + b など）として表現できること以上を踏まえ、LLMにまつわる技術はどうやってここまで発展してきたのか、その重要なポイントを振り返ってみましょう。テキストの数値化 LLMの出力は、文章生成や分類ラベルなど、タスクによって異なりますが、入力はほとんどテキスト（文章）です。そのため、まずは前述の要件1を満たすために、テキストを数値として表す必要があります。単語に番号を振る主な目的テキストの単語や文字に一意のIDを割り振り、機械が扱える整数として表現する。実際のLLMでは、厳密には「トークン」単位で処理が行われていますが、ここでは説明を簡略化するため「単語」という用語を使います。主な仕組み例えば、「あ」＝1、「い」＝2、「う」＝3 … のように、文章に含まれる単語や文字ごとに単純な整数IDを割り振る。主な問題点この方法では、数値演算が行われた場合に問題が生じます。例えば、1 + 2 = 3 と計算すると、「あ」+「い」＝「う」となり、単語本来の意味が保持されなくなってしまいます。 One-Hot Encoding 図の出典 Hema Kalyan Murapaka. 「Natural Language Processing: One-hot Encoding」, Medium. https://medium.com/@kalyan45/natural-language-processing-one-hot-encoding-5b31f76b09a0 (参照：2025年3月13日) 主な目的各単語を、お互いに重なり合わあないベクトル（直交ベクトル）で表現し、計算時に単語の意味が混ざらないようにする。主な仕組みあらかじめ用意した「語彙数」と同じ次元のベクトルを作り、該当する単語の位置を1、それ以外を0にする。主な問題点意味が重なりあわないため、どの単語同士を比べても類似度が常に0になり、「意味的な関係」が捉えられなくなります。また、単語数が増えれば増えるほど、次元も増えていくので、データが膨大になります。そこで、機械学習でうまく「単語同士の意味合いの近さ」を学習させる方法が考案されました。単語埋め込み(Word Embedding) 図の出典 Metin Bilgin, Izzet Fatih Senturk. (2017). Sentiment analysis on Twitter data with semi-supervised Doc2Vec. ResearchGate. https://www.researchgate.net/publication/320829283_Sentiment_analysis_on_Twitter_data_with_semi-supervised_Doc2Vec (参照：2025年3月13日) 主な目的単語同士が「意味的にどれくらい似ているか」をベクトルの距離として扱えるようにし、数値計算が可能になるようにする。 Word Embeddingにより、意味的に類似する単語はベクトル空間でも近い位置にマッピングされ、「数値同士の距離」＝「意味的類似度」として扱えるようになります。主な仕組み Word2Vecなどの技術が代表的で、文章中の前後の文脈からターゲットとなる単語を推定するタスクをモデルに与え、その誤差を使って単語ベクトルを学習する。大規模なコーパス（文章データ）が活用できるため、人間が手作業で作った同義語・対義語リストなどがなくても自然な文脈情報から学習が進むのが特徴。 Word2Vecで代表的な2つの学習手法は以下のとおりです。 CBOW (Continuous Bag of Words) 前後の文脈から中心となる単語を推定するなどして、単語ベクトルを学習する。例: 「I ？ coffee」では、「？」に入る単語（love）を当てるなどして学習し、その正解との誤差をもとに単語ベクトルが更新されます。 Skip-gram 中心の単語から周辺の文脈を推定するなどして、単語ベクトルを学習する。例: 「I love coffee」の場合、中心単語「love」から前後の単語「I」や「coffee」が出現する確率が高くなるなどして学習されます。なぜWord Embeddingがすごいのか？仕組みを理解するに当たって十分なデータがある：世界中に存在する無数のテキストデータを、そのまま「単語の前後関係」を捉える学習データとして利用できるなどして、大規模なデータが容易に活用できます。習の明確な方向性がある：「文脈から単語を当てる」または「単語から文脈を当てる」という明確なタスクが設定されるなどして、正解データ（答え合わせ）をもとに学習が進められます。私は、「最終目的は“文脈から単語を当てる”ことではなく、学習の過程で得られる単語ベクトルを活用する」という発想が画期的だと思います。主な問題点固定された単語ベクトルでは「多義性」を扱いづらいことです。ここでの多義性とは、固定された複数の意味を持つ単語（例：「Apple」）だけでなく、文脈によって意味が大きく変化する代名詞（例：「it」）も含まれます。文脈の取り入れ ELMo (Embeddings from Language Models) 図の出典 Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. arXiv preprint arXiv:1810.04805. https://arxiv.org/abs/1810.04805 (参照：2025年3月13日) 主な目的文脈によって単語ベクトルを動的に変化させ、同じ単語でも前後関係に合わせて意味が変わるようにする。主な仕組み LSTM（Long Short Term Memory）ベースの双方向言語モデルを使用して、文章全体から得られる文脈情報をもとに、各単語のベクトルを生成する。 ELMoのどこがすごいのか？ ELMoの革新性は、「入力として与える単語（または文書）の数値ベクトルと、出力として得られる文脈を考慮した数値ベクトルが必ずしも一致する必要がない」という発想にあると思います。この手法は、モデルに入力する単語（文書）の数値ベクトルと、出力で文脈を考慮した単語（文書）の数値ベクトルが必ずしも一致する必要がないという考え方に転換します。また、Word2Vecが学習後の「単語ベクトル」だけを利用するのに対して、ELMoではモデル自体、つまり文脈情報を取り入れるプロセスそのものが重要となっています。主な問題点 RNN（LSTM）構造で文章を順次処理するため、並列化が難しく、長い文章では冒頭の情報が後半まで届きにくいという問題があります。 Attention 主な目的 ELMoのような順次処理の欠点を一気に解決し、文章全体の単語同士の関係をうまく捉えられるようにする。主な仕組みテキスト中の各単語について、「どの単語とどれくらい関連度が高いか」を重み（Attention Weight）で計算する。具体的には、以下の3つのベクトルを用意する：・Q (Query): 「どんな情報を探しているか」を示す・K (Key): 単語の特徴やラベル・V (Value): 単語の持つ実際の意味情報QとKの内積（類似度）から得られた重みに応じてVの情報を合成し、文脈を考慮したベクトルを得る。 Attentionのどこがすごいのか？発想面：単語自身の意味を表すVに加え、他の単語との関係性を計算するためのQとKを導入することで、文脈依存の情報を捉えることができます。性能面：全ての単語間で類似度計算を並列処理できるため、逐次計算の必要がなく、文書の長さに関わらず一定の計算処理で済むことができます。並列計算が可能な構造であるため、GPUを用いた大規模学習に適しており、今日のような超巨大モデルが生まれることにもつながります。厳密には、無限に長い文書を計算できるわけではなく、あらかじめ指定されたウィンドウサイズ（一般的には512トークン程度）の制限がありますが、現在の技術の進歩により、徐々にこの制限を突破できるようになっています。主な問題点全ての単語に対して他の全ての単語との類似度を計算するため、文書が長くなると計算量が二乗的(O(n^2))に増加します。そのため、学習や推論に大量の計算資源（GPU時間）が必要となります。 Self-Attention 図の出典 Jay Alammar. 「The Illustrated Transformer」, Jalammar's Blog. https://jalammar.github.io/illustrated-transformer/ (参照：2025年3月13日) Self-Attentionは、同じ系列（文章）内の単語同士の関連を捉えるAttentionの仕組みです。実際の大規模言語モデルで最も広く使用されています。主な目的単一の文章内で単語同士の関係を並列的に計算し、各単語を「文脈を踏まえた表現」に変換する。主な仕組み入力系列Xから同じ方法でQ、K、Vすべてを生成する。これにより、系列内のすべての単語が互いにどれだけ関連しているかを直接計算でき、文章中の全単語が互いに参照し合うことが可能になる。なお、マルチモーダルの応用では、テキスト入力だけでなく画像、音声、動画なども扱うため、Self-Attentionとは異なる仕組みを利用し、QとKVを別々の方法で生成する場合もあります。 Multi-Head Self-Attention 図の出典 Jay Alammar. 「The Illustrated Transformer」, Jalammar's Blog. https://jalammar.github.io/illustrated-transformer/ (参照：2025年3月13日) 主な目的単語が複数の解釈可能性を持つ場合、複数の異なる観点（Head）でAttentionを学習させることで、文脈理解をより柔軟にする。主な仕組み入力系列Xから複数の(Q, K, V)を作り（複数のHeadを持つ）、それぞれ独立にAttentionを計算した結果を結合する。上の図例で示すように、2-head にした場合のヒートマップでは、「it」が 1つ目（オレンジ）のHeadでは「The animal」の意味情報を、2つ目（緑）のHeadでは「tired」の状態を重点的に反映していることが示されています。また、曖昧な句の例として、「John told Bill that he would win」という文章では、「he」が「John」または「Bill」のどちらを指すのか、複数のHeadで異なる視点から解釈することが可能となります。 Masked Self-Attention 図の出典 Jay Alammar. 「The Illustrated GPT-2 (Visualizing Transformer Language Models)」, Jalammar's Blog. https://jalammar.github.io/illustrated-gpt2/ (参照：2025年3月13日) 主な目的文章生成タスクなどで、まだ生成されていない未来の単語を参照しないようにする。モデル学習時には前後の文脈すべてが利用できますが、実際のテキスト生成時には現在の単語以降は未知です。そこで、学習時に「未来の単語」をマスクして左から右へ単語を生成する状況を模擬し、推論でも同じマスクを適用することで、未来の単語情報を参照せずに順次文章を生成できるようにします。主な仕組み後の単語情報をマスク（重みを0に）して、予測時に矛盾が起きないように制御する。 Positional Encoding 図の出典 Jay Alammar. 「The Illustrated Transformer」, Jalammar's Blog. https://jalammar.github.io/illustrated-transformer/ (参照：2025年3月13日) 主な目的 Attentionでは捉えきれない単語の順序情報を補い、文章中での単語の位置関係を正しく考慮できるようにする。主な仕組み三角関数（Sin, Cos）の波形を利用した位置情報ベクトルを用意し、単語ベクトルに足し合わせて「単語の順序」を学習できるようにする。なぜ三角関数を使うのか？二つの単語の相対的な順序、すなわち両者の間に挟まれる単語の数は、三角関数の「加法定理」を利用した計算で反映できます。個人的には、この仕組みが非常に巧妙だと感じています。興味がある方は、ぜひ数式を深掘りしてその魅力を実感してみてください。モデル構造の革新 Transformer 図の出典 Jay Alammar. 「The Illustrated Transformer」, Jalammar's Blog. https://jalammar.github.io/illustrated-transformer/ (参照：2025年3月13日) Self-Attentionを中心とするネットワーク構造を持つ代表的モデルがTransformerです。主な目的機械翻訳など、入力言語から出力言語を生成するタスクを効率的に学習する。主な仕組みオリジナルのTransformerはEncoder-Decoder構造で提案された。- Encoder：入力文を読み取り、埋め込み表現（深い特徴）に変換する。- Decoder：Encoderから得られた特徴をもとに出力文を生成する。なぜEncoder-Decoder構造を使うのか？翻訳タスクを念頭に、入力言語と出力言語を自然に分業する形で設計されたためです。しかし、その後の研究により、EncoderのみまたはDecoderのみのモデルでも十分強力な自然言語処理が可能であることが示され、さまざまな派生モデルが生まれました。 BERT (Bidirectional Encoder Representations from Transformers) 図の出典 Ankur Kumar. 「The Illustrated BERT Masked Language Modeling」, https://ankur3107.github.io/blogs/masked-langauge-modeling/ (参照：2025年3月13日) 主な目的「理解」タスクに強いモデルを目指し、文章の深層的な意味表現を獲得して、文章分類や質問応答などに応用しやすくする。主な仕組み TransformerのEncoder部分のみを利用し、その層を深く積み上げる。MLM (Masked Language Modeling)：入力文の一部単語をマスクし、元の単語を当てるタスクで学習する。双方向の文脈情報を活用できるため、文全体の意味をより深く理解できる。NSP (Next Sentence Prediction)：2つの文が連続しているかを判定するタスクも同時に学習する。 BERTは「文書理解」寄りのタスクを大量にこなすことで、さまざまな下流タスクに対してファインチューニングで転用しやすいのが最大の利点です。 GPT (Generative Pre-trained Transformer) 主な目的「生成」タスクに強いモデルを目指し、文章補完、要約生成、対話生成などに特化する。主な仕組み TransformerのDecoder部分のみを利用し、その層を深く積み上げる。巨大なパラメータ数で膨大なテキストデータを学習することで、高い生成性能を得る。 OpenAIがバージョンアップを重ねる中、GPT-3は当時驚異的とされた1750億パラメータを備え、大規模データによる学習効果（スケーリングの効果）を実証しました。この流れを受け、「言語モデル（LM, Language Model）」の前に「大規模（large）」が付加され、「大規模言語モデル（LLM, Large Language Model）」という概念が広まりました。主な問題点ハルシネーション：ここまで述べた通り、言語生成モデルの本質はあくまで「今までの文書に続く最も可能性の高いテキストを生成する」ことにあるため、実際に存在しない内容や、回答が存在しない質問にも「それっぽい」テキストを生成してしまう性質があります。これは、「無いものを無いと判断する」必要があり、いくらデータがあってもモデル自体が答え合わせを行うことができないため、LLMの学習の仕組み上、ハルシネーションを完全に避けることは困難です。こうした問題を解決するために、事後学習 (post-training) によるアライメント技術が発展してきました。これは、LLMの出力を人間の好む方向に合わせるための仕組みとも言えます。テキスト生成タスクの改善教師ありファインチューニング(SFT, Supervised Fine-Tuning) 主な目的モデルの出力を、あらかじめ用意された「理想的な回答例」に近づけるように調整する。主な仕組み人間が作った高品質な「質問－回答」ペアを学習データとして与え、モデルがその正解と照らし合わせながらパラメータを更新する。主な問題点人間が膨大なデータ（高品質な文書）を用意するのは、非常に高いコストがかかります。人間の回答を模倣するだけでは、未知のタスクへの汎化や人間を超える答えを出すことが難しい場合があります。人間のフィードバックによる強化学習(RLHF, Reinforcement Learning from Human Feedback) 主な目的人間が「好む・望ましい」回答を、より効率的に学習させる。主な仕組み報酬モデル（Reward Model）の学習：人間アノテータがモデルの出力例に順位付けを行い、「どの回答がより望ましいか」を学習データとして作成する。強化学習による微調整：報酬モデルを用いて出力の「良さ」を評価し、PPO (Proximal Policy Optimization)などの強化学習手法でモデルを更新する。主な問題点人間が膨大なデータ（高品質な文書）を用意するのは、非常に高いコストがかかります。人間の回答を模倣するだけでは、未知のタスクへの汎化や人間を超える答えを出すことが難しい場合があります。こうした技術によって、OpenAIがChatGPTをリリースし、非常に自然な対話や柔軟な文章生成が可能なチャットボットとして世界的に大きな注目を集めました。いわゆる「ChatGPT moment」がここで生まれたわけです。推論（Reasoning）近年は、LLMの「推論力」をいかに高めるかが大きなテーマになっています。代表例としてOpenAI o1が挙げられます。天秤AI by GMO チャット画面、質問「1204 * 1402=?」に対するOpenAI o1の回答例主な目的従来のLLMが苦手とする論理思考や複雑な推論タスクを、高い精度でこなす。主な仕組み Chain-of-Thought と呼ばれる考え方を用いて、長い推論や計算を段階的に分割し、それぞれのステップで確からしい答えを積み重ねるように学習する。なぜChain-of-Thoughtが効果的なのか？簡単な問題（ステップ）は、世界中の言語データで頻繁に出現するため、生成されるテキストが正しい可能性が高いです。一方、複雑な問題は出現頻度が低いため、モデルは未知のパターンの解答を「それっぽく」生成してしまうことがあります。このように、複雑な問題を段階的なステップに分解することで、従来のモデルが一度に曖昧な回答を生成するのを避け、各ステップごとに正答率を向上させることが可能となります。周知のとおり、OpenAIはクローズドなAI企業であるため、o1の具体的な実装方法は公開されていません。しかし、世界中の科学者たちがOpenAIのレポートなどを分析した結果、非常に高コストで複雑な仕組みを採用していると推測されています。 DeepSeek-R1-Zero 「DeepSeek-R1」ファミリーは、「数学的タスクやコーディングタスクにおいてOpenAIの推論モデルo1と同等の性能を、超低コストで実現した」と直近の話題になっています。主な仕組みあらかじめ、そこそこ高性能な学習済みベースモデル (DeepSeek-V3-Base) を用意し、そこからSFTを一切行わずに、強化学習のみで調整する。GRPO (Group Relative Policy Optimization) という独自の手法を採用し、従来の強化学習で必要とされる価値関数（一種のモデル）の学習を省略できるようにした。強化学習時には、モデルに「理由を考えてから解答する」というシンプルなプロンプトのみを指示する。なぜGRPOの仕組みが効果的なのか？通常の強化学習（例: PPO）では、「現在の方策がどれくらい良いか？」を判断するために、「状態価値関数」と呼ばれる指標を用います。一方、GRPOはこれまでの出力の平均的な良さを基準にして、「今回の出力の方が良いのか？」を判断しながら学習を進めます。これによって、モデルは複数回試行した結果を比較し、より良いものを選ぶことで、自らパラメータを調整し精度を向上させることができます。ただし、ベースモデルが小さいと、最初の出力が不安定になりやすく、この手法が十分に機能しない場合もあると報告されています。これは、初期の生成結果がバラつきやすいため、比較の基準（ベースライン）が安定しにくくなるためです。なぜ数学とコーディングに強いのか？数学やプログラミングの問題は明確な正解が定義しやすいため、モデルが「自分で答え合わせしやすい」ことが大きな要因です。終わりに本稿でご紹介した内容は、LLMが扱う膨大な研究領域のうちのほんの一部分で、まだまだ重要な概念を多く省略しています。私自身も執筆しながら、漠然としていた知識が結びつき、研究者の方々の発想の素晴らしさをあらためて実感しました。本稿を通じて、少しでもそのエッセンスがお伝えできたのなら幸いです。今後もLLMやAIの世界は必ず進化し続けますので、私も皆さんと同じように新たな技術やアイデアに触れ、学びや発見の感動を一緒に味わっていければと思っています。参考資料 Attention Is All You NeedBERT: Pre-training of Deep Bidirectional Transformers for Language UnderstandingThe Illustrated TransformerThe Illustrated GPT-2 (Visualizing Transformer Language Models)What is Query, Key, Value (QKV) Attention ?预训练语言模型的前世今生《大型语言模型简史》基于transformers的自然语言处理(NLP)入门Positional Encoding徹底解説：Sinusoidal（絶対位置）から相対位置エンコーディングDeepSeek R1 and V3 〜OpenAI o1級のオープンモデルの作り方〜LLMチューニングのための強化学習：GRPO（Group Relative Policy Optimization）

2025.04.07

技術情報

GMOインターネットグループのロボット人材派遣型サービス始動─ヒューマノイド×AIで切り拓く、未来への一歩

2025年4月3日──この日は、GMOインターネットグループがヒューマノイドG1を活用したロボット人材派遣型サービスを正式にスタートした、いわば私たちにとって“ロボット派遣の初日”になります。GMO AI＆ロボティクス商事株式会社がこれまで構想してきたビジネスモデルを、いよいよ社会実装フェーズへと移行させるときが来たのです。はじめに：ロボット人材派遣の“はじまりの日” 2025年4月3日、GMO AI＆ロボティクス商事は、最新型ヒューマノイドロボットを活用した「ロボット人材派遣型サービス」の提供を正式に開始しました。従来の「ロボットレンタル型」ではなく、GMOインターネットグループがロボットの動作を事前にプログラミングし、現場に派遣するという点が本サービスの最大の特長です。ヒューマノイドロボットが、「共に働くパートナー」として社会に登場する第一歩とも言えるでしょう。ヒューマノイドって何するの？：ロボットパートナーのしごとヒューマノイドG1は、イベントや商業施設に登場し、来場者への手振りや握手、さらには商品の案内など、まるで「店員さん」のような存在として振る舞うことも出来ます。お客様からの「こんな動きをしてほしい」「このシーンで使いたい」といった要望にも応じて、可能な限り、動作をプログラムし、現場に最適な振る舞いを提供。ヒューマノイド機体には、Unitree Robotics社製「G1」を採用。身長130cmのコンパクトサイズながら、高精度の3Dカメラ・LiDAR・関節制御を備え、自然な案内や接客動作が可能です。従来にはなかった新たなエンターテインメントコンテンツの創造や、インパクトのあるブランドPRが可能になります。派遣先は以下のようなシーンを想定しています。展示会やイベントでの受付・商品説明・ブランドPR商業施設での接客・来場者案内子ども向けイベントでのエンタメ演出企業カラーを纏ったPRロボットとしての演出実証実験でのシステム連携検証などライブコマースやSNS配信での商品紹介パーソナリティライバーやYouTube演出としてのメディア出演・撮影対応手振り・音声・握手など、多彩なアクションを組み合わせ、ユニフォーム着用も可能。企業ごとの世界観を損なうことなく“話題性ある接客”が実現できます。そもそもなぜ“ロボット人材派遣”？──世界の潮流とGMOインターネットグループの立ち位置中国などの先進市場では、すでに展示会やライブコマース、商業施設でヒューマノイドロボットが“客寄せ役”として活用されるようになりました。日本でも同様のニーズは高まりつつあり、GMOインターネットグループはそのギャップにいち早く応えるかたちでサービスを開始しました。また背景には、2つの大きな社会課題もあります。深刻な労働力不足や高齢化人財コストの増加こうした課題に対し、GMO AI＆ロボティクス商事は「AIとロボットをすべての人へ。」というビジョンを掲げ、解決に取り組んできました。そして、今回の取り組みはその延長線にある─ 「Labor as a Service / Robot as a Service」＝労働力をサービス化する、新しい働き方への挑戦でもあります。ロボットが「目を引く存在」から「現場に貢献する存在」へと役割を進化させている実例が増えている中、GMO AI＆ロボティクス商事の“人材派遣型”というスタンスも、こうしたニーズの先取りと言えるでしょう。 GMOインターネットグループのパートナーズ・カンファレンスに登場！ロボット人材派遣型サービスリリースを翌日に控えたその4月2日、ヒューマノイド G1 は GMOインターネットグループのグループ全体会議「パートナーズ・カンファレンス」に私たちが愛情を込めて“ひとみん”と呼んでいるヒューマノイド G1が登場しました。このイベントは、グループ全体のパートナー約8,000名がリアルタイムで参加する重要な社内カンファレンス。グループ代表熊谷に紹介されるかたちで"ひとみん"がステージに登場すると、その姿に会場の視線が一斉に注がれました。グループ代表熊谷と登壇する"ひとみん" 登壇後、Go2と記念撮影やや緊張した面持ちでステージに上がった"ひとみん"でしたが、軽やかな足取りで壇上へ進み、自己紹介とともにGMOインターネットグループの企業紹介をスムーズにこなしました。その姿に、会場からは安堵と驚き、そして温かい拍手が送られ、感動に包まれる瞬間となりました。 GMOインターネットグループの企業紹介の様子は、以下の動画からご覧いただけます。 https://youtu.be/TOUz07O3rj4 GMOインターネットグループの“縁結び”という役割 GMO AI＆ロボティクス商事はロボットの外見やボディを設計する企業ではありません。しかし、私たちが本当に挑んでいるのは、社会とテクノロジーをつなぎ、ロボットが“人と共に働く存在”になる未来を形にすることです。言われたとおりに動くだけの存在ではなく、場の空気を読み、人と自然に関わり、笑顔と感動を生み出す存在─そんな“仲間”のようなロボットを実現するために、GMOインターネットグループのクラウド・AI・ネットワークインフラの技術を活かし、社会とロボットの橋渡しを行っていきます。そしてようやく、GMO AI＆ロボティクス商事が掲げてきた“AIとロボットの縁結び役”というビジョンが、ビジネスモデルとして社会の中で動き出すタイミングが訪れたのです。ロボットとAI、インフラ、データ、そして人をつなぎ、機械から“働く仲間”になる未来。その一歩目が、今ここから始まります。このロボット人材派遣型サービスは、単なる話題づくりではなく、「働き方」の進化を実装する社会実験でもあります。これからもGMO AI＆ロボティクス商事は、ロボットとAIの“縁結び役”として、社会に笑顔と感動を届けるサービスを磨き上げていきます！業務支援・PR・体験価値向上の新たな切り札として、ロボットを“活躍する存在”に変える。その挑戦を、私たちはこれからも続けていきます。ロボット人材派遣型サービスのご紹介ページロボット人材派遣型サービスのお問い合わせはこちらから GMO AI&ロボティクス商事株式会社

2025.04.03

技術情報

CATEGORY

KEYWORD

YEAR/MONTH

AUTHOR

SNS FOLLOW

OLD REPORT

TAG

技術情報の記事一覧

CATEGORY

CATEGORY

KEYWORD

YEAR/MONTH

AUTHOR

SNS FOLLOW

OLD REPORT

TAG

技術情報 の記事一覧

CATEGORY

技術情報の記事一覧