開発者向けブログ・イベント

DynamoDB設計で痛い目にあった話 – RDB脳から抜け出すための実践ガイド

この記事は GMOインターネットグループ Advent Calendar 2025 11日目の記事です。こんにちは。GMOペパボ株式会社のyumuです。今回、リワード広告システムの開発で、スタンプデータの管理にDynamoDBを採用しました。「DynamoDBを使ってみたい！」という興味本位な気持ちもあって採用を決めたのですが、RDBの設計経験しかなかった私は、いくつかの落とし穴にハマることになりました。この記事では、DynamoDB設計で実際に遭遇した課題と、そこから学んだ設計のポイントを共有します。なぜDynamoDBを選んだのか私たちはハンドメイドECサービス「minne byGMOペパボ」を運営しており、今回リワード広告機能を追加することになりました。ユーザーがアプリ内で広告を閲覧すると、スタンプがもらえる仕組みです。このスタンプデータの保存先として、DynamoDBを選択しました。理由は以下の通りです。スタンプデータはユーザーIDに紐づくシンプルな構造で、NoSQLとの相性が良さそう読み書きのパフォーマンスが重要DynamoDBを実戦で使ってみたいしかし、この「軽い気持ち」が後々、設計の甘さとして跳ね返ってくることになります。 RDB脳による設計ミス DynamoDBのテーブルを作成する際、私はRDBと同じ感覚で設計を進めていました。「とりあえずユーザーIDとスタンプ情報を保存できるテーブルを作って、必要になったらクエリすればいいか」この考え方が大きな間違いでした。クエリできない！実装を進めて、「特定期間に獲得されたスタンプの一覧を取得する」というクエリを書こうとした時、気づきました。 DynamoDBでは、パーティションキーを指定せずに範囲検索することができない。 RDBであれば SELECT * FROM stamps WHERE created_at BETWEEN '2025-12-01' AND '2025-12-31' と書けば済む話ですが、DynamoDBではパーティションキーの指定が必須です。パーティションキーをuser_idに設定していたため、特定ユーザーのスタンプは取得できても、全ユーザーを横断して期間指定で取得することができませんでした。意図せずScanになっていて、めちゃくちゃ遅い！インデックスを設定して実装したつもりだったのですが、実際に動かしてみるとクエリの実行時間が著しく長いという問題に直面しました。データ量が少ないうちは気にならなかったのですが、テストデータを増やすと、どんどん遅くなっていきます。ログを見てみると、意図に反してScanが実行されていたのです。Scanはテーブル全体をフルスキャンするため、データ量に比例して時間がかかります。原因は、クエリ時のインデックス指定ミスでした。Queryのつもりで書いたコードが、実際にはScanになっていたのです。結局、設計し直し幸い実装を開始した直後に気づいたので大事には至りませんでしたが、アクセスパターンを洗い出して、カラムやLSI、GSIを設計し直すことになりました。 DynamoDB設計とRDB設計の決定的な違いこの失敗を通して、ようやく「DynamoDBはRDBとは根本的に設計思想が違う」ということに気づきました。具体的にどう違うのか、整理してみます。正規化ではなく、アクセスパターン優先 RDBでは、データの重複を避けるために正規化を行い、テーブルを分割します。そして必要に応じてJOINで結合します。しかしDynamoDBにはJOINという概念がありません。そのため、以下のような設計が求められます。アクセスパターンを事前に洗い出すそのパターンに最適化した形でデータを配置する場合によってはデータの重複を許容するつまり、「どんなデータを保存するか」ではなく、「どうやってデータを取得するか」から設計を始める必要があるのです。私が最初にやってしまった「とりあえず必要なデータを入れるテーブルを作る」というアプローチでは上手くいきませんでした。 QueryとScanの違い DynamoDBには、データ取得の方法が2つあります。 ⭐️ Query パーティションキー（とソートキー）を指定して取得効率的で高速 ⭐️ Scan テーブル全体をスキャンして条件に合うものを取得非効率で遅いデータ量に比例して時間がかかる私が実際に遭遇したのは、インデックス指定を誤ったことで意図せずScanが実行され、クエリの実行時間が著しく伸びてしまったというケースでした。効率的なQueryを使うためには、適切なインデックス設計が不可欠です。インデックス設計の制約 RDBでは、後からでも比較的自由にインデックスを追加できます。しかしDynamoDBでは、インデックスの種類ごとに厳格な制約があります。 ⭐️ プライマリキー（パーティションキー + ソートキー）テーブル作成時に決定変更不可 ⭐️ LSI（ローカルセカンダリインデックス）テーブル作成時にしか追加できないパーティションキーはテーブルのプライマリキーと同じで、ソートキーだけを変えたクエリに使用テーブルあたり最大5個 ⭐️ GSI（グローバルセカンダリインデックス）後から追加可能パーティションキーもソートキーも自由に設定できるテーブルあたり最大20個この制約があるため、「後で必要になったらインデックスを追加すればいい」という考え方は通用しません。実践：失敗から学んだ設計プロセス失敗を経て、私が学んだDynamoDB設計のプロセスは以下の通りです。 Step 1：アクセスパターンを徹底的に洗い出す RDB脳での考え方🙅‍♀️：「ユーザーとスタンプのデータを保存しよう。クエリは後で考えればいいや」 DynamoDB的な考え方🙆‍♀️：「どんな場面で、どんなクエリが必要になるか？を最初に列挙しよう」リワード広告システムでは、以下のようなアクセスパターンを洗い出しました。ユーザーIDをもとに、ユーザーが獲得したスタンプの一覧を取得ユーザーIDをもとに、ユーザーが特定期間に獲得したスタンプ数を取得ユーザーIDと広告IDをもとに、特定の広告のスタンプ獲得状況を取得スタンプ獲得日をもとに、特定期間に獲得されたスタンプの一覧を取得この洗い出しが甘いと、後で「このクエリができない！」となってしまいます。 Step 2：プライマリキーの決定洗い出したアクセスパターンから、最も頻繁に使われるクエリを基準に決定します。パーティションキー：user_id（ユーザーごとにデータが分散される）ソートキー：timestamp（時系列でのソート・範囲検索が可能）この設計により、「ユーザーIDで取得」「特定期間のスタンプを取得」といったクエリが効率的に実行できます。 Step 3：LSI/GSIの設計プライマリキーだけでカバーできないアクセスパターンには、LSIやGSIを使います。例えば、「スタンプ獲得日をもとに、特定期間に獲得されたスタンプの一覧を取得したい」というパターンがある場合は以下のようなGSIが必要です。 GSI：パーティションキーをdate、ソートキーをuser_idに設定特にLSIはテーブル作成時にしか追加できないため、慎重に検討します。「後で必要になるかも？」と思ったら、最初に設定しておく方が安全です。ただし、インデックスが増えると読み込み/書き込みキャパシティの消費量も増えるため注意が重要です。実際の設計例最終的に、以下のような設計になりました。 Column NameData TypePrimary KeyLSI#1GSI#1user_idNumberPartition KeyPartition KeySort Keyad_idStringSort KeydateStringPartition KeytimestampStringSort Key この設計により、主要なアクセスパターンをカバーできるようになりました。運用で気づいた落とし穴 GSIを設定しているのにインデックスが使われない minneではRubyを使っており、DynamoDBのORMとしてDynamoidを採用しました。 Dynamoidでは、GSIを定義する際にprojected_attributes: :keys_onlyを指定している場合、DynamoDB側でGSIが設定されていても、Queryで使ってくれないことがありました。 class UserStamp # (省略) # NG global_secondary_index hash_key: :date, range_key: :user_id, projected_attributes: :keys_only, name: :date_user_gsi # OK global_secondary_index hash_key: :date, range_key: :user_id, projected_attributes: :all, name: :date_user_gsi end この設定を:keys_onlyにしていたことが原因で、Scanが実行され、クエリの実行時間が異常に長くなってしまっていました。パーティションキーなしでの範囲検索ができない DynamoDBでは、パーティションキーを指定せずに範囲検索することができません。例えば、「今日獲得されたスタンプを全ユーザー横断で取得したい」というケースを考えてみます。timestampをソートキーに設定していても、パーティションキー（user_id）を指定しない限り、Queryは使えません。この問題に対して、私たちは日付用のカラムを追加し、それをパーティションキーとするGSIを作成するという対策を取りました。 # timestampとは別に、date（YYYY-MM-DD形式）カラムを追加 # GSIでdateをパーティションキー、user_idをソートキーに設定 UserStamp.where(date: '2025-12-15') このように、範囲検索が必要な場合は、検索に使う粒度に合わせたカラムを用意し、それをパーティションキーとするGSIを設計時に用意しておくことが必要です。開発中はこまめにログを確認する開発中は、意図通りQueryが使われているのか、Scanになっているのかをログで確認する癖をつけましょう。 # ログレベルを設定 Dynamoid.config.logger.level = :debug これにより、実行されたDynamoDBのAPIコール（Query/Scan）が確認できます。まとめ：DynamoDB設計の心得 DynamoDBを使ってみて、痛い目に遭いながら学んだことをまとめます。 1. 設計は「データ」ではなく「クエリ」から始める RDBの正規化思考を一旦忘れて、「どうデータを取得するか」を最優先に考えましょう。アクセスパターンの洗い出しが甘いと、後で必ず後悔します。 2. インデックス設計は慎重に、そして早めに特にLSIはテーブル作成時にしか追加できません。「後で必要になるかも」と少しでも思ったら、最初から設定しておくことをお勧めします。 3. QueryとScanの違いを意識するインデックスを適切に設定し、Queryで取得できるようにすることが、パフォーマンスとコストの両面で重要です。ORMを使う場合は、意図せずScanになっていないか、ログで確認する習慣をつけましょう。おわりに「使ってみたい」と軽い気持ちで始めたDynamoDBでしたが、RDBとは全く異なる設計思想に戸惑いました。しかし、その特性を理解して適切に設計すれば、非常に強力なデータベースです。今回の経験が、これからDynamoDBを使おうとしている方の参考になれば幸いです。そして、もし同じような失敗をしている方がいたら、「自分だけじゃなかった」と安心してもらえればと思います。最後まで読んでいただき、ありがとうございました！

2025.12.11

技術情報

説明が可能なプロダクトセキュリティについての一考察

初めまして、GMO インターネットグループクラウドセキュリティ領域のエキスパートで、GMO Flatt Security 株式会社の齋藤です。この記事は GMOインターネットグループ Advent Calendar 2025 10日目の記事です。この記事では、プロダクトを提供する組織が向き合うべき「セキュリティとは何か」について、“なぜやるのか”という観点をもとに、説明可能なプロダクトセキュリティのあり方について一考察を書いていきます。また、主な想定読者は「一人目セキュリティエンジニア」「兼任でのセキュリティ組織の立ち上げを検討している方」「プロダクトを提供する組織でセキュリティを何から始めるか考えている方」としております。筆者の考察「プロダクトを提供する組織におけるセキュリティとは何なのか」。筆者は今年度、クラウドやプロダクトのセキュリティについて登壇や発信をする中で、この問いに向き合う機会がありました。セキュリティ実務をする者として真っ先に思い浮かぶのは、技術的実装や運用プロセスの整理、セキュリティポリシーの策定、認証取得といった取り組みです。これらは確かに重要であり、組織の成熟度を高める上で不可欠です。しかし、それらはあくまで「何をするか」という手段の話であって、「なぜセキュリティ施策をするのか」という目的への考察には至っていませんでした。では、プロダクトを提供する組織におけるセキュリティの本質的な目的とは何でしょうか。極論では、「ステークホルダーに発生する損失を全てなくすこと」が目的になりますが、現実的にこれを遂行するのは技術やコストといった点で難しいです。その中で現実的な落とし所として「全てのステークホルダーに対して、"信頼"・"価値"・"事業"・"コスト"・"社会的責任/倫理"の各側面で生じ得る損失を、組織として許容可能な範囲にコントロールすること」に集約されると考えます。本稿における「許容可能な範囲にコントロール」とは、組織が定めたリスク受容度（Acceptable Risk）に基づき、インシデントが発生した際に生じ得る損失について、「その規模と影響が受容基準に整合している」「発生可能性と影響を把握し説明可能な状態にある」といった観点で管理できている状態、またはその水準に到達するための活動を指します。なお、本稿で扱うリスク受容は ALARP（As Low As Reasonably Practicable）原則を前提に、"ゼロリスクではなく合理的に低減し続ける" という考え方に基づいています。この記事では、この筆者の論をベースに目的や手段の関係やどのように進めていくかを整理していきます。前提: ステークホルダーと損失の分解この記事の議論を正しく受け取ってもらうために、まず前提となる 2 つの視点を共有します。 1 つは、プロダクトを提供する組織にとってのステークホルダーは誰か、もう 1 つは、“信頼・価値・事業・コスト・社会的責任/倫理”という損失をどのように捉えるかです。 1. ステークホルダーは誰かセキュリティは特定の組織や担当者だけの問題ではなく、プロダクトを取り巻く多様なステークホルダー全員に影響します。これらを組織の外部と内部に分け、それぞれの属性を整理します。組織外のステークホルダー: 組織外のステークホルダーは、プロダクトを「利用する側」「評価する側」「社会的に許容する側」として、組織の意思決定や安全性の結果を直接的に受け取る立場です。彼らの要求や期待水準は多層的かつ相互に異なり、プロダクトの安全性が揺らいだ際には、後述する各側面での損失が発生し、信頼の失墜やサービスそのものの乗り換え、社会的批判など事業組織としての影響が発生します。属性概要個人顧客顧客企業社員・プロダクトを実際に利用し、価値を享受する層。・価値の享受を受けるということは、その分多くの情報や機微情報をプロダクトに預けているという状況にある。・安全性・信頼性・体験品質の低下は購買や利用といった行動に直撃する。顧客企業（調達・購買・CIO/CISO）・プロダクトを業務基盤として採用する主体の層。・個人顧客同様にプロダクトを実際に利用し、価値を享受する層でもあり、観点として重複する箇所もある。・個人顧客に比べより可用性、法令順守、運用負荷などに関する要求が強い。・業務上・事業上の機微情報を取り扱う可能性があるので、信用等を気にし利用に際して評価を行う。規制当局・社会・プロダクトが社会的に適切に振る舞っているかを判断し、許容範囲の基準（プライバシー、消費者保護、公共性、倫理）を定める存在。・違反等があった場合は業務停止や事業そのものの存続ができなくなることも。組織内のステークホルダー: 組織内のステークホルダーは、プロダクトを「作る側」「支える側」「統制する側」として、セキュリティを実装し維持する主体です。組織内部といっても役割は明確に分かれ、価値を生む、リスクとガバナンスを支援する、統制の妥当性を検証するという三層構造によって成り立ちます。これらの関係性が曖昧になると、責任の所在がぼやけ、セキュリティ施策が持続せず、インシデント発生時の対応も破綻しやすくなります。組織内のステークホルダーの役割と境界を明確にすることは、プロダクトセキュリティの基盤そのものです。属性気にする観点経営層信頼、ブランド、事業継続性、コストなど全側面の最終的責任を負う。実行組織（開発・運用・PdM・営業など）プロダクト価値を実際に生み出すライン。安全で持続可能な開発・運用体制が必要。内部専門組織（セキュリティ、法務、リスク管理）リスク評価、ガバナンス、標準化、仕組み化などを通じて 1 線を支援する役割。監査（内部監査、監査役、外部監査）統制が適切に働いているかを独立した立場からチェックする。外部・内部で整理したこれらのステークホルダーは、それぞれが異なる期待・要求・制約を持っており、プロダクトの安全性が揺らいだときに受ける影響もまったく異なります。そして重要なのは、どのステークホルダーにとってもセキュリティは“付加価値”ではなく、“失ってはならない前提条件”として働いているという点です。どれか 1 つでも満たせなくなれば、信頼・価値・事業の継続・コスト・社会的責任といった領域で大きな損失を引き起こす可能性があります。 2. 想定される損失次に、セキュリティが防ぐべき「損失」を、信頼・価値・事業・コスト・社会的責任/倫理の 5 つに整理します。これら損失（リスク）は、金銭的に換算できるものも存在しますが、ブランドイメージの毀損や信頼の低下、人的疲労、組織的疲労など金銭的に換算しにくい損失も存在します。プロダクトセキュリティの議論では、「どのような対策をするか」よりも先に、“何を失う可能性があるのか” を正しく把握することが本質です。損失が可視化されなければ、対策の優先順位も、必要な投資量も、どこまで手当てすべきかも合理的に判断できません。ここでは、ステークホルダーが直面し得る損失を 5 種類に分類し、それぞれの性質を整理します。損失(リスク)の種類損失の例信頼の失墜・信頼やブランドという無形資産の損失・心理的負荷による人的損失顧客価値の低下・インシデントの調査や復旧により本来提供できるはずだった価値の提供停止・サービスの停止によるユーザー体験の劣化事業価値/事業成長の低下インシデント発生によって即座に発生するわけではないが、起因して発生する損失として以下のものが考えられます。・事業継続性の喪失・業務停止によって発生する継続損失・生産性／イノベーション損失（開発停止・改修遅延・内部疲弊）コストの発生・復旧や調査・補償・代替手段構築上記以外に発生する実費的損失社会的責任の追求/倫理違反・プライバシー・規制違反・罰則・説明責任・社会的外部性（公共への悪影響）これらの損失は、単独で発生することもあれば、連鎖的に広がることもあります。特に「信頼」と「価値」の損失は、可視化されにくい一方で事業への影響が大きく、発覚した時点では取り返しのつかない状態になっていることが多い領域です。したがってセキュリティの第一歩は、これらの損失を組織としてどこまで許容できるか（＝許容可能なリスクの境界）を明確にすることにあります。目的となる「各側面において損失を出さない」とはここまで整理したとおり、極論では「ステークホルダーに発生する損失を全てなくすこと」が目的になりますが、現実的にはプロダクトセキュリティは「信頼・価値・事業・コスト・社会的責任／倫理」という 5 つの損失を、組織として許容可能なレベルに抑えることに重点をおくことになると考えます。現代のプロダクトやそれらを提供する組織は複雑化し、依存するサービスやコンポーネントなどが増加し続けています。そのため、どれだけ対策を講じても、潜在的なセキュリティリスクや未知の脆弱性、人為的ミスなどの可能性を全て排除することは難しいです。したがって、セキュリティの本質は「発生可能な損失（リスク）を合理的に低減し、発生した場合でも致命的な被害に至らないようダメージをコントロールすること」にあります。ダメージコントロールは、軍事や自動車、医療分野、格闘技など、特定の"損害"が発生する分野において、その損害を悪化させないための処置のことで継続的に行動や事象の悪化をさせないことを目的にします。本稿では、発生する損害をいかに最小化するかの意味でこの語を用いています。この「ダメージのコントロール」は次の 3 つの観点に分解できます。発生の蓋然性や必然性を下げる: 設計、実装、運用プロセスの中で、脆弱性や攻撃につながる設定ミスをあらかじめ発見するなどし、事故や攻撃の蓋然性や必然性を現実的に低減する。影響範囲を限定する: 権限分離、データ分離といった形で、発生時における侵害範囲を限定しながら、監査証跡の確保や攻撃の観測を行い、リスクの早期検知をし初動対応を可能にする再発生の蓋然性と必然性を下げるインシデントについての原因追及に関する説明可能性の確保: インシデントが起きた際に、何が起き、なぜそうなり、どう対処したかをステークホルダーに対して説明可能な状態を維持し再発防止策の策定と実施を可能にする。特に 3 点目の説明可能性は、企業・組織における信頼の失墜を最小化し、合理的な説明と、それまでの対策などについて真摯に対応することで少なからずではありますが信頼の回復に直結します。技術的に完全であること以上に、「状況を把握し、判断し、説明できる組織であるか」が問われるためです。手段の大枠: リスクベースのセキュリティ対策プロダクトのセキュリティを考え実装する際に、最初にやりがちな行動として、「対策」や「手法」から議論を始めてしまうことです。もちろんこれらは大事であり、喫緊の課題や直視すべきリスクを見つける上で重要な取り組みです。ただ、目的との紐づきが曖昧なままに取り組みや施策を積み上げると"やっている気がするだけ"の散発的な対策になり最終的に明確な対策が施せません。ではどこから考えるべきか。結論としては明確で、先の各側面において損失を出さないという観点で話した「リスク」をベースにセキュリティ施策を考えるのが良いと考えます。施策を考える際の起点は以下の 5 つです。事業組織としての重要資産（クラウンジュエル）を特定する組織の提供するプロダクトにおけるステークホルダーと損失（リスク）の構造を理解する発生しうる損失（リスク）を評価する「どこまでの損失なら許容できるか」を決める（＝リスク受容度）対応方針を選択して決めるこの章では、これらについて深掘りしていきます。 1. 事業組織としての重要資産を特定するまず着手すべきは「何が侵害されると致命的なのか」を特定することです。これがいわゆる重要資産（Crown Jewels とも呼ばれるもの）であり、プロダクトの存在意義そのものと言ってよい領域です。重要資産は組織や事業モデルによって異なりますが、典型的には以下が含まれます。個人情報、決済情報、医療データなど機微性の高いデータ顧客企業の業務データ、SaaS 内の蓄積ログ認証・認可の基盤（ID 管理、鍵管理、トークン発行など）インフラのルート権限や KMS のマスターキープロダクトの価値を形成するアルゴリズム・内部ロジック外部と接続する API・連携基盤個人情報、決済情報、医療データなど機微性の高いデータが漏洩した際の想定損害賠償額については、2018 年に JNSA がまとめた、情報セキュリティインシデントに関する調査報告書が参考になります。これらは侵害された場合に、前述の全ての損失を瞬間的に引き起こす可能性があります。したがって、以下のようなことが言えます。重要資産を守るために、どこに投資し、どのリスクを許容し、どの対策が必須なのかが決まる。重要資産の不明確な組織は対策が散発的になり、セキュリティ部門が守るべき資産を把握しきれない状態になってしまいます。 2. プロダクトにおけるステークホルダーと損失（リスク）の構造を理解前章で述べたとおり、セキュリティの目的はステークホルダーに対して発生し得る損失を許容範囲に収めることです。したがって、まずは「誰にどんな損失が起き得るのか」を構造的に整理します。どのステークホルダーにどの損失（信頼・価値・事業・コスト・社会的責任）がどの程度の深刻度で降りかかるのかこれが可視化されれば、対策の方向性と強度、優先順位は自然に決まります。 3. 発生しうる損失（リスク）を評価するでは、そのリスクは実際に起こりうるのかについて、プロダクトとして提供されるソフトウェアの領域ではどのように評価すべきでしょうか。例えば、OWASP SAMM（Software Assurance Maturity Model）のようなフレームワークが成熟度と置かれている環境の評価の道標となります。SAMM は Governance・Design・Implementation・Verification・Operations の 5 つのビジネス機能で構成され、各領域における成熟度を段階的に高めていくモデルです。SAMM の成熟度の評価を各種プロダクトやソフトウェア毎に行うことで、現状のリスクや脅威が可視化され、改善の指針を組織全体に示すことができます。ビジネス機能概要Governance （ガバナンス）この項目は組織がソフトウェア開発活動全体をどのように管理するかに関わるプロセスと活動に焦点を当てています。評価対象としては、開発に関与する部門横断的なグループに影響を与える懸念事項や、組織レベルで確立されたビジネスプロセスが定義されているかなどがあります。Design （設計）この項目は開発プロジェクトにおいて組織が目標を定義し、ソフトウェアを開発する方法に関するプロセスと活動に焦点を当てます。評価対象としては、要件収集、高レベルのアーキテクチャ仕様策定、詳細設計などがあります。Implementation （実装）この項目は組織がソフトウェアコンポーネントとそれに関連する欠陥を構築および展開する方法に関連するプロセスとアクティビティに焦点を当てます。評価対象としては、対象となるソフトウェアの実装におけるセキュリティ施策の対応状況やビルドや提供に関する観点などがあります。Verification （検証）この項目は組織がソフトウェア開発全体を通じて生成される成果物をどのようにチェックおよびテストするかに関するプロセスと活動に焦点を当てています。評価対象としては、テストなどの品質保証、コードのレビューおよび評価活動などがあります。Operations （運用）この項目はアプリケーションとその関連データの運用期間全体を通じて、機密性、整合性、可用性を維持するために必要な活動を評価します。 4. 「どこまでの損失なら許容できるか」を決めるセキュリティについて重要な観点として、"どこまで守れば十分なのか"を決めることですが、組織によってはこの議論が後回しになってしまう可能性があります。極論「全ての損失を許容しない」というのも 1 つではあるのですが、以下の観点を鑑みると現実的には「最強のセキュリティ」を実装するのは難しいでしょう。インシデントがあった際の事業への影響度顧客が求める要求水準規制要件同業他社との兼ね合いと優位性組織の文化や開発スピードへの影響人や時間、金銭的なコストそこで、考えるべきこととして許容度を設定するということです。許容度の決定は、重要資産と損失構造が明確になっていなければ不可能です。例えば、代替可能な手段が存在しており、同業他社プロダクトへの乗り換えが容易な場合、顧客の機微情報やサービスの停止というのは事業の継続ができなくなる、またはサービスそのものが採算が取れなくなります。ここまで決まって初めて、手段の優先順位が合理的に並びます。事業組織にとってのセキュリティは、前提として社会的責任や消費者保護の観点があります。その上で有限である経営資源をどのようにセキュリティ施策に適用していくかを判断する必要があり、"無限に強くする"という必要はありません。 "無限に強くする"の正確性に関する補足: 無限の資産があるのであれば無限に強くする活動になるが、有限な経営資源をいかに活用をするかという活動が、セキュリティ対策です。その際に考慮すべき点として「どの損失を、どの程度まで経営上受容や許容をするか（Risk Appetite と Risk Tolerance）」というものがあります。これらを先に決めなければ、対策の強度・投資額・優先順位が確定できないわけです。実務では、次の 4 点を定義します。 1. 対象となる損失の単位信頼／価値／事業／コスト／社会的責任の各分類ごとに、何を損失と見なすか例：PII の保護、社会的責任、価値の提供と稼働率、顧客解約率、ブランド毀損、行政処分の有無など 2. しきい値（受容と許容の境界）事業上受容できる範囲と許容できない範囲を決定し、インシデント対応の指標とする 3. 意思決定権限の明確化誰が受容を決め、誰が承認し、誰が説明責任を負うのか受容は経営判断であり、実務者が「勝手に受容」せず、レポートラインを通して報告をする 4. 想定とレビューの頻度月次：運用 KPI、四半期：経営レビュー、年次：リスク再評価としきい値の見直しALARP の原則を明示（合理的に下げられるなら下げる／過剰投資はしない）この 4 点が定義されて初めて優先順位が明確になります。これらは経営層にも明確に意識をしてもらう必要があるのですが、本題からずれる関係上この記事では詳細については触れません。サイバーセキュリティ経営ガイドライン Ver 3.0 を参考にしてみてください。https://www.meti.go.jp/policy/netsecurity/downloadfiles/guide_v3.0.pdf 結果として、重要資産周辺に経営資源が集中し、“散らばったセキュリティ施策”が消えます。この許容度に基づいて、次に具体的な対応方針を選択していきましょう。 5. 対応方針を選択し決定する最後に各種リスク評価や許容度をもとに対応の方針や優先度を定めていきます。その際に、先に現状の評価に用いた OWASP SAMM を活用しましょう。SAMM は各領域がソフトウェアのライフサイクルとも合致しており、具体の手段に関しては組織に委ねられているものの、どのような施策を取るべきかについて明確な指針を提示できます。ビジネス機能主な取り組み内容Governance （ガバナンス）・セキュリティ戦略の策定・ポリシーの整備・エンジニア教育の実施・重要資産の特定と優先度の策定→ セキュリティを推進するための土台を築き、組織全体の方向性を決定づけるDesign （設計）・脅威モデリングによるリスク分析・セキュリティ要件の明文化・多層防御を前提としたアーキテクチャ設計 → 設計段階でセキュリティを組み込むことで後工程での手戻りを削減Implementation （実装）・セキュアコーディングガイドラインの策定・CI/CD へのセキュリティチェック統合・依存ライブラリの脆弱性管理・シークレット管理の実装 → 開発プロセスの中にセキュリティを自然に埋め込むVerification （検証）・脆弱性診断（SAST/DAST）・ペネトレーションテスト →「守れているつもり」から「守れていることを検証済み」の状態へ移行Operations （運用）・インシデント対応手順の整備・ログ取得・脅威検知の仕組み構築・パッチ管理・アクセス権限の定期的な棚卸し → インシデント発生時の説明可能性と迅速な対応を支えるこれらの施策は一度にすべて実装するものではありません。SAMM の成熟度モデルに従い、まず組織の現状を評価した上で、各プラクティスの成熟度を段階的に高めていく必要があります。重要なのは、自組織のリスク受容度と重要資産に基づいて優先順位を決め、持続可能なペースで改善を積み重ねていくことです。「何」を守るために「どのような」施策を練っていくのかを穴埋め的に施策を練り、実装していくのがリスクベースのセキュリティの第一歩になると思います。詳しい実装などについては、こちらのドキュメントをご覧ください。設計・開発・テストにおけるセキュリティの実践と考え方を知ろう by @a-zara-n設計・開発・テストにおけるセキュリティの実践と考え方を知ろう - 広島ミニキャンプ by @a-zara-n まとめプロダクトセキュリティは、技術的課題という側面とともに、組織としての姿勢と能力が問われる経営課題でもあります。セキュリティ施策は数多くありますが「何をするか」の前に「なぜやるのか」を明確にし、その理由を組織内外へ説明できる状態にするということが、今回の登壇を通して私が伝えたかったことです。組織ごとに目指すセキュリティのあり方というのは多くありますが、組織が持つべき姿勢は、「全ての利害関係者の損害を可能な限り最小限に抑え、いざという時に何が発生したのかを説明できること」だと考えます。この記事が、一人目セキュリティエンジニアや、これからセキュリティ組織の立ち上げを検討している方々にとって、「どこから始めるか」「何を優先すべきか」を考える際の一助となれば幸いです。参考資料 https://owaspsamm.org/https://www.meti.go.jp/policy/netsecurity/downloadfiles/guide_v3.0.pdfhttps://www.jnsa.org/result/incident/2018.htmlhttps://www.ipa.go.jp/security/reports/oversea/nist/ug65p90000019cp4-att/NIST.SP.800-37r2_JA.pdf

2025.12.10

技術情報

もうJupyterに戻れない。次世代Notebook“marimo”を使ったら革命だった

この記事は GMOインターネットグループ Advent Calendar 2025 5日目の記事です。こんにちは！GMOインターネット株式会社の杉浦巧です。今回は最近触って感動したmarimoに関して紹介します！はじめに Python で分析や可視化をするとき、セルごとに実行できる Notebook 形式は本当に便利ですよね。みなさんは普段、どの Notebook を使っていますか？多くの方は Jupyter や Google Colab を使っているのではないでしょうか。そんな中、最近 “次世代ノートブック” と呼ばれる marimo を触ってみたところ、あまりにも快適で驚きました。「え、もう Jupyter に戻れない…」と本気で感じるレベルです。 marimoとは何か？ marimo はオープンソースの Python ノートブックで、従来のノートブックが抱えていた “再現性” や “バージョン管理のしづらさ” を解決することを目的に作られたツールです。一言でいえば、「ノートブックの手軽さ」と「ソフトウェアとしての堅牢さ」を両立させた新しい開発体験を提供してくれる存在です。公式サイトとリポジトリのリンクを以下にまとめておきます。 https://marimo.io/https://github.com/marimo-team/marimo https://www.youtube.com/watch?v=3N6lInzq5MI marimoのここがすごい！！セルの依存関係の自動管理 marimo はノートブック全体を「データフローグラフ」として扱い、あるセルを変更すると、そのセルに依存する部分だけが自動で再実行されます。そのため「どのセルから実行するべきか」「実行順がバグって壊れた」という Notebook 特有の悩みがなくなります。常に一貫した状態を保てるのが大きな魅力です。リアクティブ性コードや値を変更すると、グラフやUIが即座に更新されます。“実行ボタンを押す” という概念がほぼ不要で、リアクティブアプリのような体験が得られます。UIパーツとコードも自動で同期するため、手間なくインタラクティブな分析環境を構築できます。 Gitフレンドリー marimo のノートブックは .py ファイルとして保存されるため、Git でのバージョン管理が非常にしやすいです。差分が綺麗に表示され、レビューやマージがスムーズに行えます。従来の Notebook にありがちな「出力混ざり問題」も回避できます。 DBフレンドリー SQL の実行、データフレーム操作、データベースとの接続が自然に記述できるようになっています。データ分析〜集計〜可視化までの一連の流れを marimo 上で完結させることができ、データ関連の作業と相性が非常に良いです。 AIネイティブな設計 marimo は AI 活用を前提にした設計になっており、AI の提案によるコード作成、Chat UI の埋め込み、LLM と連動したインタラクティブアプリの構築などが可能です。Notebook と AI の組み合わせが自然に扱えるのは大きな強みです。テスト可能性 marimo のノートブックは Python モジュールとして import できるため、pytest などを使ったユニットテストを簡単に書けます。Notebook を “本番品質” に寄せるための仕組みが初めから用意されている点が特徴的です。デモ今回は marimo を立ち上げて BigQuery と連携し、データを可視化するところまでを紹介します。インストール&起動 Python環境があればpipでインストールするだけで、簡単に利用できます。 pip install marimo uvやconda環境の方は以下で追加します。 uv add marimo or conda install -c conda-forge marimo インストールが完了したら、marimo_notebook を起動してみます。自動的に .py ファイルが作成されるので、任意の名前を付けてください。 marimo edit my_notebook.py 起動が完了すると、次のように URL が出力されます。クリックするか、ブラウザにコピーしてアクセスしてください。 (marimo-sample) marimo-sample$ marimo edit my_notebook.py Edit my_notebook.py in your browser 📝 ➜ URL: http://localhost:2718?access_token=q3546u57ektyjrt4u57eiyj リンクに遷移して以下のような画面になっていれば起動成功です。 Agent設定このままでも利用できますが、今の時代は AI チャットやコード補完が欲しくなりますよね。marimo でも、設定を行えば Copilot のような補完を使えるようになります。まず、左側のメニューから「Chat with AI」タブを開き、「AI settings」をクリックします。次に「AI Providers」タブを選択し、利用したい AI の API キーと Base URL を設定してください。次に AI Models のタブで、利用したいモデルを ON にします。その後、AI Features タブに戻り、「CODE COMPLETION」と「AI ASSISTANT」の項目で、先ほど ON にしたモデルを選択します。「CODE COMPLETION」については、GitHub Copilot を使っている場合は Provider から Copilot を選択してください。好きなモデルを使いたい場合は custom を選択すれば問題ありません。設定が終わったら、試しに AI with chat で何かプロンプトを入力してみてください。問題なく応答が返ってくれば設定完了です。初回実行時は、必要なライブラリがインストールされていない場合に警告が出ることがあります。その際は、自分の環境に合わせて Install をクリックしてください。私は uv を使ってインストールしました。従来は Jupyter でセルを使ってインストールしていましたが、marimo では不足ライブラリをワンクリックで入れられるので、地味に嬉しいポイントです。これで Chat 機能・Generate 機能・Completion 機能が使えるようになります。 DB接続今回は、DB の接続先として BigQuery に接続します。左メニューの Explore data sources から Add database or catalog をクリックしてください。次に BigQuery を選択し、project_id、dataset、Credentials JSON を入力します。余談ですが、これだけ多くの種類のデータベースをサポートしているのは本当にありがたいですね。 Add をクリックすると、対応するコードがセルに自動生成されます。そのセルを実行すると、DATASOURCES タブに指定したデータセットがマウントされていることを確認できます。 marimo では Python や Markdown に加えて SQL もサポートしているため、セル内で直接 SQL を実行できるのも便利なポイントです。 SQL セルでは、取得するデータソースと出力先の変数名を指定します。セルを実行すると、指定した変数が自動的に追加されているのを確認できるはずです。また、クエリ結果については簡易的な可視化も自動で行ってくれます。普段の業務で SQL を中心にデータ加工をしている方は、こちらの方が扱いやすいと感じるかもしれませんね。可視化最後に、取得したデータを可視化してみます。matplotlib を使っても良いのですが、今回は手軽にインタラクティブな可視化を行うため、marimo ライブラリを使って描画してみます。先ほど SQL で取得したデータを、以下のコードで可視化します。 # セル2 start, end = date.value filtered = df.filter( (pl.col("record_date") >= start) & (pl.col("record_date") <= end) ) mo.ui.altair_chart( alt.Chart(filtered.to_pandas()) .mark_line() .encode(x="record_date:T", y="value1:Q") .properties(height=300, title="value1 の推移（期間変更で自動更新）") ) 実行すると、以下のようなグラフが表示されます。また、セル 1 で期間を選択すると、下のグラフの表示範囲が自動で更新されます。このように UI コンポーネントを簡単に設置できるのも、marimo の大きな強みです。まとめ今回は簡単なデモでしたが、使いこなせば BI ツールやアプリケーションとしてデプロイすることも可能です。特に、組織的にデータ分析を行っている環境では、コードで管理できる点などが刺さるポイントだと思います。一方で、まだ動作が安定しない部分があるのも事実で、大規模に組織導入するには不安定なところも残っています。 marimo は「Notebook の便利さ」と「ソフトウェアとしての堅牢さ」を両立させた、これまでにない開発体験を提供するツールです。セルの依存関係は自動管理され、リアクティブに動作し、Git・データベース・AI とも自然に連携できます。テストや再利用も容易で、Notebook を使い捨てではなく“育てられる資産”へと変えてくれます。 Jupyter や Colab を普段使っている方ほど、「ノートブックでもここまでできるのか」という違いを強く感じるはずです。新しい選択肢として、一度触ってみていただければと思います。

2025.12.05

技術情報

ドローンの資格取得から3D Gaussian Splatting生成、Webビューワーで可視化までやってみました。

はじめに「GMOインターネットグループ Advent Calendar 2025」、4日目の記事を担当します。GMOグローバルサイン・ホールディングス CTO室所属のはが（@mxcn3）です。今年、二等の無人航空機操縦者技能証明と第二種機体認証を取得しました。今回の記事では、これらの資格と認証機体（DJI Mini 4 Pro）の映像から、3D Gaussian Splatting（3DGS）の生成、そしてWebビューワーでの可視化まで、一連の流れを体験しましたので、その知見を共有します。無人航空機操縦者技能証明（二等）の取得資格取得にはドローンスクールを活用しました。6月の試験合格から申請手続きを経て、8月に無人航空機操縦者技能証明書が手元に届きました。時期内容5月ドローンスクール入校6月15日実技審査合格6月中旬学科試験合格6月中旬〜7月各種申請手続き8月15日無人航空機操縦者技能証明が届く無人航空機操縦者技能証明書が入っている封筒と、無人航空機操縦者技能証明書撮影機材今回使用したドローンはDJI Mini 4 Proです。選定理由この機体を選んだ理由は、第二種型式認証を取得していることです。DJI Mini 4 Proは2025年に第二種型式認証（第6号）を取得しており、国土交通省のHPでも確認できます。資格取得のタイミングでちょうど「型式認証対応モデル（DJI RC 2付属）」が販売されていたため、スムーズに導入できました。 DJI Mini 4 Proのドローンの外箱と背面の写真 DJI Mini 4 Proの型式認証対応モデルは背面に「TC No.6」というシールが貼られています。第二種機体認証取得のスケジュール時期内容8月22日機体（DJI Mini 4 Pro）購入8月23日機体の新規登録（登録記号発行）8月24日第二種機体認証の申請8月26日検査手数料の納付8月27日第二種機体認証書の交付ドローン情報基盤システム（DIPS 2.0）にて、第二種機体認証の申請を行いました。手続きは非常にスムーズで、短期間で完了しました。これで無人航空機操縦者技能証明書と第二種機体認証を持つ機体を取得することができました。撮影場所神奈川県内の河川敷にて撮影を行いました。当該エリアはDID（人口集中地区）外であり、カテゴリーⅠ飛行（特定飛行に該当しない）の範囲内で実施しています。事前に神奈川県のWebサイトで公開されている「河川敷におけるドローン飛行に関する注意点」を確認したうえでフライトを行いました。 3D Gaussian Splattingの生成撮影した映像（MP4）から3DGSへの変換には、Windows環境で Postshot を使用しました。Postshotは動画ファイルからカメラ位置推定（アライメント）と3D Gaussian Splattingの生成が行えるため、環境構築等をする手間が省けます。生成時の環境・CPU: Intel Core Ultra 7 プロセッサー 265K ( 20コア・20スレッド)・GPU: NVIDIA GeForce RTX 5070 Ti 以下が、アライメントの結果と生成結果です。 Postshotでのアライメント結果 Postshotの生成されたデータドローンの上空からの視点を含めることで、死角の少ないアライメント結果が得られました。データの調整次に、対象物（車）をWebで表示するために準備を行います。生成された生データ（.ply）には、背景の空や遠景など、不要な点群が含まれます。これらの不要なデータを取り除くためにブラウザベースのエディタ SuperSplat にて、対象物以外の不要なデータを削除しました。 SuperSplatで不要な点群データを選択 SuperSplatで不要な点群データを削除した後対象物以外の点群を編集して削除をしたデータはこのようになりました。データ内容点群数382,000個ファイルサイズ21.4MBファイル形式.ply Webビューワーの実装 (React + PlayCanvas) 生成した .ply データをWebブラウザ上で閲覧するため、PlayCanvas と React を組み合わせたビューワーを実装しました。Gaussian Splattingのデータの可視化には、「playcanvas/react」をベースにしたWebビューワーを実装しました。 Webビューワー: https://gsplat.org/viewer/8a8g5 PlayCanvasのSplatコンポーネントを使用し、Reactのライフサイクル内で3Dシーンを管理します。以下は実装例の抜粋です。 // 実装のサンプル import { Entity } from "@playcanvas/react"; import { Camera, Light, GSplat } from "@playcanvas/react/components"; import { OrbitControls } from "@playcanvas/react/scripts"; import { useSplat } from "../../utils/hooks"; const Scene = () => { /// plyファイルをロード const { data: model, isPending: isModeLoading } = useSplat("./◯◯.ply", { autoRelease: true }); if (isModeLoading || !model) return null; return ( <> <Entity name="light"> <Light type="directional"/> </Entity> <Entity name="camera"> <Camera /> <OrbitControls /> </Entity> {/* 3D Gaussian Splattingのデータを表示 */} <Entity name="model"> <GSplat asset={model} /> </Entity> </> ); }; 実装の詳細は、以前の私の記事「ReactでPlayCanvasが使えるライブラリが公開されたので早速使ってみました！」でも解説していますので、併せてご覧ください VRでの表示 (WebXR) VRでの表示も試してみます。PlayCanvas ( SuperSplat ) はWebXRに対応しているので、URLをMeta Quest等の対応しているVRゴーグルのブラウザで開くだけで閲覧できます。 Meta QuestのVR視点で見た映像: https://superspl.at/view?id=1ffa7d71 まとめ今回、二等無人航空機操縦士と第二種機体認証を取得し、ドローン映像から3D Gaussian Splattingを生成してみました。ドローンを使うことで対象物の上部の視点をカバーでき、3D Gaussian Splattingを生成する際に役に立つことを実感しました。また、ReactとPlayCanvasを組み合わせることで、生成データを手軽にWeb/VRで共有できるワークフローが確立できました。質問や感想がありましたら、X: @mxcn3 までお気軽にどうぞ！

2025.12.04

技術情報

今年もやります！GMOインターネットグループ横断Advent Calender 2025

GMOインターネットグループ Advent Calendar 2025 と題し、今年もグループ横断で 25日間の連続記事公開にチャレンジします！本記事では、初年度の振り返りに加え、今年の“見どころ記事”を一足先にご紹介いたします。初年度開催の振り返り昨年GMOインターネットグループ横断でAdvent Calenderを初開催をいたしました。手探りで始めた執筆者集めも、模索しながら組み立てた運営スタイルもなんとか形にすることができ、結果としてグループ全9社のエンジニアによる25日間の連続記事公開を無事に完走することができました！今年も昨年に引き続き本企画の旗振り役はGMOインターネットグループのエキスパート(Webアプリケーション領域)として活動する石丸が務めています。昨年の開催レポートについては石丸執筆の記事が公開されていますので、ご興味のある方はご一読ください。 https://developers.gmo.jp/events/61746/ 今年の開催目的学びのアウトプットは、個人の成長だけでなく、チームやプロダクト、そしてグループ全体の技術文化づくりにも貢献する大切な取り組みであると考えています。初年度の成功やノウハウを活かしながら運営としても更なる成長を目指し、執筆するパートナー(社員)の連携強化・モチベーション醸成に尽力していきたいと思います！私たちGMOインターネットグループの強みである多様性。グループ各社が持つ異なる技術領域・文化・価値観を一つの場に集め、互いに刺激を与え合いながら、技術情報を発信し、現場の実践知、プロダクト開発の裏側、最新技術の研究、そしてグループならではの大胆な挑戦。エンジニア一人ひとりの経験やノウハウを、読者にとって“学びになるコンテンツ”としてお届けできればと思っています。公開予定記事の見どころ紹介！今年のラインナップは、AI・クラウド・データ・UX・ロボティクス・生産性向上など、GMOインターネットグループならではの多様なテーマが揃いました。どれも“今読みたい技術トピック”が盛りだくさんで、25日間毎日読んでも飽きない内容です。ここでは、公開予定の記事タイトルを一気にご紹介します。 AWS全冠への道コンテキストエンジニアリング実践TipsAIエージェントSaaSを安全に提供する技術テスト業務の属人化を防ぐためのアプローチ「ユーザー目線」を習得する！ビギナーがニールセンの10原則を「調査・改善提案の指針」にした話MarpとClaude Codeを使った資料作成効率化ヒューマノイドの強化学習の話Mac Studio（M3 Ultra）でローカルLLMを動かすMarimo notebookのすゝめGCP × Snowflake × Tableau：データ活用を加速する統合分析基盤を作った話上記タイトル一覧は公開予定一部となっており、他にもおもしろい技術情報をお届けできること間違いなしです！弊グループエンジニアたちが記事公開に向けて鋭意執筆中ですのでお楽しみに。購読・フォローもお願いいたします公開につきましては、本ブログ内にて予定しております。以下より新着記事をお知らせいたしますので、ぜひ以下リンクより購読やフォローをいただけると幸いです。 GMOインターネットグループ - Qiita Advent Calendar 2025 - Qiita技術ブログ（GMO Developers）：https://developers.gmo.jp/公式X（@GMOdev）：https://x.com/GMOdev さいごに昨年の初開催後、社内外で「次回も楽しみにしている」「グループの技術の多様性を感じられて面白い」といった声を多くいただきました。その反響が、今年の開催を後押しする大きな力となりました。技術的な学びだけでなく、プロダクトの裏側やチャレンジの記録など、他では聞けない話が満載です。ぜひ、日々の業務のヒントやアイデアに活用していただければ幸いです。今年もどうぞご期待ください！

2025.11.27

イベント

CATEGORY

KEYWORD

YEAR/MONTH

AUTHOR

SNS FOLLOW

OLD REPORT

TAG

AdventCalender の記事一覧

CATEGORY