目次
はじめに
こんにちは!今年の4月に新卒入社したどすこいです。GMOペパボでフルスタックエンジニアとして日々学びながら開発しています!現在は、マルチプレイ用ゲームサーバーを簡単にセットアップできる「ロリポップ! for Gamers」を展開しています。
今回お話しするのは、社内のAI活用を進めるためにDify講習会を行ったお話しです!この講習会は全部で6つの部署と3拠点で開催しました。その結果、パートナーのLLMアプリケーション開発の解像度が高まったり、誰でも実用化できるLLMアプリケーションを自作できるようになりました。
本記事では、その行動の契機や内容、その後の効果や今後の展望について紹介します。社内のAI活用推進の際のヒントになったり、そもそもDifyってなんぞって人のサポートになれば幸いです!
Difyとは
Difyは、直感的なインターフェースを通じてAIアプリケーションを簡単に開発できるオープンソースのプラットフォームです。GPT-4やClaude 3などの最新のAIモデルを統合し、RAG(Retrieval-Augmented Generation)エンジンを搭載することで、幅広い分野で高性能なAIアプリケーションの開発を可能にしています。弊社では自社のDifyワークスペースをホストして全パートナーで利用しています!
個人的なポイントとして、以下の点が特に良いと思っています!
- 感的でわかりやすいインターフェースであり、誰でも使いやすい。
- LLMマルチエージェントの作成が簡単で、複雑な命令に関しても複数LLMで処理する仕組みが簡単に実現できる。
- LLMのハイパーパラメータのチューニングやプロンプティングによる比較をしやすい。
- 画像などを用いたマルチモーダルなアプリケーションの開発や、RAGを用いたアプリケーションの実装方法がわかりやすい。
きっかけ
お産合宿
GMOペパボでは毎年お産合宿というものが開かれています。(これは2023年の紹介記事です!)これは、事業部も職種も超えてチームを作り、2日間という限られた時間でアウトプットをする開発合宿です。自分のチームはこのイベントで、配信を盛り上げるコメントを生成するbot”わいわいAI”を開発しました。
このAI部分に関してLLMマルチエージェントを採用し、バラエティーに富んだコメントを生成できるようなLLMアーキテクチャを実装しました。この際に用いたのがDifyであり、この時に試しに触ってみたのがきっかけでした。
バックオフィスの方とのランチ
その後、新卒エンジニアとして色々な事業部の方とランチを一緒に行くというアクションがありました!その中で、バックオフィスの方とランチに行ったときに、上記のDifyについての紹介と普段の業務についてのお話をしました。この際に、AIアプリケーションによって自動化できそうな業務があったり、具体的にどういうことができるのかというのをイメージしたいという話がありました。そこで、まずはDifyを触ってもらって、できることやできそうなことの具体的なイメージを持っていただくとよさそうだと思いました!
その後、バックオフィス向けにしたDify講習会を他の事業部の方にも取り上げてもらったり、全社向けに紹介してもらうことで「うちの事業部でもやって欲しい!」「こういうのもやって欲しい!」という声をいただき、多くの事業部で実施することになりました!
Dify講習会の内容
この講習会は、エンジニアでなく、まったくDifyを触ったことない人でも、実用化できそうなLLMアプリケーションを作ることを目的に組み立てました。そのため、基礎から丁寧に説明し、実際に手を動かしてもらうハンズオン形式で実施しました!また、進捗具合がわかりやすい点や気軽に質問をしたり回答したりしやすい点から、可能な限りオフライン開催をするようにしました。
講習会の目標を、基礎の内容から実用化のレベルまで以下のように設定しました。
レベル1: 入力された日本語を英語に変換してくれるワークフロー
レベル2: 入力された文書の画像を文字に変換してくれるワークフロー
レベル3: 入力された画像から契約書の種類を読み取り、それぞれで別の処理をするワークフロー
また、レベル3に関しては、実際の業務に近そうな内容にするため、アレンジしたりもしました。
最初の導入
最初はサインアップをしてアカウントを作成すること、アカウントにログインして簡単なアプリケーションを作ることから始めました。これは、社内で「なんかすごそうだけど、はじめ方がわからない」、「なんとなくはじめるのが難しそう」という声があったため、まずははじめるまでをスムーズにできるようにしました。
また、レベル1にあるような単純なLLMアプリケーションを作るという課題を取り組んでいただく中で、Difyの仕様に慣れてもらいました。今回はDifyの”ワークフロー”の作成をしたのですが、慣れるまで以下のような使い方を詳細に説明しました!
- そもそもブロックをどのように出すのか
- どうやって入力を設定するのか
- 入力した文字列をどのようにLLMに渡すのか
- 終了ブロックとは何か
- LLMの設定ってどうするのか
このような感じで、簡単な課題を通してDifyのチュートリアルを最初に行いました。
自動判別するLLMアプリケーション
その後、画像を入力とするLLMアプリケーションの実装方法を紹介したのちに、実用できるLLMアプリケーションを構築することに取り組んでいただきました。具体的には、「入力された画像から契約書の種類を読み取り、それぞれで別の処理をするワークフロー」を開発してもらいました。
こちらに関しては、”質問分類器”というものを使ってもらって実装してもらうのですが、これまでの課題と異なってブロックが大きなアプリケーションになるので、まずは全体像の組み立てから行ってもらいました。
アドバンスなコンテンツ
上記の入門的なワークショップの他にも、ディレクター向けのLLMアプリケーションをモブプログラミングのような形式の講習会も実施しました。そこではRAGを用いたアプリケーション開発を実施してもらいました。
RAG(Retrieval-Augmented Generation)は、外部の知識を検索して、大規模言語モデル(LLM)を補強するというアプローチです。具体的には、LLMだけに頼らず、外部データベースやドキュメントから関連情報を動的に取り出し、それを元に回答を生成します。これを用いることで、特定の情報からLLMが関連する情報を参照しつつ、回答生成するアプリケーションを作ることができます。
この時の講習会では、社内で貯められた知見をもとに、ディレクターのお仕事をサポートするAIアプリケーションを作成しました。このアプリケーションによって、AIがタスクの叩き台を作ったり、人間が作ったもののフィードバックや修正をAIが行うようにしました。
講習会の効果
業務で使うLLMアプリケーションを作れるようになった
ディレクター職やCS職の普段の業務をサポートするLLMのアプリケーションを自分らで作ってくださいました!開発したアプリケーションを横展開していただくことで、チーム全体の業務時間削減に寄与しています。
例えば、CSの方が作ってくださったものの例では「インフォメーションを作ってくれるbot」があります。こちらは、
- ヘルプのドキュメントをRAGで取得
- インフォメーションをLLMで作成
- LLMで誤字脱字チェック
- 別媒体のインフォを作成する
といったものです!エンジニアの手を介さずに、業務に携わっている方がLLMアプリケーションを開発することで、要件やユースケースが明確な状態でアプリケーションを作れるので、とても良いと思いました。
新たに「この業務が自動化ができるのではないか」という具体的な提案をいただけるようになった
講習会を受けたパートナーから「講習会で作成したようなLLMアプリケーションがつくれるなら、こういう業務も自動化できるんじゃないですか?」というような提案を受けるようになりました!実際に手を動かして作ってもらったことで、LLMアプリケーションの解像度が上がったという感想がありました。この高い解像度によって、日々の業務でAI化できるところが見つかってきたのではないかと考えています。
今後の展望
新たなプラットフォーム
今回はDifyの活用を推進しましたが、Difyだけでは、SlackやGoogle Workspaceとの連携が完璧じゃないことがあります(一部機能では簡単に連携できるものもあります!)。一方、n8sと連携して自律的なAIエージェントアプリケーションをつくっている事例を伺いました。2025年では、これらのプラットフォームとの連携に関しても推進していくことで、誰でも自律的なAIエージェントが作れるようにしたいと考えています。
複雑なアプリケーションの構築
LLMマルチエージェントモデルやRAG、写真などのマルチモーダル機能の紹介はしたのですが、これらを組み合わせたアプリケーションまでは講習会で説明できてないです。導入部分の講習会は実施したので、今後はもう少し複雑なアプリケーションの作成までをサポートし、業務にさらにマッチしている複雑なLLMアプリケーションを開発できるように資料を整えたいと考えています。
まとめ
AIが目まぐるしく進歩していく中、AIで未来を創るNo.1企業グループとなるべく弊社では様々な活動を行っています。今回はその事例の一つを紹介しました。弊社で行なっている”AIやっていき”に関して興味のある方は、ぜひ一緒に働きましょう!
ブログの著者欄
採用情報
関連記事
KEYWORD
CATEGORY
-
技術情報(446)
-
イベント(161)
-
カルチャー(36)
-
デザイン(17)
TAG
- 5G
- Adam byGMO
- AI
- AWX
- BIT VALLEY
- blockchain
- ChatGPT
- cloudflare
- cloudnative
- CloudStack
- CM
- CNDO
- CNDT
- CODEGYM Academy
- ConoHa
- CS
- CSS
- CTF
- DC
- Designship
- Desiner
- DeveloperExpert
- DevSecOpsThon
- DNS
- Docker
- DTF
- GitLab
- GMO Developers Day
- GMO Developers Night
- GMO GPUクラウド
- GMO Hacking Night
- GMO kitaQ
- GMO SONIC
- GMOアドパートナーズ
- GMOアドマーケティング
- GMOイエラエ
- GMOグローバルサイン
- GMOソリューションパートナー
- GMOデジキッズ
- GMOブランドセキュリティ
- GMOペイメントゲートウェイ
- GMOペパボ
- GMOリサーチ
- Go
- GTB
- Hardning
- Harvester
- HCI
- iOS
- IoT
- ISUCON
- JapanDrone
- Java
- JJUG
- K8s
- Kaigi on Rails
- Kids VALLEY
- LLM
- MetaMask
- MySQL
- NFT
- NVIDIA
- OpenStack
- Perl
- perplexity
- PHP
- PHPcon
- PHPerKaigi
- QUIC
- Rancher
- RPA
- Ruby
- Selenium
- Spectrum Tokyo Meetup
- splunk
- SRE
- SSL
- Terraform
- TLS
- TypeScript
- UI/UX
- VLAN
- VS Code
- アドベントカレンダー
- インターンシップ
- オブジェクト指向
- オンボーディング
- お名前.com
- カルチャー
- コンテナ
- スクラム
- スペシャリスト
- セキュリティ
- ソフトウェアテスト
- チームビルディング
- ドローン
- ネットワーク
- プログラミング教育
- ブロックチェーン
- マルチプレイ
- ミドルウェア
- モバイル
- ゆめみらいワーク
- リモートワーク
- レンタルサーバー
- 京大ミートアップ
- 協賛レポート
- 基礎
- 多拠点開発
- 大学授業
- 宮崎オフィス
- 応用
- 技育プロジェクト
- 新卒
- 暗号
- 機械学習
- 決済
PICKUP