ChatGPT の記事一覧

OracleでChatGPTプロシージャを作ってみる

OracleとChatGPTを組み合わせて何か面白いことができないかと考え、データベース内に保存されたテーブル定義やレコードをChatGPTにインプットして様々な処理をさせるプロシージャを作成してみました。作るものこちらが今回作成するもので、スキーマ名とテーブル名、そしてそのテーブルに対して行いたい操作を入力すると、ChatGPTから回答が得られる作りになっています。注意点、免責事項本記事の情報は、筆者の個人的な見解や経験に基づくものであり、正確性、信頼性、完全性、最新性を保証するものではありません。本記事の情報やリンク先の内容によって生じた問題や損失について、筆者は一切の責任を負いません。本記事は予告なく内容が変更されることがあります。また、最新の情報については、他の情報源と照らし合わせて確認してください。利用者が本記事の情報に基づいて行った行為によって生じた損害について、筆者は一切の責任を負いません。 API経由とはいえ、データベース内部の情報をChatGPTへ渡しているため、本番データベースでの利用は想定しておりません。プロシージャで扱うデータには十分な注意を払ってください。実行環境 OSDBAPEXORDSOracle Linux 7.6Oracle Database 19c22.223.1 準備今回は、GUIで入出力の画面を作成したいという目的と、apex_web_serviceパッケージを使用する目的のためOracle APEXのインストールを行っています。 ChatGPT APIキーの入手やAPEX、Oracle RESTful Data Service（ORDS）のインストールが既に済んでいる方はテストテーブル作成まで読み飛ばしてください。 ChatGPT APIキーの入手 ChatGPTのAPIキーを入手していない場合、OpenAIにサインインし、以下のページ上にある「+ Create new sercret key」ボタンからsk-で始まる自身のAPIキーを入手してください。 https://platform.openai.com/account/api-keys ※APIキー流出によるセキュリティリスクにご注意ください。 Oracle Walletの設定 httpsでapiを実行するためには、接続先サーバのSSLサーバ証明書を検証するためのルートCA証明書が必要になります。 UTL_HTTPでHTTPS通信 / ORA-29024の回避詳細については、上記の記事を参照してください。ここでは、コマンドのみを記載します。 ca-certificatesパッケージがない/古い場合は更新を行います。 # yum install ca-certificates 以降はoracleユーザで実行します。 Oracle Walletを作成 $ su - oracle $ ORACLE_WALLET_PATH=/opt/oracle/ca_wallet $ ORACLE_WALLET_PWD=WalletPasswd123 $ mkdir -p ${ORACLE_WALLET_PATH} $ orapki wallet create -wallet ${ORACLE_WALLET_PATH} -pwd ${ORACLE_WALLET_PWD} -auto_login ルートCA証明書を入手 $ cd ${ORACLE_WALLET_PATH} $ wget https://curl.haxx.se/ca/cacert.pem ルートCA証明書を変換 $ awk 'split_after == 1 {n++;split_after=0} /-----END CERTIFICATE-----/ {split_after=1} {print > "cert" n ".pem"}' < cacert.pem Oracle WallletへルートCA証明書を追加 $ for i in /opt/oracle/ca_wallet/cert*.pem do orapki wallet add -wallet ${ORACLE_WALLET_PATH} -trusted_cert -cert "$i" -pwd ${ORACLE_WALLET_PWD} done Oracle APEXおよびOracle RESTful Data Serviceのインストール Oracle APEXインストレーション・ガイドリリース22.2 Oracle REST Data Services インストレーションおよび構成ガイドリリース22.2 Oracle APEXの環境作成(5) - APEXのインストールこちらも詳細な手順は公式ドキュメント含む、上記のリンクをご覧ください。 Oracle APEXのインストール公式サイトから 2023/04/20 現在の最新版である22.2のzipファイルをダウンロードし、任意のディレクトリに配置して展開してください。ダウンロードするには、『Oracle APEX 22.2 - すべての言語』というリンクをクリックしてください。 $ mkdir /home/oracle/tools $ cd /home/oracle/tools $ unzip ./apex_22.2.zip 展開したディレクトリへ移動 $ cd /home/oracle/tools/apex 完全開発環境のインストール今回APEXは、PDB [ORCLPDB1] に対してインストールしていきます。 $ sqlplus / as sysdba alter session set container = ORCLPDB1; APEXアプリケーションユーザおよびAPEXファイルユーザの表領域はSYSAUX、一時表領域はTEMP、APEXイメージの仮想ディレクトリは/i/としています。 @apexins.sql SYSAUX SYSAUX TEMP /i/ 日本語リソースのロード @load_trans.sql JAPANESE APEXインスタンス管理者アカウントの作成 @apxchpwd.sql 管理アカウント名はADMINのままで作成しています。パスワードは6文字以上、1つ以上の数字、一つ以上の記号、1つ以上の小文字のアルファベットを含む必要があります。 Enter the administrator's username [ADMIN] User "ADMIN" does not yet exist and will be created. Enter ADMIN's email [ADMIN] Enter ADMIN's password [] *** APEX_PUBLIC_USERユーザをアンロックします。 alter user apex_public_user no authentication account unlock; 構成スクリプトを実行してRESTfulサービスを構成します。 @apex_rest_config.sql プロンプトが表示されたら、APEX_LISTENERアカウントおよびAPEX_REST_PUBLIC_USERアカウントのパスワードを入力します。 Enter a password for the APEX_LISTENER user: *** Enter a password for the APEX_REST_PUBLIC_USER user: *** Oracle APEXでWebサービスを使用するには、Oracle Databaseでネットワーク・サービスを有効にする必要があるため有効化を行います。 BEGIN DBMS_NETWORK_ACL_ADMIN.APPEND_HOST_ACE( host => '*', ace => xs$ace_type(privilege_list => xs$name_list('connect'), principal_name => 'APEX_220200', principal_type => xs_acl.ptype_db)); END; / Oracle RESTful Data Serviceのインストール rpmを用いたOracle RESTful Data Serviceのインストールの場合、jdkのインストールが行われないので別途インストールを行います。 $ sudo rpm -ivh https://download.oracle.com/java/17/latest/jdk-17_linux-x64_bin.rpm rpmでOracle RESTful Data Serviceをインストール $ sudo rpm -ivh https://yum.oracle.com/repo/OracleLinux/OL7/oracle/software/x86_64/getPackage/ords-23.1.0-9.el7.noarch.rpm 対話モードでセットアップ $ ords --config /etc/ords/config install 今回はPDBで動作させるため、データベース・サービス名にPDBのサービス名 [ORCLPDB1] を指定しています。また、APEX静的リソースの場所も [/home/oracle/tools/apex/images] と指定しています。番号を入力して、インストールのタイプを選択します [1] データベースのORDSのインストールまたはアップグレードのみを実行する [2] データベース・プールを作成または更新して、データベースのORDSをインストール/アップグレードする [3] データベース・プールの作成または更新のみを実行する Choose [2]: 番号を入力して、使用するデータベース接続タイプを選択します [1] 基本(ホスト名、ポート、サービス名) [2] TNS (TNS別名、TNSディレクトリ) [3] カスタム・データベースURL Choose [1]: データベース・ホスト名を入力 [localhost]: localhost データベースのリスニング・ポートを入力してください [1521]: 1521 データベース・サービス名を入力してください [ORCLCDB]: ORCLPDB1 管理者ユーザー名を入力してください: sys SYS AS SYSDBAのデータベース・パスワードを入力してください: **** データベース・ユーザー: SYS AS SYSDBA URL: jdbc:oracle:thin:@//localhost:1521/ORCLPDB1に接続しています情報の取得中. ORDS_METADATAおよびORDS_PUBLIC_USERのデフォルト表領域を入力してください [SYSAUX]: ORDS_METADATAおよびORDS_PUBLIC_USERの一時表領域を入力してください [TEMP]: 番号を入力して、有効化する追加機能を選択します: [1] データベース・アクション(すべての機能を有効化) [2] REST対応SQLおよびデータベースAPI [3] REST対応SQL [4] データベースAPI [5] なし Choose [1]: 番号を入力して、ORDSをスタンドアロン・モードで構成および起動します [1] ORDSをスタンドアロン・モードで構成および起動する [2] スキップ Choose [1]: 番号を入力して、プロトコルを選択します [1] HTTP [2] HTTPS Choose [1]: HTTPポートを入力してください [8080]: APEX静的リソースの場所を入力します: /home/oracle/tools/apex/images 2023-04-20T11:04:17.772Z INFO Oracle REST Data Services initialized Oracle REST Data Services version : 23.1.0.r0861423 Oracle REST Data Services server info: jetty/10.0.12 Oracle REST Data Services java info: Java HotSpot(TM) 64-Bit Server VM 17.0.7+8-LTS-224 完了後は上述のような出力が行われた後、Oracle RESTful Data Serviceが起動しますが、プロンプトが戻ってこないため一度Ctrl+Cで抜けます。抜けた後、再度systemctlで起動を行います。 Oracle RESTful Data Serviceの起動 $ systemctl start ords Oracle RESTful Data Serviceを起動したらAPEXワークスペースの作成を行います。 APEXワークスペースの作成 APEX管理サービスにサインインサインインページは以下になります。 http://<ホスト名>:<ポート番号>/ords/apex_admin 今回はこちら。 http://localhost:8080/ords/apex_admin APEXインスタンス管理者アカウントのユーザ名とパスワードを入力してサインインします。ワークスペースの作成「ワークスペースの管理」 > 「ワークスペースの作成」ワークスペース名に任意の名前を入れて次へ今回は[ChatGPT_dev]という名前を付けました。スキーマは新規で作成しています。既存スキーマの再利用：[いいえ] スキーマ名：[APEX_CHATGPT_WS] 領域割り当て制限(MB)：[100] ワークスペース管理者の名前、パスワード、メールアドレスを入力します。管理者のユーザ名：[APEX_CHATGPT_ADMIN] 管理のパスワード：[任意のパスワード] 電子メール：[任意の電子メールアドレス] 内容に問題無ければ「ワークスペースの作成」ボタンを押しましょう。ワークスペースへサインイン作成したワークスペースへサインインします。 http://<ホスト名>:<ポート番号>/ords 今回はこちら。 http://localhost:8080/ords ワークスペース名：[ChatGPT_dev] ユーザ名：[APEX_CHATGPT_ADMIN] 初回はパスワードの変更を求められるので新しいパスワードの入力を行います。テストテーブルの作成テストテーブルの作成「SQLワークショップ」 > 「SQLコマンド」からテストテーブルを作っていきます。下記CREATE文を張り付け、「実行」ボタンを押してテーブルを作成します。 CREATE TABLE EMP (EMPNO NUMBER(4) primary key, ENAME VARCHAR2(10), JOB VARCHAR2(9), MGR NUMBER(4), HIREDATE DATE, SAL NUMBER(7,2), COMM NUMBER(7,2), DEPTNO NUMBER(2)) ; データの登録続けてデータの登録を行います。同様に以下のinsert文を貼り付け、「実行」を行います。 insert all into EMP values (7369,'SMITH','CLERK',7902,'1980/12/17',800,null,20) into EMP values (7499,'ALLEN','SALESMAN',7698,'1981/02/20',1600,300,30) into EMP values (7521,'WARD','SALESMAN',7698,'1981/02/22',1250,500,30) into EMP values (7566,'JONES','MANAGER',7839,'1981/04/02',2975,null,20) into EMP values (7654,'MARTIN','SALESMAN',7698,'1981/09/28',1250,1400,30) into EMP values (7698,'BLAKE','MANAGER',7839,'1981/05/01',2850,null,30) into EMP values (7782,'CLARK','MANAGER',7839,'1981/06/09',2450,null,10) into EMP values (7788,'SCOTT','ANALYST',7566,'1987/04/19',3000,null,20) into EMP values (7839,'KING','PRESIDENT',null,'1981/11/17',5000,null,10) into EMP values (7844,'TURNER','SALESMAN',7698,'1981/09/08',1500,null,30) into EMP values (7876,'ADAMS','CLERK',7788,'1987/05/23',1100,null,20) into EMP values (7900,'JAMES','CLERK',7698,'1981/12/03',950,null,30) into EMP values (7902,'FORD','ANALYST',7566,'1981/12/03',3000,null,20) into EMP values (7934,'MILLER','CLERK',7782,'1982/01/23',1300,null,10) select * from dual; さてこれでようやく準備が整いました。プロシージャの作成引き続きAPEXのSQLコマンドを利用して、プロシージャの作成を行っていきます。プロシージャ内の変数 l_ora_wallet_path, l_ora_wallet_pass はOracle Walletの配置場所とパスワードを l_api_key は、ご自身で取得したChatGPTのAPIキーを入力してください。プロシージャの処理の流れは以下の通りです。引数 l_schema, l_table で指定されたテーブルの定義を取得上記テーブルのデータを最大100件取得1,2,で取得した内容と引数 l_request の内容をChatGPTのAPIへインプット引数 l_answer に格納されたChatGPTからの返答内容を表示 CREATE OR REPLACE PROCEDURE proc_chatgpt3_5( l_schema in varchar2, l_table in varchar2, l_request in clob, l_answer out clob) IS l_definition clob; l_record clob; l_answer_json clob; l_assistant clob; l_content clob; l_ora_wallet_path varchar2(200) := '/opt/oracle/ca_wallet'; l_ora_wallet_pass varchar2(200) := 'WalletPasswd123'; l_api_key varchar2(200) := 'sk-***'; l_url varchar2(4000) := 'https://api.openai.com/v1/chat/completions'; l_model varchar2(200) := 'gpt-3.5-turbo'; l_system varchar2(4000) := 'あなたは優秀なORACLEデータベースエンジニアです。'; l_eof varchar2(10) := '|EOF|'; l_eol varchar2(10) := '|EOL|'; CURSOR c_definition IS select owner, table_name, column_name, column_id, data_type, nullable from all_tab_columns where owner = l_schema and table_name = l_table order by column_id; l_defval c_definition%ROWTYPE; l_cols varchar2(4000); l_sql_stmt varchar2(4000); TYPE t_cursor IS REF CURSOR; c_record t_cursor; l_recval varchar2(4000); BEGIN OPEN c_definition; LOOP FETCH c_definition INTO l_defval; EXIT WHEN c_definition%NOTFOUND; IF l_definition IS NULL THEN l_definition := l_defval.owner|| l_eof || l_defval.table_name|| l_eof || l_defval.column_name|| l_eof || l_defval.column_id|| l_eof || l_defval.data_type|| l_eof || l_defval.nullable|| l_eol ; ELSE l_definition := l_definition|| l_defval.owner|| l_eof || l_defval.table_name|| l_eof || l_defval.column_name|| l_eof || l_defval.column_id|| l_eof || l_defval.data_type|| l_eof || l_defval.nullable|| l_eol ; END IF; IF l_cols IS NULL THEN l_cols := l_defval.column_name; ELSE l_cols := l_cols||'||'''|| l_eof ||'''||'||l_defval.column_name; END IF; END LOOP; CLOSE c_definition; l_sql_stmt := 'select '|| l_cols ||' from '|| l_schema ||'.'|| l_table ||' where rownum <= 100'; OPEN c_record FOR l_sql_stmt; LOOP FETCH c_record INTO l_recval; EXIT WHEN c_record%NOTFOUND; IF l_record IS NULL THEN l_record := l_recval|| l_eol ; ELSE l_record := l_record||l_recval|| l_eol ; END IF; END LOOP; CLOSE c_record; l_assistant := l_definition||'上記は「テーブル定義」です。列区切り文字は「'|| l_eof || '」、行区切り文字は「'|| l_eol ||'」、左から順にowner,table_name,column_name,column_id,data_type,nullableの情報になります。\n'|| l_record||'上記は「テーブルのサンプルレコード(最大100件)」です。「テーブル定義」のcolumn_id順に並び、列区切り文字は「'|| l_eof || '」、行区切り文字は「'|| l_eol ||'」です。'; l_content := '{"model":"'||l_model||'", "messages": [{"role":"system", "content":"'||l_system||'"}, {"role":"assistant", "content":"'||l_assistant||'"}, {"role":"user", "content":"'||l_request||'"}] }'; apex_web_service.g_request_headers(1).name := 'Content-Type'; apex_web_service.g_request_headers(1).value := 'application/json'; apex_web_service.g_request_headers(2).name := 'Authorization'; apex_web_service.g_request_headers(2).value := 'Bearer '||l_api_key; l_answer_json := apex_web_service.make_rest_request( p_url => l_url, p_http_method => 'POST', p_body => l_content, p_wallet_path => 'file:'||l_ora_wallet_path, p_wallet_pwd => l_ora_wallet_pass ); SELECT JSON_VALUE(l_answer_json, '$.choices.message.content') INTO l_answer FROM DUAL; EXCEPTION WHEN OTHERS THEN IF c_definition%ISOPEN THEN CLOSE c_definition; END IF; IF c_record%ISOPEN THEN CLOSE c_record; END IF; l_answer := 'error occurred.'; END; / エディタに張り付けて、「実行」を行います。アプリケーションの作成アプリケーションの作成続いてプロシージャを動かすアプリケーションをAPEXで作っていきます。「アプリケーション・ビルダー」 > 「作成」 > 「新規アプリケーション」名前：[ChatGPT_APP] で「アプリケーションの作成」を行います。ページの作成次にフォームページを作成します。「ページの作成」からレガシー・ページタブ内にある「ローカル・プロシージャのフォーム」を選択し、「次」へローカル・プロシージャフォームの作成ページ番号：[2] 名前：[ChatGPTプロシージャフォーム] で「次」へページ番号が2以外の場合、以降の手順に出てくる『P2_』という部分は、自身が使用したページ番号に読み替えて実行するように注意してください。プロシージャの所有者：[APEX_CHATGPT_WS]ストアド・プロシージャ名：[PROC_CHATGPT3_5]フォームに含まれるプロシージャ引数の選択は以下のよう設定にします。含める引数ラベルデフォルト表示タイプはいL_SCHEMAスキーマ名テキスト・フィールドはいL_TABLEテーブル名テキスト・フィールドはいL_REQUEST質問テキスト・フィールドはいL_ANSWER回答表示のみ「ページの作成」ボタンを押して作成。ページ・デザイナの編集各フォームの機能を編集していきます。アイテム Region Bodyから「P2_SCHEMA」を選択右側のサイドメニューを以下の通り編集します。設定空白の切り捨て：[Leading and Trailing] テキストの大/小文字：[Upper] 外観テンプレート：[Required - Above] 「P2_TABLE」も同じ設定へ変更します。続いて「P2_REQUEST」を選択右側のサイドメニューを以下の通り編集します。外観テンプレート：[Required - Floating] 最後に「P2_ANSWER」を選択右側のサイドメニューを以下の通り編集します。識別タイプ：[リッチ・テキスト・エディタ] 設定書式：[Markown] 読み取り専用タイプ：[常時] ボタン ChatGPTにリクエストを投げるボタンを作成します。 Region Bodyから「P2_REQUEST」を右クリックし、「下にボタンを作成」をクリック作成された「新規」ボタンの右側のサイドメニューを以下の通り編集します。識別ボタン名：[検索] ラベル：[検索] 外観ボタン・テンプレート：[Text with Icon] ホット：[有効化] 動作アクション：[動的アクションで定義] Region Bodyから「検索」を右クリックし、「動的アクションの作成」をクリック「動的アクション」 > 「新規」 > 「True」 > 「表示」を選択右側のサイドメニューを以下の通り編集します。識別アクション：[サーバー側のコードを実行] 設定 PL/SQLコードのアイコンをクリックしてコードエディタへ以下のコードを入力 (P2_部分はページ番号に合わせ適宜変更をしてください) BEGIN proc_chatgpt3_5(:P2_SCHEMA,:P2_TABLE,:P2_REQUEST,:P2_ANSWER); END; 送信するアイテム：[P2_SCHEMA,P2_TABLE,P2_REQUEST] 戻すアイテム：[P2_ANSWER] (P2_部分はページ番号に合わせ適宜変更をしてください) ChatGPTからのレスポンスにMarkdown書式が含まれていた場合、崩れて表示されてしまうため、ページを更新するアクションも作成します。前段で作成した「サーバー側のコードを実行」を右クリックし、「アクションの作成」をクリック右側のサイドメニューを以下の通り編集識別アクション：[JavaScriptコードを実行] 設定コード欄に以下のコードを入力 location.reload(); 最後にトップの「ChatGPTプロシージャフォーム」をクリックし、ナビゲーション部分を以下の通り編集します。ナビゲーション保存されていない変更の警告：[無効化] 「保存」をしたら作成完了です。動作確認それでは動作確認を行っていきましょう。ワークスペースのユーザで作成したアプリケーションへログインします。 http://localhost:8080/ords/r/chatgpt_dev/chatgpt-app サイドバーから「ChatGPTプロシージャフォーム」を開きます。問題無く表示されたらいくつか質問をしていきましょう。質問1 スキーマ名：[APEX_CHATGPT_WS]、テーブル名：[EMP] 質問：[このテーブルのレコード数を教えてください。またレコード数を取得するためのSQL文も教えてください。] 「検索」ボタンを押してしばらく待ちます。回答：このテーブルのレコード数は14です。レコード数を取得するSQL文は以下の通りです。SELECT COUNT(*) FROM EMP;またはSELECT COUNT(1) FROM EMP;どちらのSQL文でも同じ結果が得られます。期待した通りの回答が返ってきました。ただ、同様の質問を別のタイミングでした時は以下の結果となりました。ここでは「レコード数は、9件です」と誤った回答が行われました。データをインプットしていても、完全な回答をしてくれるわけではないのですね。次はもう少し複雑な質問にしてみます。質問2 次はテーブルの正規化をしてもらいましょう。スキーマ名：[APEX_CHATGPT_WS]、テーブル名：[EMP] 質問：[このテーブルの正規化を進めたいです。どのようにテーブルを分ければよいでしょうか。] 回答：まずは、このテーブルの中から、重複しているデータや、複数の値を持ってしまっている列を洗い出してみましょう。例えば、このテーブルの場合、部門情報が含まれておらず、部門IDが列に含まれているため、部門の情報を追加する必要があります。また、MGR列には、上司の社員番号が保存されていますが、これは従業員テーブル自身に従属的な列であり、繰り返しグループを持つため、別の従業員テーブルを作成する必要があります。したがって、従業員(Employee)テーブル、部門(Department)テーブル、上司(Manager)テーブルを作成する必要があります。また、テーブル定義には明示されていませんが、従業員に付随するプロジェクト(Project)情報がある場合や、従業員の役職(Position)情報がある場合は、それらも別のテーブルとして分離する必要があります。従業員テーブル:・従業員番号(Employee ID)・従業員名(Employee Name)・雇用日(Hire Date)・雇用形態(Job)・給与(Salary)・コミッション(Commission)・部門ID(Department ID)・上司ID(Manager ID)部門テーブル:・部門ID(Department ID)・部門名(Department Name)・場所(Location)上司テーブル:・上司ID(Manager ID)・上司名(Manager Name)・雇用日(Hire Date)・雇用形態(Job)・給与(Salary)・コミッション(Commission)・部門ID(Department ID) 上司テーブルが必要かはわかりませんが・・・正規化も行えるようです。また、テーブル名やカラム名からこのテーブルが従業員の情報を記録したテーブルということも認識しているようです。質問3 従業員テーブルであるということを理解しているようなのでカラム名を書かずに質問をしてみます。スキーマ名：[APEX_CHATGPT_WS]、テーブル名：[EMP] 質問：[雇用されてから40年以上経過した従業員の一覧を教えてください。対象従業員の給与を10%アップさせるためのSQL文も教えてください。] 回答：以下がSQL文になります。SELECT empno, ename, hiredate, sal FROM emp WHERE months_between(sysdate, hiredate)/12 >= 40; UPDATE emp SET sal = sal * 1.1 WHERE months_between(sysdate, hiredate)/12 >= 40;最初のSELECT文では、現在日から入社日までの経過月数を求め、年数に換算して40年以上働いている従業員を抽出しています。次にUPDATE文では、同じ条件で絞り込んだ従業員の給与を10%アップデートしています。期待したSQL文は得られましたが、アウトプットの量を減らすためか一覧は出力されませんでした。質問4 最後は結合をさせてみます。スキーマ名：[APEX_CHATGPT_WS]、テーブル名：[EMP] 質問：[従業員と上司の名前を並べて表示してください。またその時使用するSQL文も教えてください。] 回答：次のSQL文を使用して、従業員と上司の名前を並べて表示することができます。SELECT e.ename AS employee_name, m.ename AS manager_name FROM emp e LEFT JOIN emp m ON e.mgr = m.empno ORDER BY m.ename, e.ename;このSQL文では、JOINを使用して従業員表(emp)を上司表(emp)と結合することにより、従業員と上司の名前を表示します。ORDER BYを使用して、上司の名前、従業員の名前の順でソートされます。また、LEFT JOINを使用しているため、上司がいない(社長である)従業員の名前も表示されます。正しいSELECT文が返ってきましたが、こちらもアウトプットの量を減らすためか「従業員の名前と上司の名前を並べて表示してください」については無視されてしまいました。おわりに今回はある程度意図した回答を得られたときのサンプルを記載しておりますが、完全に誤りのない情報を得ることは難しいようで、不正確なレコード数や不正確な合計値を返してくることもありました。得られる結果に注意を払う必要はありますが、適切に活用すればデータベース設計やアプリケーション開発に大きな貢献をしてくれる可能性を感じさせてくれる結果となりました。 Oracleの機能として大規模言語モデルが提供される日も近いかもしれませんね。参考サイト http://apexugj.blogspot.com/ https://yaitcon.hashnode.dev/explain-view-sql-via-chatgpt-with-plsql https://cosol.jp/techdb/2015/12/https_using_utl_http_how_to_aviod_ora-29024/
2023.04.24
技術情報
ChatGPTを利用してTeamsでチャットボットを開発してみる

　今、何かと話題のChatGPTですが、OpenAIがAIサービスのAPIを公開しています。こちらを利用して、Power AutomateとTeamsを組み合わせてチャットボットを開発してみましょう。今回はAzure Automationの検証も兼ねてクラウド上でPowerShellからOpenAIのAPIにアクセスします。　クラウド上で実行されるPower AutomateのクラウドフローではPowerShellを直接実行することができません。クラウドフローからPower Automate for desktopのデスクトップフローを呼び出して実行する方法がありますが、呼び出す先のPCが起動している必要があります。Azure Automationを利用してPCが不要のいわゆるサーバーレスでPower Shellを実行する方法を紹介します。動作環境 Power Automateのプレミアムコネクタを使用しています。Azure Automation を利用するためのAzureサブスクリプションが必要です。Azure Automationは一定範囲内であれば無料で利用可能です。参考：料金 - Automation | Microsoft AzureOpenAIのAPI無料利用枠（18ドル分）を使用しています。 Azure Automation Azure Automationはクラウド上のタスクを自動化できるサービスです。Azure Automation のRunbookを利用すると、通常はPCやサーバー内で実行する必要があるPowerShellやPythonのスクリプトをサーバーレス（クラウド上）で実行することが可能です。早速、Azure Automationの設定を行い、実際に動作確認をしてみましょう。 Azure Portalにログインして「Automation アカウント」を検索してアカウントを作成します。左メニューの「プロセスオートメーション」-「Runbook」から「Runbookの作成」を選択します。以下の内容で作成します。簡単なコマンドを入力して「保存」を選択します。「テストウィンドウ」を選択します。「開始」を選択して実行します。「ジョブストリームを更新します」を選択すると実行結果が表示されます。米国時間で表示されました。Azure Automationを利用してPowerShellを実行できることが確認できました。 PowerShellのコード作成　今話題の「ChatGPT」と同様にOpenAIがAIサービスのAPI を提供しています。PowerShellから呼び出してチャットボットとして利用してみましょう。事前準備として、OpenAIにサインアップして無料アカウントを作成します。 API Keyを作成して取得します。今回実行するコードはこちらです。入力されたテキスト内容に対してAI APIが回答をしてくれます。Paramで引数を設定することで、Runbook実行時に値を渡すことができます。 Param ( [String]$GetText ) $Uri = "https://api.openai.com/v1/completions" $Headers = @{ "Content-Type" = "application/json" "Authorization" = "Bearer <取得したAPIキー>" } $Body = @{ "model" = "text-davinci-003" "prompt" = $GetText "temperature" = 0.7 "max_tokens" = 2000 } | ConvertTo-Json $Byte = [System.Text.Encoding]::UTF8.GetBytes($Body) $Response = Invoke-RestMethod -Uri $Uri -Method Post -Headers $Headers -Body $Byte $Utf8_Text = $Response.choices[0].text $Output = [System.Text.Encoding]::Utf8.GetString([System.Text.Encoding]::GetEncoding("ISO-8859-1").GetBytes($Utf8_Text)) $Output Azure AutomationでRunbookを作成して実行してみましょう。「パラメーター」に“今日の東京の天気は？”と入力して実行します。このようにAI APIから回答が届きます。最後に「公開」を選択してPower Automateから利用できるようにしておきます。Azure Automationの準備は以上で完了です。 Power Automate クラウドフローの作成最後にAzure Automationを利用するためのクラウドフローを作成します。フローの全体はこちらになります。Teamsのチャネルに投稿されたメッセージをRunbookのパラメーターとして引き渡して、AI APIから回答を取得します。各変数は「ジョブの作成」-「Runbook Parameter GetText」　＝　“チャネルに新しいメッセージが追加されたとき”-“メッセージ本文コンテンツ”「ジョブの出力を取得します」-「ジョブ ID」＝ “ジョブの作成”-“ジョブID”「チャネル内のメッセージで応答します」-「Message ID」 = “チャネルに新しいメッセージが追加されたとき”-“メッセージ ID”「チャネル内のメッセージで応答します」-「Message」＝ “outputs('ジョブの出力を取得します').body”以上となります。テスト実行 Teamsでチャットボットをテストしてみましょう。簡単な質問ですが違和感無く回答が得られています。　以上、Teamsで利用できるチャットボットの開発です。ChatGPTと同様のAIを利用して、自然な言葉のやり取りができるようになっています。質問内容によってはとても細かく専門的な内容まで回答してくれます。また、新しい取り組みとしてクラウド上でPowerShellをサーバーレスで実行できる環境もうまく動かすことができました。技術的は盛沢山の要素を組み合わせてクラウド完結型のアプリケーションが開発できています。
- ChatGPT
- 応用
2023.04.04
技術情報
ChatGPTの学習データと学習方法が知りたい

本記事はGMOインターネットグループで複数ある開発者ブログのなかから人気の記事をピックアップして再掲載しています。機械学習や深層学習のビジネス応用を研究、社会実装をしているグループ研究開発本部 AI研究開発室のデータサイエンティストが寄稿した人気記事です。はじめにみなさん、こんにちは。上記の画像は、昨年末に公開され話題となっているChatGPTとお話ししてみた時の画像です。文章としては、文法が崩壊しておらず、意味も通るとても自然な文章が生成されていますね。しかし、単純な質問に見えて「埼玉県に海はない」「ウニはイクラではない」「”イクラ”か”幾ら”かで意味が変わる」などのバックグラウンド知識や文脈の高度な判断が、適切な解答のためには要求される質問に見事に引っ掛かっています。これは、あくまで入力に対して尤もらしい出力を返すモデルであり、知識から論理的な回答をするモデルではないためです。一方、わざわざ弱点をつくような質問をしなければ、「ポケモン」が「アニメやゲームに登場する架空の生物」であると言う知識があるような回答をしたりするなど知識の範囲は幅広く、適切に条件を入力すればその条件を満たすプログラミングコードを出力できる、など一般に論理的な思考が必要とされているタスクに限定的な条件では成功しています。このように、人目に見てもかなり自然で尤もな文章を出力できる能力がある一方で、さまざまな制約も残されているChatGPTですが、どのようなモデルでどのようなデータを学習しているのでしょうか？このブログでは、開発元のOpenAIの資料などに目を通して学んだことをまとめる形で共有しようと思います。 TL;DL ChatGPTは、OpenAIの開発したAI会話botであり、言語モデルInstructGPTが用いられている。モデルは、大規模コーパスで学習したモデルに対して、人手で作成された会話文や人手の会話文評価を元にPPO強化学習をおこなったもの（Reinforcement Learning from Human Feedback (RLHF))入力に対し、尤もらしい出力を解答として返す。実世界の知識を元に解答はしないが、ChatGPTには、差別的、暴力的などの有害な入力を弾く仕組みは入っている。おそらくGPTベースの分類器を用いたモデレーションAPIと同様のもの。有害な出力は抑制するように学習されているが、有害な出力は生成されることもある。あとはOpenAIのブログや論文を読んでください！ ChatGPTのアーキテクチャ大部分はChatGPTで使われているInstructGPTの学習の話になります。 ChatGPT:対話のための言語モデルの最適化より以下は各ステップの説明です。（Step0）：大規模コーパスを用いた汎用モデルのトレーニング GPT-3の後継にあたるGPT-3.5をWebから取得した大規模コーパスでトレーニングします。GPTは、近年の自然言語処理モデルで多く用いられている深層学習モデルTransformerの構造を用いているモデルの１つです。Transformerのデコーダ部分のみを用いて、文章の一部のマスクされた単語を当てるなどの疑似的なタスクを解く学習をすることで、さまざまな言語処理タスクに用いることができる汎用的なパラメータを獲得します。このような、本当に解きたいタスクを解く前に擬似的なタスクを解いて汎用的なパラメータを得る学習を事前学習などと言います。Transformerの構造は、近年の高精度なモデルでは非常によく使われており、最近では自然言語処理の深層学習モデルの話をするたびに説明する羽目になっているので、今回は詳しく触れません。私やAI研究開発室メンバーの過去の記事などに解説がありますのでそちらをご覧ください。 Step1：人間のラベラーによるお手本のデータの収集、およびそのデータを用いた教師あり学習まず、学習に用いる会話データセットから、いくつか入力の文章をサンプルし、人間のラベラーが望ましい出力の文章を入力に対する正解のデータとして作成します。これを教師データとして用いて、事前学習したGPT-3.5のパラメータを調整します。この調整のための学習を、教師ありファインチューニング（SFT:Supervised Fine-Tuning）と呼びます。 Step2：モデルの出力の人手によるランキングの作成と、それを用いた報酬モデルの作成 Step1の時点で、モデルはある程度、質問に対して答えを返せるようになっているはずです。そこで、ある入力に対して複数回のモデルによる出力を用意し、その出力を人間のラベラーが比較して評価します。人間のラベラーは、より有益で正確な出力のランクが高くなるように評価します。そして、そのデータを用いてStep3の強化学習に使われる報酬モデルを学習します。報酬モデルは、生成モデルの出力がより有益で正確な出力であればあるほど高い値となる報酬関数を表すニューラルネットワークといえます。 Step3：Proximal Policy Optimization（PPO）編強化学習アルゴリズムを用いた、報酬モデルに対する出力生成方策の最適化ここではStep2までで使用されなかった入力の文章を、同じ会話データセットからサンプルし、そのデータを用いて学習します。まず、方策モデルの初期状態を、教師あり学習で得られた方策と定めます。そして、その方策に従い、入力に対する出力の文章を生成し、出力の質をStep2で得た報酬モデルで評価します。その結果に基づいて、方策のパラメータを更新し、更新された方策で再度出力の生成を行い出力を報酬モデルで評価することを繰り返します。そうして報酬モデルの評価が高くなるように方策を最適化します。 Step2の途中から何のことやら、わからなくなってきましたね。できる限り平易に説明します。まず、やろうとしていることは、大規模に学習したモデルの出力を人手で見て調整するのと同じことを機械的にやってやろう！ということです。出力の価値を最大化するように学習を進める学習を強化学習といい、今回のように出力の仕方（Policy,方策）をモデル化し最適化していくようなものを方策ベースなどと言ったりします。出力が良いか悪いか判断するのがStep2の報酬モデルで、出力の方法をどのように変えたらいいかを決めているのがStep3の方策モデルです。 PPOについて知るには、まず方策関数の最適化について知る必要があります。方策はあるパラメータに依存する関数（方策関数）としてモデル化されます。そしてモデル化された報酬に基づく目的関数を最大化するように、パラメータを探索し、方策関数を更新します。目的関数の最大化問題は勾配法で解くことができます。このような最適化を方策勾配法と言います。しかし、方策勾配法では、報酬関数の与える報酬が極端に大きくなってしまった場合にパラメータが過剰に更新され方策モデルが崩壊する、パラメータの更新を十分に小さくすると学習が進まない、といった問題がありました。これらの問題を解決しようとした手法の１つが、Trust Region Policy Optimization(TRPO)です。TRPOではパラメータ更新前後の方策関数の変化の大きさを測る指標を、最適化の制約項として導入します。これにより、パラメータの更新による方策関数の急変を回避しながらパラメータを十分に更新でき、学習が安定します。ただし、制約項導入の結果、TRPOでは厄介な最適化問題を正面から解くことになってしまったので、計算コストや実装コストが大きくなってしまいました。そこで、実装を軽くするために、パラメータの更新による方策関数の変化に制約をかけながらも、最適化問題を一部単純化したものがPPOです。ChatGPTの方策モデルは、このPPOで最適化されています。制約 OpenAIは次のようなChatGPTの限界を認めています。 ChatGPT は、もっともらしく聞こえても、不正確または無意味な出力をすることがあります。この問題は大きく3つの理由で解決が難しいです。強化学習の際に、現時点では信頼できる情報源がない。（Ground Truthの取得元がない）モデルが正確で有益な情報のみを出力できるように慎重に学習すると、正しく答えられたはずの質問も、解答が正確で有益な情報と言えないと判断し解答できないケースが増える。理想的な答えは、人間の評価者の知識ではなくモデルが獲得した知識に依存するため、教師あり学習はモデルを誤った方向に導く可能性がある。（3）については少し複雑なので、次のリンクの記事が参考になります。簡単に言うと、人間の評価者を使った教師あり学習では、モデルは人間の模倣をするようになるため、人間の方が知識が多ければモデルはモデルが獲得していない知識を知っているかのように振る舞い（つまり知ったかぶる）、モデルの方が知識があれば、わざと人間同様愚かに振る舞う（知っていても知らないふりをする）ということです。理想的にはモデルが持つ知識のみに基づいて正しく解答してほしいので、そこにギャップがあります。Behavior Cloning is Miscalibrated ChatGPT は、入力フレーズの微調整や、同じ入力に対する複数回の回答の生成に敏感です。たとえば、ある質問をしたとき、モデルは答えを知らないと返しますが、少し言い換えれば、正しく答えることがあります。モデルは過度に冗長であり、OpenAI によってトレーニングされた言語モデルであるというフレーズを繰り返し使うなど、特定のフレーズを多用します。これらの問題は、トレーニングデータの偏りと、人手の評価を反映した学習や強化学習でトレーニングする際に一般的によく起こる、過度の最適化によるものです。理想的には、モデルはユーザーがあいまいな表現や質問をしたときには、質問を明確にするために聞き返すのが望ましいです。しかし、現在のモデルは多くの場合、曖昧な質問に対してもユーザーの意図を勝手に推測して答えてしまいます。有害な入力や出力を抑制するようになっていますが、完璧に行うことはできていないとOpenAIは認めています。私も色々と「xxxx」「****」「（検閲削除）」のような差別的あるいは暴力的で過激な入力を試しましたが、今のところ思いついた範囲では、「そのような不適切な入力には回答できない」というようなメッセージが返ってきました。精度はかなり良いようですが、ワードで弾きづらい偏見を含んだ入力に対しては不適切な出力を返すかもしれません。ポリコレに明るい方は、ぜひ色々と試してみてほしいです。学習データとラベリングのポリシーこの辺りの話はOpenAIが公開しているモデルカードに詳細に書かれています。https://github.com/openai/following-instructions-human-feedback/blob/main/model-card.mdGPT-3の事前学習には以下のデータセットが使われています。 Common Crawl12年間のWeb クロールで収集されたペタバイト単位のデータが含まれています。未加工のWebページデータ、メタデータの抽出、およびテキストの抽出で構成されます。WebTextデータセットの拡張版https://paperswithcode.com/dataset/webtextインターネットベースの図書コーパス英語版wikipedia ChatGPTはポケモンなども知っていましたが、おそらくWebのクロールデータに入っていたのでしょう。ラベリングは研究チームがテストして選んだ約40人のラベラーによって行われたそうです。ラベラーの選抜基準は、さまざまな人口統計グループの好みに敏感で、潜在的に有害な出力を特定できるかどうかになっています。ラベリングの方針の指示についてはGoogle Documentで公開されています。 https://docs.google.com/document/d/1MJCqDNjzD04UbcnVZ-LmeXJ04-TKEICDAepXyMCBUb8/edit#https://docs.google.com/document/d/1d3n6AqNrd-SJEKm_etEo3rUwXxKG4evCbzfWExvcGxg/edit 出力の評価に関する指示には大きく三つの判断基準が指示されています。１つ目は有用であること。（helpful）これは出力がユーザーの意図に沿っており、ユーザーのタスク解決に役立つことを意味します。例えば、わかりやすく明確に書く、国際性に配慮する、与えられていない余計な文脈を推測して答えない、といったことです。２つ目は、真実味があること。（truthful）これは、出力が正確な情報を含んでおり、ユーザーを誤解させないことを意味します。例えば、明らかに誤っていることをでっち上げない、要約のようなタスクで入力の情報以外の情報を入れない、といったことです。3つ目は、無害であること。（harmless）これは、出力が人々に物理的、心理的、または社会的な害を与えてはならないこと、機器や財産の損傷や喪失、環境への損害、人間の福利に必要な制度や資源への害を与えてはならないことを意味します。例えば、偏見を持たない、差別的や攻撃的な表現をしない、求められていない場合は性的や暴力的なことを書かない、違法行為を助長しない、といったことです。これらの基準は、評価の際にトレードオフになる可能性があり、その場合ほとんどのタスクでは、無害で真実であることが役に立つことよりも重要であるため、その方針に従って評価することが求められています。基準がトレードオフになる例として、「身近な爆弾の製法は？」という質問に対する回答が挙げられています。正しく有用な解答は「圧力鍋に爆発物を詰めたらいいよ！」かもしれませんが、この解答は有害すぎるので、例えば、「そんな危険なことには答えられません。」という回答が無害で好ましいです。毒性についての評価は次のように指示されています。まず、毒性を、無礼な、失礼な、または理不尽な文章と定義しています。絶対的な毒性だけでなく、相対毒性も考慮されており、入力から予想されるよりもはるかに毒性が高い場合、出力は高い相対毒性を持つと定義されます。また、どのような入力に対しても出力の毒性が変化しないのは不自然です。もしインターネットで入力テキストを見たなら、次にこの出力が来ても全く驚かない、というレベルに毒性が収まっているかも評価されます。これは継続性と言われています。参考執筆にあたってOpenAIのブログや資料を参考にしました。ChatGPT:対話のための言語モデルの最適化研究者向けモデルインデックスAligning Language Models to Follow InstructionsInstructGPTの論文はこちらです。Ouyang, Long, et al. “Training language models to follow instructions with human feedback.” arXiv preprint arXiv:2203.02155 (2022).https://arxiv.org/abs/2203.02155PPOついて詳しく知りたい方は、この方の記事が非常にわかりやすいです。ハムスターでもわかるProximal Policy Optimization （PPO）①基本編最後にグループ研究開発本部 AI研究開発室では、データサイエンティスト/機械学習エンジニアを募集しています。ビッグデータの解析業務などAI研究開発室にご興味を持って頂ける方がいらっしゃいましたら、ぜひ募集職種一覧からご応募をお願いします。皆さんのご応募をお待ちしています。
2023.02.14
技術情報

GMOインターネットグループのSNSをフォローして最新情報をチェック

CATEGORY

GMOインターネットグループ株式会社