面倒なブラウザ操作をSeleniumを使って自動化する-Vol.01 / 開発者向けブログ・イベント

こんにちは。GMOインターネットの中村です。
本エントリーでは、面倒なブラウザの操作を自動化するSeleniumについて紹介させていただきます。
マスターすると人気商品の入荷などをリアルタイムに通知できたりします。

面倒なブラウザ操作

みなさん、ネットサーフィンしてるときに会員登録の情報入力欄を見て面倒だなあ…と思ったことはないでしょうか。
私は面倒になってしまい、あとでいいや・・・となりがちです。
例でいうと下記のような画面です。

https://account.onamae.com/accountCreate

実業務においても、極々稀でありますがブラウザでしか操作できない業務が出てきたりします。
実例を出すと、一部の古いサーバ設定が、ブラウザ上でしか設定できないというものがありました。
（※最近のサーバーは設定流し込み用のツールがベンダー公式から出ていたりします　便利な時代になりました）

ページ自体の動作が重く1台あたり8分ほどの時間がかかる作業でした。

5、6台なら、別作業の合間にできるんですが中々に厄介な点が有り、

設定しないといけない台数が2000台前後ある

(´·ω·`)

これを人力…？orz

１台あたりの作業時間8分と考えると

2,000台×8分＝16,000分(266.77…時間)

1日8時間労働想定で、1人で毎日かかりきりになっても33日以上かかります。
これはきついです…orz
人海戦術でいこうにも、都合よくその期間が空いてる人がいっぱいいるわけでもありません…
しんどい…

そんなときのRPA！

ということで人が駄目なら機械に働いてもらいましょう！
RPAとは【ロボティック・プロセス・オートメーション】の略で、自動化技術の一種です。

Selenium

RPAにも色々なツールがあります。
その中でもブラウザ操作に特化したSelenium（セレニウム）を使った方法を今回はご紹介します。
マシンスペックが足りれば並列で複数同時にブラウザ操作も可能です。

実行環境の準備

必要なものは下記になります。
僕はChromeユーザーなのでChrome想定で記載します。

python

記載時の最新版は3.10.4です。
環境変数への登録も済ませておきましょう。
https://www.python.org/downloads/

Seleniumライブラリ

pythonインストール後に、下記でSeleniumのライブラリを追加しておきましょう。

pip install selenium

Chrome

既にインストール済みの方が多いとは思いますが念のため…
https://www.google.co.jp/intl/ja/chrome/

ChromeDriver

Chromeとのバージョンを合わせるように注意しましょう。
環境変数への登録も済ませておきましょう。
https://chromedriver.chromium.org/downloads

早速webページを開いてみる

指定URLを開く

下記メソッドで指定URLのwebページを開くことができます。

driver=webdriver.Chrome()
driver.get('接続したいURL')

試しに下記内容でスクリプトを作成します。

#ライブラリ読み込み
from selenium import webdriver
import time

#クロームの立ち上げ
driver=webdriver.Chrome()

#ページ接続
driver.get('https://account.onamae.com/accountCreate')

#10秒終了を待つ
time.sleep(10)

#クロームの終了処理
driver.close()

コマンドプロンプトなどで作成したファイルをpythonで実行します。
エディタにデバッグ機能などがついている場合はそちらでも構いません。

python test.py

これでブラウザで指定したwebページが立ち上がるのが確認できればOKです！

どの要素を操作したいか確認する

webページを立ち上げることはできました。

これからクリックやキー入力などのアクションを取るわけですが、ページ内の【どの要素】に対してアクションを行うか？というキーがないとなにもできません。

Seleniumで使用できるキーは下記2つです。

・XPath
・ID

webページ内の住所みたいなものと思っていただければと思います。今回はXPathの方で説明します。

どうやって調べるかご説明します。Chromeを開いてF12キーを押しましょう。
開発者ツールが立ち上がるはずです。開発者ツールが立ち上がったら赤丸部分のボタンを押しましょう。

この状態で操作したいページ要素をクリックします。
すると左側の開発者ツール内で、操作したい要素がフォーカスされます。

フォーカスされた要素に対して、右クリックを行います。
Copy → Copy XPathを選択します。

取得したXPathがこちらです。

//*[@id="lnameML"]

こちらをもとに入力やクリックなどを行います。

キー入力

下記のメソッドでキー入力が可能です。

driver.find_element_by_xpath('取得したXPATH').send_keys("入力したい内容")

試しに会員登録ページの名前部分の入力をしてみます。

#ライブラリ読み込み
from selenium import webdriver
import time

#クロームの立ち上げ
driver=webdriver.Chrome()

#ページ接続
driver.get('https://account.onamae.com/accountCreate')

#キー入力
driver.find_element_by_xpath('//*[@id="lnameML"]').send_keys("なかむら")

#10秒終了を待つ
time.sleep(10)

#クロームの終了処理
driver.close()

これでキー入力ができました。

クリック

キー入力ができたので、次はクリックを試してみましょう。
クリックは下記のメソッドで実行可能です。

driver.find_element_by_xpath('取得したXPATH').click()

試しに【次に進む】ボタンをクリックしてみましょう。

#ライブラリ読み込み
from selenium import webdriver
import time

#クロームの立ち上げ
driver=webdriver.Chrome()

#ページ接続
driver.get('https://account.onamae.com/accountCreate')

#決定ボタンのクリック
driver.find_element_by_xpath('//*[@id="editAccountForm"]/p[2]').click()

#10秒終了を待つ
time.sleep(10)

#クロームの終了処理
driver.close()

こちらでクリックしたことを確認できました。
（何も必要情報を記載していないのでエラーになってはいますが）

もっと

もっと知りたい方は下記サイトが参考になります。

逆引きSelenium
https://www.seleniumqref.com/api/webdriver_gyaku.html

一通り入力してみる

一通り入力して会員登録できるかを試してみましょう。

#ライブラリ読み込み
from selenium import webdriver
import time

#クロームの立ち上げ
driver=webdriver.Chrome()

#ページ接続
driver.get('https://account.onamae.com/accountCreate')

#名前入力
driver.find_element_by_xpath('//*[@id="lnameML"]').send_keys("なかむら")
driver.find_element_by_xpath('//*[@id="fnameML"]').send_keys("しんご")
driver.find_element_by_xpath('//*[@id="lname"]').send_keys("Nakamura")
driver.find_element_by_xpath('//*[@id="fname"]').send_keys("Shingo")

#郵便番号入力
driver.find_element_by_xpath('//*[@id="pcJp1"]').send_keys("150")
driver.find_element_by_xpath('//*[@id="pcJp2"]').send_keys("8512")

#郵便番号から住所入力をクリック
driver.find_element_by_xpath('//*[@id="pcJapan"]/td/div/button').click()
#処理が終わるまで少し待機
time.sleep(2)

#番地を入力
driver.find_element_by_xpath('//*[@id="street1MLNumber"]').send_keys("26-1")
driver.find_element_by_xpath('//*[@id="street1Number"]').send_keys("26-1")

#電話番号入力
driver.find_element_by_xpath('//*[@id="phone"]').send_keys("03-5456-2555")

#メールアドレス入力
driver.find_element_by_xpath('//*[@id="email"]').send_keys("[email protected]")
driver.find_element_by_xpath('//*[@id="emailConfirm"]').send_keys("[email protected]")

#パスワードの入力
driver.find_element_by_xpath('//*[@id="loginPassword"]').send_keys("muzukashii-pass")
driver.find_element_by_xpath('//*[@id="loginPasswordConfirm"]').send_keys("muzukashii-pass")

#決定ボタンのクリック
driver.find_element_by_xpath('//*[@id="editAccountForm"]/p[2]').click()

#10秒終了を待つ
time.sleep(10)

#クロームの終了処理
driver.close()

各処理後の処理結果の画像を取得する

ほんとに処理がうまく行ったのか後から確認したいこともあります。
そんな時は画面キャプチャの取得が可能です。

driver.save_screenshot('保存したい画像のパス.png')

試してみます。

#ライブラリ読み込み
from selenium import webdriver
import time
#クロームの立ち上げ
driver=webdriver.Chrome()

#ページ接続
driver.get('https://account.onamae.com/accountCreate')

#名前入力
driver.find_element_by_xpath('//*[@id="lnameML"]').send_keys("なかむら")
driver.find_element_by_xpath('//*[@id="fnameML"]').send_keys("しんご")
driver.find_element_by_xpath('//*[@id="lname"]').send_keys("Nakamura")
driver.find_element_by_xpath('//*[@id="fname"]').send_keys("Shingo")

#郵便番号入力
driver.find_element_by_xpath('//*[@id="pcJp1"]').send_keys("150")
driver.find_element_by_xpath('//*[@id="pcJp2"]').send_keys("8512")

#郵便番号から住所入力をクリック
driver.find_element_by_xpath('//*[@id="pcJapan"]/td/div/button').click()
#処理が終わるまで少し待機
time.sleep(2)

#番地を入力
driver.find_element_by_xpath('//*[@id="street1MLNumber"]').send_keys("26-1")
driver.find_element_by_xpath('//*[@id="street1Number"]').send_keys("26-1")

#電話番号入力
driver.find_element_by_xpath('//*[@id="phone"]').send_keys("03-5456-2555")

#メールアドレス入力
driver.find_element_by_xpath('//*[@id="email"]').send_keys("[email protected]")
driver.find_element_by_xpath('//*[@id="emailConfirm"]').send_keys("[email protected]")

#パスワードの入力
driver.find_element_by_xpath('//*[@id="loginPassword"]').send_keys("muzukashii-pass")
driver.find_element_by_xpath('//*[@id="loginPasswordConfirm"]').send_keys("muzukashii-pass")

#決定ボタンのクリック
driver.find_element_by_xpath('//*[@id="editAccountForm"]/p[2]').click()
#処理が終わるまで少し待機
time.sleep(3)

#画面キャプチャを取得
driver.save_screenshot('次へ進む実行後の画面.png')

#10秒終了を待つ
time.sleep(10)

#クロームの終了処理
driver.close()

こちらが上記で実際に画面キャプチャしたファイルです。
問題なく動いていますね。

画面キャプチャをとっておくことによって、
正常に処理が完了したのか？失敗した場合はどの画面で躓いたのかが視覚的にわかります。

通知する

合わせてAPIを使用すれば各種ツールで通知も連携可能です。

・slack

・LINE

・twitter

・Emailなどなど

結局2000台どうなった

自動化の甲斐があって無事に終わりました。

手動だと267日かかる作業が3日で済みました。
人がやるには精神を削られる作業だったのでSelenium万々歳です…

（普段の生活への応用もできます）

限定的ではありますが業務だけではなく、日常生活の応用もできます。

・人気商品の在庫監視をして入荷されたら通知を送る
・通知などに対応していないwebサービスで、画面キャプチャを取ることで擬似的に通知機能を持たせる
・毎日定時で行う作業を放置しててもできるようにする

24時間ずっとPC動かし続けるのはちょっと・・・

自分のPCを24時間使うのはちょっと…と思う方はConoHa VPSを使っていただければ幸いです！

中村槙吾

GMOインターネットグループ株式会社

2017年よりGMOインターネットグループにて運用保守業務に従事。 H/W保守や障害対応などの傍らで、運用効率化の取り組みを行う。

ブログ記事一覧へ

採用情報

KEYWORD

CATEGORY

KEYWORD

YEAR/MONTH

AUTHOR

SNS FOLLOW

OLD REPORT

TAG

面倒なブラウザ操作をSeleniumを使って自動化する-Vol.01

面倒なブラウザ操作

これを人力…？orz

そんなときのRPA！

Selenium

実行環境の準備

python

Seleniumライブラリ

Chrome

ChromeDriver

早速webページを開いてみる

指定URLを開く

どの要素を操作したいか確認する

キー入力

クリック

もっと

一通り入力してみる

各処理後の処理結果の画像を取得する

通知する

結局2000台どうなった

24時間ずっとPC動かし続けるのはちょっと・・・

関連記事はこちら

ブログの著者欄

中村槙吾

採用情報

関連記事

CATEGORY

CATEGORY

KEYWORD

YEAR/MONTH

AUTHOR

SNS FOLLOW

OLD REPORT

TAG

面倒なブラウザ操作をSeleniumを使って自動化する-Vol.01

面倒なブラウザ操作

これを人力…？orz

そんなときのRPA！

Selenium

実行環境の準備

python

Seleniumライブラリ

Chrome

ChromeDriver

早速webページを開いてみる

指定URLを開く

どの要素を操作したいか確認する

キー入力

クリック

もっと

一通り入力してみる

各処理後の処理結果の画像を取得する

通知する

結局2000台どうなった

24時間ずっとPC動かし続けるのはちょっと・・・

関連記事はこちら

ブログの著者欄

中村 槙吾

採用情報

関連記事

CATEGORY

中村槙吾