Python入門トップページ


目次

  1. テストの自動化と Selenium
  2. Selenium のインストール
  3. ChromeDrive - WebDriver for Chrome のダウンロードと設置
  4. Web ページを開いてみよう
  5. リンクをクリックしてみる
  6. 要素の情報を取り出す
  7. すべての要素を取り出してみよう
  8. リンクを開いて戻ってみる
  9. リンクを巡回しながら情報を取得する(1)
  10. リンクを巡回しながら情報を取得する(2)
  11. リンクを巡回しながら情報を取得する(3)
  12. 要素の見つけ方

Selenium を使って Web からデータを自動収集しよう

リンクをクリックしてみる

前のページの例では経営学部コース紹介のページが表示できたので,その中のリンクを探し,そのページに移動してみる.このためにまずコース紹介のページの HTML ソースコードを確認する.

selenium-2021-04

上の図から,<div class="pht"> ... </div> タグで囲われたイメージをクリックすれば,リンク先ページに移動できることがわかる.よって,17行目のように class="pht" を検索することにする.あるいはコメントアウトしている20行目のように <h3> ... </h3> タグをクリックしても良い.

 リンクをクリックする (manager-selenium02.py)from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.by import By
import time       # 時間を操作するPythonの標準モジュール

# 操作するブラウザを開く
chrome_service=Service(ChromeDriverManager().install())
driver = webdriver.Chrome(service=chrome_service)
# driver = webdriver.Chrome('C:\\Users\\bk182005\\Documents\\selenium\\chromedriver.exe') # 手動インストールを使う場合

# 操作するページを開く
driver.get('https://kobegakuin-biz.jp/course/')

# 3秒待つ
time.sleep(3)

# class='pht' の要素を検索し、その先頭のリンクをクリックする
driver.find_element(By.CLASS_NAME, 'pht').click()

# h3 を検索してクリックしても良い
# driver.find_element(By.TAG_NAME, 'h3').click()

# 3秒待つ
time.sleep(3)

# ブラウザを閉じる
driver.close()

目次に戻る