「Python」カテゴリーアーカイブ

Pythonによるデータ分析のおすすめ書籍

最近、仕事で「データに基づく意思決定」の重要性が高まり、Pythonによるデータ分析が注目されています。とはいえ、いざ学ぼうと思っても「何から始めればいいのか」「どの本を選べばいいのか」で迷う人は多いはず。そこで本記事では、初心者から中級者まで、レベルや目的に応じて学べるおすすめ書籍をご紹介します。手を動かしながら、実際の仕事に活かせる本ばかりを集めました！

まずは初心者向け

Python2年生データ分析のしくみ第2版体験してわかる！会話でまなべる！

一番シンプルに一番簡単に学べる本はこのシリーズではないでしょうか。
Pythonの基本は少し触ったけれど、「データ分析って何をするの？」「Pandasやグラフってどう使うの？」と感じている超入門者にぴったりの一冊が、『Python 2年生データ分析のしくみ』です。

このシリーズ最大の特長は、キャラクター同士の会話形式で進む、やさしい解説スタイル。小難しい説明を最小限に抑えながら、「なぜそうなるのか？」を対話で自然に理解できる構成になっています。

以下のような内容を、ストーリー仕立てで段階的に学んでいきます：

データ分析とは何か？の基礎的な考え方
Jupyter Notebookの使い方
Pandasによる表データの扱い（DataFrameの基本）
グラフの作成（棒グラフ、折れ線グラフ、散布図）
集計・並べ替え・フィルタリングなどの基礎操作
分析結果の可視化と解釈のコツ

この本の魅力は、会話式で読みやすく「読み進めているうちに自然と手が動く」点にあります。

キャラの質問 → 解説 → コードの実行 → 結果確認というテンポの良い構成
すべてのサンプルコードがJupyter Notebookで実行できる
イラストや図解も豊富で、視覚的に理解しやすい

特に、「表形式のデータを扱うってこういうことなんだ」と体感的に理解できるため、初心者がつまずきやすい“Pandasの第一歩”に最適です。

身に付くスキル

Jupyter NotebookでPythonコードを試せるようになる
表データ（CSVなど）の読み込みと加工の基本操作
分析結果を棒グラフ・折れ線グラフで視覚化できる
データ分析の全体像をイメージとして理解できる

こんな人におすすめ

データ分析をはじめて学ぶ学生や社会人
難しい数式や理論にアレルギーがある人
楽しく、ストレスなく、基礎を身につけたい人

基礎を学んだら次は実際の仕事でどう使うかを学ぶ

Python実践データ分析100本ノック第2版

「基礎は学んだ。でも実際に手を動かす機会が少ない」
「実務を意識したトレーニングを積みたい」
そんな人に次におすすめしたいのが、『Python実践データ分析100本ノック』です。

名前の通り、本書は 100問の実践的な問題を解いていくことで、実務レベルのデータ処理・分析スキルを身につけられる問題集形式の書籍です。
書籍の概要

この本では、架空のEC企業のデータを用いて、実際にありそうな課題をPythonで解決していきます。
以下のようなステップで構成されており、1問ずつ着実にスキルを積み上げていく設計です。

データの読み込み、整形（Pandasの基本操作）
欠損値や異常値の処理
集計や条件分岐によるデータ加工
グループ化と統計指標の計算
時系列データの扱い
可視化の実践

この本の特長は、「実際に起こりそうな仕事での課題にどう処理すればいいのか？」を自分で考えながら手を動かすスタイルにあります。

単なる写経ではなく、問題解決力が鍛えられる
各ノックが「現場でありがち」な課題設定になっている
模範解答も付いており、つまづいても安心

例えば、こんな課題があります：

「新規顧客と既存顧客の購入傾向に違いはあるか？」
「キャンペーン前後で購入回数に差は出たか？」
「商品カテゴリごとの月別売上を一覧で出力せよ」

どれも現実の仕事で起こりそうな分析課題です。

身に付くスキル

Pandasの実践的な使い方（apply, groupby, merge などの頻出パターン）
データ分析における思考プロセス（仮説 → 検証）
ビジネスデータを扱う現場での“型”が身につく
コードの読みやすさや再利用性も自然に意識できるようになる

こんな人におすすめ

データ分析の実力を“実務レベル”に引き上げたい人
自走できるスキルを身につけたい初〜中級者
手を動かしながら「試して覚える」学習スタイルが合う人

統計学という学術的な面も踏まえて学ぶ

Pythonで学ぶあたらしい統計学の教科書第2版

「平均値や標準偏差は知っているけれど、統計学って本当はどう使うの？」
「Pythonで統計の考え方も一緒に学びたい」
そんな方に最適な1冊が、『Pythonで学ぶあたらしい統計学の教科書』です。

この本は、統計学の基本を、Pythonコードとともに直感的に学べる構成になっており、数学が苦手な人でも安心して読み進められるのが特徴です。

この本は、数式をできるだけ使わず、「なぜその考え方が必要か」「どう活用するのか」にフォーカスした構成です。

主な内容は以下の通り：

統計学の考え方の基礎（母集団、標本、平均、分散）
データの可視化（ヒストグラム、箱ひげ図、散布図）
確率分布（正規分布、二項分布）
回帰分析（単回帰、重回帰の基本）
Python（Pandas、NumPy、Matplotlib）での実装例

この本の強みは、以下のように理論と実践のバランスが取れている点です。

難しい数式を極力省き、考え方をストーリーで理解できる
Pythonコードを使って、実際に統計処理を動かしながら学べる
図解が豊富で、視覚的にも理解しやすい

たとえば、正規線形モデルや機械学習といった「よく聞くけど意味が曖昧な概念」も、会話形式や具体例を交えて解説されているため、すっと頭に入ってきます。

身に付くスキル

統計学の基本的な概念と用語の正確な理解
Pythonで統計的な処理を実装する基礎力
分析結果を“根拠をもって説明する力”
統計的推定や回帰分析など、実務でよく使う手法の実践力

こんな人におすすめ

データ分析を本質的に理解したいPython初学者
数式ではなく「実際に手を動かして」統計を理解したい人
分析に説得力を持たせたいビジネスパーソンや学生

プロとしてもう1冊分析の幅を広げる1冊

Pythonによるあたらしいデータ分析の教科書第3版【リフロー型】

「ツールの使い方だけでなく、なぜその分析が必要なのかまで深く理解したい」
「データ分析を“技術”と“考え方”の両面から学びたい」
そう考える読者に強くおすすめできるのが、『Pythonによるあたらしいデータ分析の教科書』です。
ひとつ前の本と同じあたらしい教科書シリーズでこちらは第3版まで出ている人気本です。

この本は、データ分析の全体像・基本原則・実践手法を、Pythonコードと図解で体系的に学べる構成になっています。

本書は、いわゆる“手法の寄せ集め”ではなく、「分析とは何か」という本質からスタートし、以下のような実践的なテーマに進んでいきます：

データ分析のステップと考え方（問題設定、仮説構築、評価など）
Pythonによる前処理、可視化、モデリング（Pandas・Matplotlib・Scikit-learn）
データの特徴を活かした加工・変換方法
回帰分析、分類、クラスタリングなどの基礎モデル
モデルの評価・チューニングと実践への落とし込み
分析レポートのまとめ方・伝え方

手法と理論、そして“意味づけ”まで学べる一冊。
この本の優れている点は、「手法を使って終わり」ではなく、なぜその手法を選ぶのか、どう考えるのかまで丁寧に解説していることです。

単なる機械的な分析ではなく、「背景を意識した分析」が身につく
実データ（ECサイトの販売情報など）を通じて、リアルな分析経験が積める
コードとグラフを交互に使い、視覚的な理解も重視されている

身に付くスキル

データ分析プロジェクトの全体像を描く力
Pythonによる一連の分析スキル（前処理→分析→可視化→説明）
仮説思考とデータ根拠のバランスをとったレポーティング能力
基礎的な機械学習のモデル設計・評価スキル

こんな人におすすめ

データ分析を体系的に学び直したい初〜中級者
ツールの使い方だけでなく、分析の背景や思考を重視したい人
分析業務において「もっと本質的に考えたい」と感じている人

最後に機械学習や理論に発展させ知識を自分のものにする

［第3版］Python機械学習プログラミング達人データサイエンティストによる理論と実践 impress top gearシリーズ

「基礎的な機械学習は一通り学んだ」
「次は理論的な背景を理解し、実務への応用力を高めたい」
そんな中級者以上におすすめなのが、『Python機械学習プログラミング達人データサイエンティストによる理論と実践』です。

本書はタイトルの通り、“理論に強く、実装にも踏み込んだ”中・上級者向けの一冊です。

この本は、データサイエンティストとして現場で通用するための「理論力」「実装力」「ビジネス感覚」をバランスよく学べるように設計されています。

主な内容は以下の通り：

機械学習の基礎理論（回帰、分類、クラスタリング、次元削減）
各手法の数理的な背景とPythonコードでの実装
前処理・特徴量設計・評価指標の選び方
Scikit-learnを中心としたライブラリ活用
モデルの精度を上げるためのチューニング技術
実務プロジェクトの進め方やビジネス観点の重要性

理論 × コード × 現場感の三拍子が揃う。
この本の特長は、手法ごとに「理論の背景 → 数式の解説 → Pythonでの実装」の流れで理解が深まると思います。

ハイパーパラメータ調整やモデルの評価など、現場でのノウハウも丁寧に紹介
数学的にもしっかりした解説があり、「なぜそうなるのか」を論理的に理解できる

身に付くスキル

各種機械学習モデルの仕組みと内部動作の理解
Scikit-learnでの応用的な実装力
精度や汎化性能を意識したモデル評価の習慣
実務プロジェクトを推進する際の技術的判断力

こんな人におすすめ

機械学習の基礎は一通り学んだ中級者以上の人
数理的な理解を深めて、分析の説得力を高めたい人
実務に即した機械学習の設計・運用に興味があるエンジニアや分析担当者

まとめ

これらの書籍を通じて学ぶ最大の利点は、基礎から実践、そして応用までを段階的に体系的に習得できることです。Pythonの使い方だけでなく、データの扱い方、分析の考え方、統計や機械学習の理論、ビジネスへの応用まで幅広くカバーされています。独学でも実務に通じるスキルが身につき、分析結果を根拠を持って伝える力がきっと実際の仕事の現場で活きてきます。

GPTsのおすすめ書籍3選

コメントを残す

GPTsのおすすめ本3冊

はじめに

みなさん、GPTsが無料で使えるようになりましたが、使っていますか？
私はヘビーユーザーです。無料になって使い始めてその便利さに驚き、ChatGPT Plusの有料プランにも遂に課金してしまいました。

本記事では、GPTsを活用してChatGPTをより効果的に使うためのおすすめ本3冊を紹介します。またエンジニア向けのオススメ本3冊も紹介します。これらの本は、GPTの基礎知識から実践的な応用までをカバーしており、初心者から上級者まで幅広く役立つ内容となっています。

プログラム無しですぐ使えるChatGPTオススメ本リスト3選

生成AIをプログラムしたいエンジニア向けおすすめ本

1. 「Amazon Bedrock 生成AIアプリ開発入門［AWS深掘りガイド］」

Amazon Bedrock 生成AIアプリ開発入門［AWS深掘りガイド］

2. 「ChatGPT/LangChainによるチャットシステム構築［実践］入門」

ChatGPT/LangChainによるチャットシステム構築［実践］入門

3. 「つくりながら学ぶ！生成AIアプリ＆エージェント開発入門」

つくりながら学ぶ！生成AIアプリ＆エージェント開発入門

内容紹介

1. 「GPTsでChatGPTを優秀な部下にしよう！」

本の概要

この本は、ChatGPTを使ったGPTsの作成方法が丁寧に書かれていてオススメです。
解説内容も読者の目的に合わせた「文章作成」「意思決定支援」「画像生成」といった内容から、GPTsのメニューに合わせた「Code Interpreter」「Knowlege」「API」という構成になっているので非常に自分の目的に合わせて読みやすくこんなことも出来るのかとワクワクして読める内容でした。
コードサンプルとして付属しているnoteの内容も流用可能なものが多く秀逸でした。

おすすめポイント

実践的なアプローチ：目的な別な構成になっており、具体的な使用例が豊富に紹介されています。
初心者にも優しい：GPTの基礎知識から丁寧に説明されているので、初心者でも理解しやすいです。
即実践可能：読んだその日から実践できるテクニックが満載です。

2. 「ChatGPT GPTsが作れるようになる本」

本の概要

この本は、GPTモデルの構築からカスタマイズまでを詳しく解説しています。技術的な部分を深く掘り下げており、GPTを自分で作りたいと考えている人に最適です。サンプルコードや具体的な手順が豊富に含まれており、実践的なガイドとなっています。
特に、購入者特典としてGPTを活用するためサンプルが用意されていて、これには、プロンプト集や、API認証設定の解説、サムネイル画像を自動生成する方法などがあります。情報をまとめたスプレッドシートも提供され、初心者から上級者まで幅広く役立つ内容となっています。

おすすめポイント

技術的な深掘り：モデルの構築プロセスが詳細に説明されており、開発者にとって非常に有益です。
具体的なサンプルコード：サンプルコードが豊富に掲載されており、実践に役立ちます。
応用例が豊富：様々な応用例が紹介されており、実際の開発に活かせる内容です。

3. 「ChatGPT 120%投資術」

本の概要

この本は、ChatGPTを活用した投資戦略について解説している一冊です。GPTsの分析能力を駆使して、効果的な投資判断を行う方法を学ぶことができます。市場の動向を予測するための具体的な手法や、過去のデータを基にしたシミュレーションが紹介されています。
120%シリーズとしてシリーズされている本の投資編になります。

おすすめポイント

投資に特化：投資に特化した内容で、具体的な戦略が紹介されています。
実践的なアプローチ：理論だけでなく、実際の投資シミュレーションが豊富に含まれています。
幅広い応用：GPTを活用した投資以外の応用方法も紹介されています。

3. 「つくりながら学ぶ！生成AIアプリ＆エージェント開発入門」

つくりながら学ぶ！生成AIアプリ＆エージェント開発入門

本の概要

PythonをベースにLangChain、Streamlitを使って以下のようなAIアプリやAIエージェントを作成している本です。アーキテクトの解説や実際のコードが含まれるため実践的な良書と思える1冊でした。

URLを入力すると、そのページの内容を自動で取得して要約してくれるAIアプリ
YouTubeのURLを投げると、その動画を見て内容を要約してくれるAIアプリ
PDFをアップロードして、その内容についてLLMに質問できるAIアプリ
Webで検索を行い、調べ物をしてくれるAIエージェント
BigQueryと連携して、データ分析を行うAIエージェント

おすすめポイント

最新技術を学べる：Python、LangChain、Streamlitといった技術が学べます。
実務に使えそうなサンプルアプリ：サンプルアプリでいろいろカスタマイズして実務に使えそうです。

まとめ

今回紹介した書籍は、いずれもGPTsを活用するための具体的な知識と実践的な方法が書かれています。みなさんにもそれぞれの本が持つ独自の視点とアプローチを活かせる場面がきっとあると思うのでぜひ読んでみてください。

AWS Lambda で Python プログラミング～Boto3 サンプル集S3編～

コメントを残す

概要～個人的によく使うLambda(Python Boto3)のサンプル集～

Lambdaプログラミングしていて良く使うコードサンプルをまとめていきます。
随時更新予定です(^^)

公式APIリファレンス

AWS公式のAPIリファレンスは以下のURLで何かあったら参照して正しく使いましょう。

https://boto3.amazonaws.com/v1/documentation/api/latest/index.html

S3サンプル

S3ファイルダウンロード

ダウンロードするS3のバケット名、オブジェクト名、Lambdaのローカル環境に保存するファイル名を指定します。
ローカル環境上に同名のファイルがあった場合は上書きされます。

import boto3
s3 = boto3.client('s3')

# バケット名、ダウンロードオブジェクト名、ダウンロードファイル名
S3_BUCKET_NAME = 'sample-bucket'
S3_OBJECT_DOWNLOAD_FILE_NAME = 'sample.jpg'
LOCAL_SAVE_FILE_NAME = '/tmp/sample.jpg'

def lambda_handler(event, context):

    # S3ダウンロード
    s3.download_file(S3_BUCKET_NAME, S3_OBJECT_DOWNLOAD_FILE_NAME, LOCAL_SAVE_FILE_NAME)

    return

S3ファイルアップロード

アップロード先のS3のバケット名、オブジェクト名、Lambdaのローカル環境にあるアップロード対象のファイル名を指定します。
Lambdaのローカル環境にアップロードファイルがある前提のため、事前にアップロードファイルは作成しておく必要があります。
S3上に同名のオブジェクトがあった場合は上書きされます。

import boto3
s3 = boto3.client('s3')

# バケット名、オブジェクト名、アップロード対象ファイル名
S3_BUCKET_NAME = 'sample-bucket'
S3_OBJECT_UPLOAD_FILE_NAME = 'S3sample.jpg'
LOCAL_UPLOAD_FILE_NAME = '/tmp/sample.jpg'

def lambda_handler(event, context):

    # TODOアップロード対象ファイル作成処理

    # S3アップロード
    s3.upload_file(LOCAL_UPLOAD_FILE_NAME, S3_BUCKET_NAME, S3_OBJECT_UPLOAD_FILE_NAME)

    return

S3ファイルダウンロード（メモリ上で扱う場合）

ローカル環境に保存せず、そのままメモリ上でバイトデータとして扱う場合は以下になります。

import boto3

s3 = boto3.resource('s3')

# バケット名、ダウンロードオブジェクト名
S3_BUCKET_NAME = 'sample-bucket'
S3_OBJECT_DOWNLOAD_FILE_NAME = 'sample.jpg'

def lambda_handler(event, context):
    # S3ダウンロード
    bucket = s3.Bucket(S3_BUCKET_NAME)
    obj = bucket.Object(S3_OBJECT_DOWNLOAD_FILE_NAME)
    response = obj.get()
    body = response['Body'].read()

    # 別のBotoクライアントにバイトのまま渡す場合
    # response = client.xxxxxx(Image={'Bytes': body})
    # ダウンロードファイルが画像ではなくJSONファイルの場合
    # print(json.loads(body.decode('utf-8')))

S3ファイルのリスト表示

ファイルのリスト表示するS3のバケット名を指定します。

import boto3

s3 = boto3.client('s3')

# バケット名
S3_BUCKET_NAME = 'sample-bucket'

def lambda_handler(event, context):

    # オブジェクトのリスト表示
    response = s3.list_objects_v2(Bucket=S3_BUCKET_NAME)

    for obj in response['Contents']:
        print(obj['Key'])

    return

S3事前署名付きURL発行

S3に保存してあるファイルを一時的に公開するときに使用する事前署名付きURLを発行するサンプルです。
事前署名付きURLを発行するS3のバケット名、オブジェクト名、URLの有効期限（秒）を指定します。

import boto3
s3 = boto3.client('s3')

# バケット名、事前署名URL発行オブジェクト名、有効期限（秒）
S3_BUCKET_NAME = 'ai-sample-bucket'
S3_OBJECT_PRESIGNES_FILE_NAME = 'sample.jpg'
EXPIRATION = 3600

def lambda_handler(event, context):

    # 事前署名URL発行
    response = s3.generate_presigned_url('get_object',
        Params={'Bucket': S3_BUCKET_NAME,
        'Key': S3_OBJECT_PRESIGNES_FILE_NAME},
        ExpiresIn=EXPIRATION)

    print(response)

    return

参考

Boto3ライブラリは、boto3.clientとboto3.resourceの2つの主要なクラスがあります。

boto3.clientは、AWSサービスのAPIアクションを呼び出すためのクライアントを提供します。例えば、s3クライアントを作成して、S3バケットを作成したり、オブジェクトを取得したり、削除したりすることができます。これは低レベルのAPIであり、AWSリソースとのやり取りがJSONデータで行われます。

一方、boto3.resourceは、AWSリソースを表すPythonオブジェクトを提供します。これは、より高レベルのAPIであり、AWSリソースとPythonオブジェクトのやり取りが可能です。例えば、s3リソースを使用して、バケットを作成したり、オブジェクトを取得したり、削除したりすることができます。また、オブジェクトにはファイルの内容にアクセスするためのread()メソッドがあり、オブジェクトに対してPythonオブジェクトと同じように操作できます。

それぞれで出来ること、やりたいことを理解して使い分けましょう。

Pythonのseleniumを使ってWeb画面操作を自動化する～サンプルを使ってWebスクライピンングのチャレンジ～

コメントを残す

概要～Pythonのseleniumを使って値取得／値入力／クリック／スクリーンショット等、画面操作を自動化する～

少しずつ毎日のWeb生活を快適にするために最近は Python で selenium 使ったWeb画面自動化処理を行っています。
今回の投稿は、その自動化処理をする上で繰り返し使える基本コードのまとめから、ちょっとした便利ノウハウをまとめた内容になっています。
これを実行すれば誰でも簡単にWeb画面の自動化処理ができ、日々単調なルーチンワークから脱却できるので、ぜひ試してみてください。

対象読者

Pythonを触ったことがある人
ブラウザの自動化で楽したい人

出来るようになること

Web画面を自動操作する
- 画面を開く
- 特定のHTML要素から値を取得する
- 特定のHTML要素に値を入力する
- ボタンをクリックする
Web画面のスクリーンショットを取得する

事前準備

今回は selenium を使って自動化します。その為に2つの事前準備が必要なのでその準備をします。

事前準備１～ブラウザのドライバをダウンロード～

Web画面の自動化はブラウザの専用ドライバーを使って画面操作を行います。そのためにドライバーをダウンロードします。ドライバーはブラウザ別に用意されているのでお好みのブラウザのドライバーをダウンロードしましょう。（どのドライバーでも自動化のソースコードは同じです）

chromeドライバー

https://chromedriver.chromium.org/downloads

Edge ドライバー

https://developer.microsoft.com/ja-jp/microsoft-edge/tools/webdriver/

事前準備２～seleniumのインストール～

これはpipを使うだけで簡単です。以下のコマンド実行します。

pip install selenium

事前準備は以上です！では、さっそくWeb画面の自動化にチャレンジしていきましょう！！

補足～Google Colaboratoryでのselenium実行～

seleniumu は Google Colaboratory でも実行できるので、サクッと試してみたい時はこちらがおすすめです。
その場合、ドライバー、selenium のインストールは以下のコマンドを実行しておくことになります。

!apt-get update
!apt install chromium-chromedriver
!cp /usr/lib/chromium-browser/chromedriver /usr/bin
!pip install selenium
!pip freeze

Google Colaboratory では、日本語フォントがインストールされていないので文字化けが発生する場合は、以下のコマンドで日本語フォントをダウンロードします。

# 日本語フォントをダウンロードする。
!apt-get -y install fonts-ipafont-gothic

それでは、本編に戻ります！

ページを開く

最初は最も基本的な特定のページを開く操作です。
getメソッドに開きたいページのURLを指定します。

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By

# ドライバーの設定
CHROME_DRIVER = "{ドライバーの格納フォルダ}\\chromedriver"

driver = webdriver.Chrome(CHROME_DRIVER,options=Options())

# 指定したURLの画面を開く
driver.get("http://www.google.com")

# ブラウザを閉じる
driver.quit()

【参考ドキュメント】
https://www.selenium.dev/ja/documentation/webdriver/drivers /options/#normal-default

サンプルソースの{ドライバー格納フォルダ}を自身でドライバーを保存したフォルダに変更して実行してみてください。（サンプルはChromeドライバーを使った例になります）

簡単にブラウザの特定のページが開けたと思います。すぐに閉じてしまっているので一瞬だったかもしれませんが、ここから自動化処理のスタートです！

要素を探す

seleniumで実現したいことはWeb画面の自動操作だと思います。
その中で最も基本的なことは操作したい要素を探す（指定する）ことであり、慣れるまでここが最も大変と思うのでこの部分を重点的に説明します。

要素の選択（指定）

要素の選択（指定）方法には以下の8種類があります。
（ロケータと呼びます）

ロケータ	詳細	コード例
id	id属性が一致する要素を探す	driver.find_element(By.ID,"abc")
class name	class名に値を含む要素を探す(複合クラス名は使えない)	driver.find_elements(By.CLASS_NAME,"abc")
css selector	CSSセレクタが一致する要素を探す	driver.find_elements(By.CSS_SELECTOR,"abc")
xpath	XPathと一致する要素を探す	driver.find_elements(By.XPATH,"abc")
link text	a要素のテキストが一致する要素を探す	driver.find_elements(By.LINK_TEXT,"abc")
partial link text	a要素のテキストが部分一致する要素を探す	driver.find_elements(By.PARTIAL_LINK_TEXT,"abc")
name	name属性が一致する要素を探す	driver.find_elements(By.NAME,"abc")
tag name	タグ名が一致する要素を探す	driver.find_elements(By.TAG_NAME,"abc")

【参考ドキュメント】
https://www.selenium.dev/ja/documentation/webdriver/elements/locators/#%E8%A6%81%E7%B4%A0%E9%81%B8%E6%8A%9E%E3%81%AE%E6%96%B9%E6%B3%95

この表は私が良く使う順に記載しています。
次から具体的に説明していきますが、コード例のidだけはfind_elementと最後の(s)がないことに注意してください。
これはidだけはページ内で1つというHTMLのルールがあるため、1つの要素が返却されることを意味しています。
ちなみに他のロケータにもfind_elementがありますが、先頭の1つの要素が取れるという仕様になっており、限られたケースでしか使用しないため、私は基本的にはid以外はfind_elementsと最後の(s)ありのメソッドを使用しています。

使用優先度１：ID指定による要素選択

ここからは具体例とともにそれぞれの要素選択方法のサンプルを記載していきます。
まずはID指定です。取得したい要素にid指定の属性があった場合、迷わずこれを使えば良いと思います。

サンプルコード

login_form = driver.find_element(By.ID, 'loginForm')

サンプルHTML

<html>
 <body>
  <form id="loginForm">
   <input name="username" type="text" />
   <input name="password" type="password" />
   <input name="continue" type="submit" value="Login" />
  </form>
 </body>
</html>

実行結果サンプル

login_form = driver.find_element(By.ID, 'loginForm')
print(login_form.tag_name)
# form が出力される

【参考ドキュメント】
https://selenium-python.readthedocs.io/locating-elements.html#locating-by-id

これで formタグの要素（element）が取得できます。id属性があれば最も簡単です。

使用優先度２：クラス名指定による要素選択

次はクラス名指定に要素選択方法です。
idがなくてもクラスが指定されているケースはよくあるので良く使用しています。
（普段使うのは find_elements メソッドですが、サンプルをわかりやすくするため find_element （sなし）メソッドを使っています。）

コードサンプル

content = driver.find_element(By.CLASS_NAME, 'content')

HTMLサンプル

<html>
 <body>
  <p class="content">Site content goes here.</p>
</body>
</html>

実行結果サンプル

content = driver.find_element(By.CLASS_NAME, 'content')
print(content.text)
# Site content goes here.

【参考ドキュメント】
https://selenium-python.readthedocs.io/locating-elements.html#locating-elements-by-class-name

クラス名に複数の指定がある場合

クラス名指定は結構便利ですが、1つ注意点があります。
クラス名はよく複数指定されるケースがあります。↓こんな場合、

<div class="content test">TEST</div>

こんな場合は、.（ドット）区切りで指定します。

content = driver.find_element(By.CLASS_NAME, 'content.test')

これで取得できるのですが、たまに取得出来ないケースがあるようです。
私の場合は、AWS Lambdaがこのケースで取得できず、結局次のCSSセレクタを使って取得しました。（ちなみにLambdaは、Python 3.7 Selenium 3.141でした）

使用優先度３：CSSセレクタ指定による要素選択

次にCSSセレクタです。
CSSに詳しい人なら迷わず使えますね。私もクラス名指定の所で書いたクラス名指定ができないケースがあるので、最近はこれを一番多用しています。

コードサンプル

content = driver.find_element(By.CSS_SELECTOR, 'p.content')

HTMLサンプル

<html>
 <body>
  <p class="content">Site content goes here.</p>
</body>
</html>

実行結果サンプル

content = driver.find_element(By.CSS_SELECTOR, 'p.content')
print(content.text)
# Site content goes here.

【参考ドキュメント】
https://selenium-python.readthedocs.io/locating-elements.html#locating-elements-by-css-selectors

クラス名にタブを.（ドット）区切りで指定というクラス名指定と同じようなシンプルな指定で使えるので簡単ですね。

クラス名の所で記載した複数のクラスが指定されていた場合の指定方法は以下になります。

# <div class="a b">text</div> の場合
find_element(By.CLASS_NAME, "a.b")# ←Lambda NG
find_element(By.CSS_SELECTOR, "div.a.b")# ←OK
find_element(By.XPATH, "//div[@class='a b']")# ←XPathのこれもOK

使用優先度４：XPath指定による要素選択

次はXPathによる指定です。
XPathは柔軟な指定ができるので、私はクラス名やCSSセレクタ指定で複数の要素が取得できてしまうケースで、敢えて1つのみの要素を指定したい場合とかに使用しています。

コードサンプル

login_form = driver.find_element(By.XPATH, "/html/body/form[1]")
login_form = driver.find_element(By.XPATH, "//form[1]")
login_form = driver.find_element(By.XPATH, "//form[@id='loginForm']")

HTMLサンプル

<html>
 <body>
  <form id="loginForm">
   <input name="username" type="text" />
   <input name="password" type="password" />
   <input name="continue" type="submit" value="Login" />
   <input name="continue" type="button" value="Clear" />
  </form>
</body>
</html>

実行結果サンプル

login_form = driver.find_element(By.XPATH, "/html/body/form[1]")
login_form = driver.find_element(By.XPATH, "//form[1]")
login_form = driver.find_element(By.XPATH, "//form[@id='loginForm']")
print(login_form.tag_name)
# form が出力される（どの指定方法でも同じ結果です）

【参考ドキュメント】

https://selenium-python.readthedocs.io/locating-elements.html#locating-by-xpath

3種類の指定方法をサンプルにしていますが、取得結果はどれも同じです。

htmlタグからの絶対パスで指定しています。直感的な指定が可能ですが、HTML構造が変わったら取得できなくなるので使用ケースは注意が必要です
formタグの1つ目という指定です。// を使用すること絶対パス指定が不要になります。
formタグ、かつ、id指定という指定の仕方です。2.のケースよりわかりやすく指定できますね。

使用優先度５：a要素テキスト指定による要素選択

次はa（アンカー）タグ内のテキスト指定する方法になります。
完全一致で指定する LINK_TEXT と部分一致で指定する PARTIAL_LINK_TEXT があります。

コードサンプル

continue_link = driver.find_element(By.LINK_TEXT, 'Continue')
continue_link = driver.find_element(By.PARTIAL_LINK_TEXT, 'Can')

HTMLサンプル

<html>
 <body>
  <p>Are you sure you want to do this?</p>
  <a href="continue.html">Continue</a>
  <a href="cancel.html">Cancel</a>
</body>
</html>

実行結果サンプル

continue_link = driver.find_element(By.LINK_TEXT, 'Continue')
print(continue_link.text)
# Continue
continue_link = driver.find_element(By.PARTIAL_LINK_TEXT, 'Can')
print(continue_link.text)
# Cancel

【参考ドキュメント】
https://selenium-python.readthedocs.io/locating-elements.html#locating-hyperlinks-by-link-text

この指定方法は、Web画面に表示されている文字をそのまま使えるので結構便利だったりします。ただ、最近のWebでアンカータグがどれだけあるのか、画面表示の文字は頻繁に変わらないか、と考えると使用ケースは限られるため、個人的に使用ケースがあまりないかなと思っています。

使用優先度６：name属性指定による要素選択

次はname属性による指定です。
先に紹介したクラス名指定とよく勘違いするのですが、こちらはname属性になります。

コードサンプル

username = driver.find_element(By.NAME, 'username')
password = driver.find_element(By.NAME, 'password')

HTMLサンプル

<html>
 <body>
  <form id="loginForm">
   <input name="username" type="text" />
   <input name="password" type="password" />
   <input name="continue" type="submit" value="Login" />
   <input name="continue" type="button" value="Clear" />
  </form>
</body>
</html>

実行結果サンプル

username = driver.find_element(By.NAME, 'username')
print(username.tag_name)
# input

【参考ドキュメント】
https://selenium-python.readthedocs.io/locating-elements.html#locating-by-name

この指定ケースも直感的でわかりやすいのですが、name属性が指定された要素がそんなにあるかな。。。という印象なので、どちらかというとクラス名指定を良く使っています。

使用優先度７：タグ名指定による要素選択

最後は、タグ名による指定です。
これはシンプルですね。タグ名をそのまま指定します。

コードサンプル

heading1 = driver.find_element(By.TAG_NAME, 'h1')

HTMLサンプル

<html>
 <body>
  <h1>Welcome</h1>
  <p>Site content goes here.</p>
</body>
</html>

実行結果サンプル

heading1 = driver.find_element(By.TAG_NAME, 'h1')
print(heading1.text)
# Welcome

【参考ドキュメント】
https://selenium-python.readthedocs.io/locating-elements.html#locating-by-name

使用方法はシンプルなのですが、タグの直接指定がそれほど使用ケースがない気がしているので最後の紹介になります。

補足～便利？コードサンプル～

ここからは私が個人的に良く使っているコードサンプルの紹介です。

要素取得判定

冒頭で記載した通り、私は find_elements（find_elementではなく）を多用しています。
そのため、要素が意図通り取得できたかを以下のように確認するメソッドを使って判定しています。

コードサンプル

# 要素取得判定関数
def element_check(element, target):
    if len(element) > 0:
        print(target + " 個数:" + str(len(element)))
        return True
    else:
        print(target + ":要素が見つかりません")
        return False

# 要素取得判定関数呼び出し例
elements = driver.find_elements(By.TAG_NAME, 'a')
if element_check(elements, 'a') :
    for element in elements:
        print(element.text)

要素に対する操作コードサンプル

要素を取得した後の操作は基本的には以下の操作と思っています。
これだけは覚えておけば基本的な操作はできるかなというものを記載しておきます。

テキスト取得
テキスト入力
テキストクリア
クリック

コードサンプル

element.text
element.send_keys("abc")
element.clear()
element.click()

ページのタイトルを取得する

各処理を始める前にまずタイトルを取得する場合、以下のコードで簡単に取得できます。

driver = webdriver.Chrome(CHROME_DRIVER,options=Options())
print(driver.title)

HTMLを表示する

意図した動作にならない場合など、実際のHTMLを確認したいケースがあると思います。その時は、以下のコードでHTMLを取得します。

driver = webdriver.Chrome(CHROME_DRIVER,options=Options())
print(driver.page_source.encode('UTF-8'))

スクリーンショットを保存する

Web画面の操作結果を保存する、意図した動作になっているか途中の画面遷移を保存する際に利用するのがスクリーンショットです。
seleniumu では簡単にスクリーンショットを取ることができます。

コードサンプル

# スクロールを含めて全画面のスクリーンショットを取得するためヘッドレスモードにする
options = Options()
options.add_argument('--headless')
driver = webdriver.Chrome(CHROME_DRIVER,options=options)

# 全画面のスクリーンショット取得
w = driver.execute_script('return document.body.scrollWidth')
h = driver.execute_script('return document.body.scrollHeight')
driver.set_window_size(w, h)
driver.save_screenshot("screenshot.png")

指定した要素部分のみの一部のスクリーンショットを保存する

上の例だと全画面表示になってしまうため、必要な要素部分だけ取得したい場合（例えば特定のframe内だけ取得したい場合）は事前に要素取得してから、スクリーンショットを保存します。

# スクロールを含めて全画面のスクリーンショットを取得するためヘッドレスモードにする
options = Options()
options.add_argument('--headless')
driver = webdriver.Chrome(CHROME_DRIVER,options=options)

# 一部要素の全画面スクリーンショット取得
w = driver.execute_script('return document.body.scrollWidth')
h = driver.execute_script('return document.body.scrollHeight')
driver.set_window_size(w, h)
# 取得したい要素を指定する（ID指定でなくても良い）
element = driver.find_element(By.ID, 'main-element')
png = element.screenshot_as_png
# 任意のファイル名を指定してpngファイルに保存
with open('ElementScreenshot.png', 'wb') as f:
    f.write(png)

ドライバーの自動更新

ドライバーのバージョンは自分が普段使用するブラウザのバージョンと一致しておく必要があるため、ブラウザのバージョンアップが定期的にあり、その度にドライバーのダウンロードが面倒という方は以下でドライバーのインストール含めて自動化できます。

# Webdriver ManagerでChromeDriverを取得
from webdriver_manager.chrome import ChromeDriverManager
# ChromeDriverManager().install()を指定して自動インストール
driver = webdriver.Chrome(ChromeDriverManager().install(),options=options)

ちなみにブラウザとドライバーのバージョンは不一致の場合、以下のエラーメッセージが出力され、処理が異常終了します。

selenium.common.exceptions.SessionNotCreatedException: Message: session not created: This version of ChromeDriver only supports Chrome version 104
Current browser version is 106.0.5249.119 with binary path C:\Program Files (x86)\Google\Chrome\Application\chrome.exe

逆引き参考ページ

以下はseleniumでやりたいことの目的別に逆引きができるサイトになります。

https://www.seleniumqref.com/api/webdriver_gyaku.html

属性ごとの取得方法まとめ

以下は属性ごとに指定方法がまとめられて非常に参考になるサイトになります。
XPathの使い方がうまい。

https://qiita.com/VA_nakatsu/items/0095755dc48ad7e86e2f

「Chrome の自動操作を一通り」

タイトルの通り、「Chrome の自動操作を一通り」まとめてくれているサイトになります。網羅的に書かれていて非常に参考になります。

https://qiita.com/memakura/items/20a02161fa7e18d8a693

まとめ

今回はPythonのSeleniumでWeb画面操作を自動化する基礎をまとめてみました。
自分なりによく使う辞書的な位置づけでまとめてみたので、同じような人の役に立てれば嬉しいです(^^)

gspreadライブラリを使ってPythonでGoogleスプレッドシートの操作（値追加・値取得・行追加・行削除）する

コメントを残す

概要〜Pythonでgspreadライブラリを公式ページにならってやってみてAWS LambdaでGoogleスプレッドシートに定期的に記録する〜

皆さん日々記録を取りたい時どこに記録をしていますか？
私はGoogleスプレッドシートを多用しています。
なぜなら、、、

Googleアカウントをもっていれば誰でも無料で使える
Webブラウザがあれば携帯、PC問わずアクセスできる
ちょっと修正したいなと思った時の修正がExcelと同じ操作感なので容易

などの理由からです。
日々自動化して記録をしたいことがあるのですが、その都度DBを用意して記録するのはそれなりに手間がかかるので私はGoogleスプレッドシートを使って日々の自動化処理を実行しています。
今回はその時に役に立つ、PythonからGoogleスプレッドシートに簡単にアクセスできるgspreadライブラリを調べたのでその整理内容になります。

出来るようになること

Googleスプレッドシートを開く
Googleスプレッドシートのシートを指定する
Googleスプレッドシートの値を取得する
Googleスプレッドシートに値を書き込む
Googleスプレッドシートに行を追加する／行を削除する

最終的なコードは以下になります。
これだけのコードでGoogleスプレッドシートに対する最低限の操作が出来るのでかなり簡単だったと思います。

import gspread
import json

#認証処理
gc  = gspread.service_account_from_dict('認証情報のJSON')

# ファイル名指定で開く
sh = gc.open('ファイル名')

# シート名指定
worksheet = sh.worksheet("シート名")

# A1等のラベル指定して値取得
val = worksheet.acell('B1').value

# ラベル指定して値を更新
worksheet.update('B1', 'Bingo!')

# 最終行に引数のリストの内容を1行追加
worksheet.append_row(['A','B','C'])

公式ページ

gspreadの公式ページは以下になります。

https://docs.gspread.org/en/latest/

前提条件

前提条件としてGoogleスプレッドシートにアクセスするための認証情報（JSONファイル）をGCPで取得する必要があります。（GCPを利用するのでGCPアカウントが必要になります）
今回はgspreadライブラリの説明をメインとした記事なのでこの部分は割愛しますが、以下のようなコードで取得した認証情報を使って認証処理を実装します。
gspreadライブラリを使えばたった3行です。簡単ですね。

import gspread
import json

#認証処理
gc  = gspread.service_account_from_dict('認証情報のJSON')

認証処理の更新ページURLは以下になります。
実装方法は上のサンプル以外にもあるので必要なら別の方法を確認してみてください。

https://docs.gspread.org/en/latest/oauth2.html

ワークブックを開く

それでは実際のGoogleスプレッドシートの操作の説明に移ります。
まず最初はGoogleスプレッドシートの操作するスプレッドシートを指定して開きます。
指定方法にはファイル名を指定、キーを指定、URLの指定の３つの方法があるので、扱い易い方法で開けばいいと思います。個人的にはファイル名指定が一番直感的に扱えるかなと思っています。

# ファイル名指定で開く
sh = gc.open('ファイル名')

# スプレッドシートのキー指定で開く
sh = gc.open_by_key('スプレッドシートキー')

# URL指定で開く
sh = gc.open_by_url('URL')

# スプレッドシートを取得したらスプレッドシートの内容を表示してみる
print(sh.title) #スプレッドシートのタイトルを表示する
print(sh.id) # スプレッドシートキーを表示する

ファイルを開く部分の公式ページは以下になります。

https://docs.gspread.org/en/latest/user-guide.html#opening-a-spreadsheet

シート選択

スプレッドシートが開けたら次はシートを選択します。
この辺りの操作間はExcel操作と一緒ですね。
こちらも複数の方法がありますが、基本的にはインデックスを指定するか、シート名を指定する方法になります。個人的にはこちらもシート名を指定する方法が直感的かなと思います。

# シートのインデックスを指定（先頭は0になります）
worksheet = sh.get_worksheet(0)

# シート名指定
worksheet = sh.worksheet("シート名")

# 先頭のシート指定（先頭のシートだけです。sheet2にしたところで2番目のシートは指定できません）
worksheet = sh.sheet1

# すべてのシートをリストで取得する
worksheet_list = sh.worksheets()

# シートを取得したらシートの内容を表示してみる
print(worksheet.title)  # シート名表示
print(worksheet.id) # シートID表示

公式ページは以下になります。

https://docs.gspread.org/en/latest/user-guide.html#selecting-a-worksheet

値取得

シートまで取得できたので、それではここから値を取得していきます。
A1等のラベル表記と1,2といった行と列番号を指定して取得する方法があります。
こちらはどちらの取得方法でも良いと思うので好みですかね。。。

# A1等のラベル指定して値取得
val = worksheet.acell('B1').value

# 行と列番号を指定して値取得（左：行番号、右：列番号）
val = worksheet.cell(1, 2).value

# 行番号の指定して1行の値をリストとして取得
values_list = worksheet.row_values(1)

# 列番号の指定して1列の値をリストとして取得
values_list = worksheet.col_values(1)

# 値を取得したら値の内容を表示してみる
print(val) # 値表示
print(values_list) # 取得したリストの値を表示

公式ページは以下になります。

https://docs.gspread.org/en/latest/user-guide.html#getting-a-cell-value

他にもシート全て値を取得する方法や行ごとに取得する方法が公式ページには記載されているので参照してみてください。

https://docs.gspread.org/en/latest/user-guide.html#getting-all-values-from-a-worksheet-as-a-list-of-lists

https://docs.gspread.org/en/latest/user-guide.html#getting-all-values-from-a-worksheet-as-a-list-of-dictionaries

値を更新

続いて値を更新していきます。
方法は値取得と同一になり、A1等のラベル表記と1,2といった行と列番号を指定して取得する方法があります。

# ラベル指定して値を更新
worksheet.update('B1', 'Bingo!')

# 行と列番号を指定して値更新
worksheet.update_cell(1, 2, 'Bingo!')

# 範囲を指定して値をまとめて更新
worksheet.update('A1:B2', [[1, 2], [3, 4]])

# 更新したら値の内容を表示してみる
print(worksheet.acell('B2').value) # 値表示

公式ページは以下になります。

https://docs.gspread.org/en/latest/user-guide.html#updating-cells

行操作

最後に行ごとに操作する方法の紹介になります。
実際スプレッドシートの更新は行ごとに行うことが多いと思うので、その時の操作方法になります。
方法としては、最終行に追加、指定行に追加、指定行の削除になります。
行を指定しての更新方法が見つからず私は指定行を削除後、指定行を追加することで行の更新を行っています。

# 最終行に引数のリストの内容を1行追加
worksheet.append_row(['A','B','C'])

# 指定行に引数のリストの内容を1行追加
worksheet.insert_row(['A','B','C'], 1)

# 指定行を削除
worksheet.delete_rows(2)

# 行を更新したら値の内容を表示してみる
values_list = worksheet.row_values(1)
print(values_list)

公式ページは以下になります。

https://docs.gspread.org/en/latest/api/models/worksheet.html#gspread.worksheet.Worksheet.append_row

https://docs.gspread.org/en/latest/api/models/worksheet.html#gspread.worksheet.Worksheet.insert_row

https://docs.gspread.org/en/latest/api/models/worksheet.html#gspread.worksheet.Worksheet.delete_row

まとめ

いかがだったでしょうか。
私はgspreadライブラリを使うことでかなり簡単にGoogleスプレッドシートの操作ができたと感じています。
私はこれをAWS Lambdaに実装し日々の記録を自動化しています。
機会があればLambdaへの実装方法を記事にしようと思いますが、ソースコードだけ参考に載せておきます。
認証情報をパラメータストアから取得するところがAWS Lambda特有の部分ですが、他は同じようにGoogleスプレッドシートの操作が可能です。

import gspread
import json
import boto3
import os

# パラメータストアに保存している認証情報のキー名を環境変数から取得
# PARAM_KEY = os.environ.get('●●●パラメータストアを取得する環境変数名を指定●●●')
# 私は環境変数として「PARAM_KEY」として設定
PARAM_KEY = os.environ.get('PARAM_KEY')

def lambda_handler(event, context):

    # パラメータストアに保存している認証情報（JSONファイルを取得）
    ssm = boto3.client('ssm')
    response = ssm.get_parameters(
        Names=[
            PARAM_KEY,
        ],
        WithDecryption=True
    )
    service_account_info = json.loads(response['Parameters'][0]['Value'])

    #認証処理
    gc  = gspread.service_account_from_dict(service_account_info)

    # ファイル名指定で開く
    sh = gc.open('●●●Googleスプレッドシートファイル名を指定●●●')

    # シート名指定
    worksheet = sh.worksheet("●●●操作するシート名を指定●●●")

    # A1等のラベル指定して値取得
    val = worksheet.acell('B1').value

    # ラベル指定して値を更新
    worksheet.update('B1', 'Bingo!')

    # 最終行に引数のリストの内容を1行追加
    worksheet.append_row(['A','B','C'])

Lambdaの環境変数に以下を設定

SystemsManagerのパラメータストアに以下を設定

AWS Lambda関連の記事は以下などを投稿しているので興味がある方はぜひ読んでみてください(^^)

１．AWS Lambda 入門～おすすめ本5冊の紹介～

２．AWS Lambda で Python プログラミング～Boto3 サンプル集S3編～

３．AWS Lambda SAMとは？～Cloud9でSAM Sampleを使ってPythonのLambdaプログラムを簡単にデプロイする～

これで日々の単調な作業から脱却します！

月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Pythonによるデータ分析のおすすめ書籍

まずは初心者向け

身に付くスキル

こんな人におすすめ

基礎を学んだら次は実際の仕事でどう使うかを学ぶ

身に付くスキル

こんな人におすすめ

統計学という学術的な面も踏まえて学ぶ

身に付くスキル

こんな人におすすめ

プロとしてもう1冊 分析の幅を広げる1冊

身に付くスキル

こんな人におすすめ

最後に機械学習や理論に発展させ知識を自分のものにする

身に付くスキル

こんな人におすすめ

まとめ

GPTsのおすすめ本3冊

はじめに

おすすめ本リスト

プログラム無しですぐ使えるChatGPTオススメ本リスト3選

1. 「GPTsでChatGPTを優秀な部下にしよう！」

2. 「ChatGPT GPTsが作れるようになる本」

3. 「ChatGPT 120%投資術」

生成AIをプログラムしたいエンジニア向けおすすめ本

1. 「Amazon Bedrock 生成AIアプリ開発入門 ［AWS深掘りガイド］」

2. 「ChatGPT/LangChainによるチャットシステム構築［実践］入門」

3. 「つくりながら学ぶ！生成AIアプリ＆エージェント開発入門」

内容紹介

1. 「GPTsでChatGPTを優秀な部下にしよう！」

2. 「ChatGPT GPTsが作れるようになる本」

3. 「ChatGPT 120%投資術」

3. 「つくりながら学ぶ！生成AIアプリ＆エージェント開発入門」

まとめ

概要～個人的によく使うLambda(Python Boto3)のサンプル集～

公式APIリファレンス

S3サンプル

S3ファイルダウンロード

S3ファイルアップロード

S3ファイルダウンロード（メモリ上で扱う場合）

S3ファイルのリスト表示

S3事前署名付きURL発行

参考

概要～Pythonのseleniumを使って値取得／値入力／クリック／スクリーンショット等、画面操作を自動化する～

対象読者

出来るようになること

事前準備

事前準備１～ブラウザのドライバをダウンロード～

chromeドライバー

Edge ドライバー

事前準備２～seleniumのインストール～

補足～Google Colaboratoryでのselenium実行～

ページを開く

要素を探す

要素の選択（指定）

使用優先度１：ID指定による要素選択

使用優先度２：クラス名指定による要素選択

クラス名に複数の指定がある場合

使用優先度３：CSSセレクタ指定による要素選択

使用優先度４：XPath指定による要素選択

使用優先度５：a要素テキスト指定による要素選択

使用優先度６：name属性指定による要素選択

使用優先度７：タグ名指定による要素選択

補足～便利？コードサンプル～

要素取得判定

要素に対する操作コードサンプル

ページのタイトルを取得する

HTMLを表示する

スクリーンショットを保存する

指定した要素部分のみの一部のスクリーンショットを保存する

ドライバーの自動更新

逆引き参考ページ

属性ごとの取得方法まとめ

「Chrome の自動操作を一通り」

まとめ

概要〜Pythonでgspreadライブラリを公式ページにならってやってみてAWS LambdaでGoogleスプレッドシートに定期的に記録する〜

出来るようになること

公式ページ

前提条件

ワークブックを開く

プロとしてもう1冊分析の幅を広げる1冊

1. 「Amazon Bedrock 生成AIアプリ開発入門［AWS深掘りガイド］」