Excel VBAを使用した教育関連サイトからの情報抽出方法

この記事では、Excel VBAを使用して教育関連サイトからコースやプログラムの情報を抽出する方法について詳しく説明します。VBAの##処理についての基本的なコードから、その詳細な解説、さらに実際の応用例までを取り上げます。

目次

Excel VBAの基本

Excel VBA(Visual Basic for Applications)は、Microsoft Excelに組み込まれたプログラミング言語です。これを用いると、単純作業の自動化だけでなく、高度なデータ分析やレポート作成も可能になります。

そもそも、どこにVBAコードを書いて、どう実行すれば良いのか分からない場合は、以下の記事をご参照ください。

##処理の基本

##処理はExcel VBAで頻繁に使われる技術の一つです。特定の条件を満たすときに、特定の処理を実行するというのがその主な目的です。


Sub GetCourseInfo()
    Dim IE As Object
    Dim htmlElement As Object
    Dim i As Integer
    
    Set IE = CreateObject("InternetExplorer.Application")
    IE.Visible = True
    IE.Navigate "https://example-education-site.com/courses"
    
    Do While IE.Busy Or IE.ReadyState <> 4
        DoEvents
    Loop
    i = 1
    For Each htmlElement In IE.document.getElementsByTagName("h2")
        ThisWorkbook.Sheets("Sheet1").Cells(i, 1).Value = htmlElement.innerText
        i = i + 1
    Next htmlElement
    IE.Quit
End Sub

コードの詳細解説

このコードは、Internet Explorerを使用して教育関連のウェブサイトにアクセスし、そこからコースの情報を取得してExcelのシートに書き込むものです。

– `IE As Object` でInternet Explorerを操作するためのオブジェクトを定義します。
– `IE.Navigate` で指定したURLに移動します。
– `Do While` はページの読み込みが完了するまで待機します。
– `getElementsByTagName(“h2”)` はページ内のh2タグ(おそらくコースのタイトルが記載されている)をすべて取得し、それをExcelのシートに書き込んでいます。

応用例

応用例1: 複数の情報を取得する

コースの名前だけでなく、講師の名前や日程など、複数の情報を一度に取得する場合。


Sub GetCourseDetails()
    ' ...前の部分は同じ...
    
    i = 1
    For Each htmlElement In IE.document.getElementsByClassName("course")
        ThisWorkbook.Sheets("Sheet1").Cells(i, 1).Value = htmlElement.Children(0).innerText ' コース名
        ThisWorkbook.Sheets("Sheet1").Cells(i, 2).Value = htmlElement.Children(1).innerText ' 講師名
        ThisWorkbook.Sheets("Sheet1").Cells(i, 3).Value = htmlElement.Children(2).innerText ' 日程
        i = i + 1
    Next htmlElement

    ' ...後の部分は同じ...
End Sub

応用例2: 画像をダウンロードする

コースに関連する画像も一緒にダウンロードしたい場合。


Sub DownloadCourseImage()
    ' ...前の部分は同じ...

    Dim imgURL As String
    i = 1
    For Each htmlElement In IE.document.getElementsByClassName("course-image")
        imgURL = htmlElement.getAttribute("src")
        ThisWorkbook.Sheets("Sheet1").Pictures.Insert(imgURL).Select
        i = i + 1
    Next htmlElement

    ' ...後の部分は同じ...
End Sub

応用例3: 特定のキーワードが含まれるコースだけを取得する

例えば、「初心者向け」というキーワードが含まれるコースだけを抽出したい場合。


Sub GetBeginnerCourses()
    ' ...前の部分は同じ...

    i = 1
    For Each htmlElement In IE.document.getElementsByClassName("course")
        If InStr(htmlElement.innerText, "初心者向け") > 0 Then
            ThisWorkbook.Sheets("Sheet1").Cells(i, 1).Value = htmlElement.Children(0).innerText
            i = i + 1
        End If
    Next htmlElement

    ' ...後の部分は同じ...
End Sub

まとめ

Excel VBAを利用してウェブサイトから情報を抽出する方法は、多岐にわたります。この記事で紹介した方法や応用例を基に、様々な情報の収集や処理が可能です。VBAの学習や実際の業務での活用を通じて、より高度なデータ解析や業務効率化を実現してください。

VBAも良いけどパワークエリも良い

VBAの解説をしてきましたが、VBAは正直煩雑でメンテナンス性が悪いです。最近はモダンExcelと呼ばれるパワークエリやパワーピボットへのシフトが進んできています。本サイトでもパワークエリの特集をしており、サンプルデータを含む全11回の学習コンテンツでパワークエリを習得することができます。

クリックするとパワークエリの全11講座が表示されます。

パワーピボットの記事はありません。興味がある場合は、書籍で学んでみてください

コメント

コメントする

目次