この記事では、Pythonプログラミング言語で使用される`re`モジュールの基本的な使用方法について解説します。正規表現は、テキストデータを効率よく処理するために非常に有用です。具体的なコード例とその解説、応用例を含めて説明します。
目次
reモジュールとは
`re`モジュールはPython標準ライブラリの一部で、正規表現を扱うためのものです。テキストデータの検索、置換、分割などの操作を行えます。
reモジュールのインポート
`re`モジュールを使用するには、まず以下のようにインポートします。
import re
基本的な使用方法
正規表現を用いたテキストの検索や置換は、主に以下の関数を使って行います。
re.search()
この関数は、テキスト中に指定した正規表現が存在するか調べます。
# re.search() の例
text = "Python is awesome."
result = re.search("Python", text)
if result:
print("マッチした")
else:
print("マッチしなかった")
re.findall()
この関数は、テキスト中から指定した正規表現に一致するすべての文字列をリストとして返します。
# re.findall() の例
text = "I have 3 cats and 4 dogs."
result = re.findall("\\d", text)
print(result) # ['3', '4']
応用例
応用例1: 電話番号の抽出
文章から電話番号を抽出する例を考えてみましょう。
# 電話番号を抽出する例
text = "私の電話番号は080-1234-5678です。"
pattern = "\\d{2,4}-\\d{2,4}-\\d{4}"
result = re.search(pattern, text)
if result:
print(f"電話番号: {result.group()}")
応用例2: HTMLタグの除去
HTMLからタグを除去する操作も、`re`モジュールを使って簡単に行えます。
# HTMLタグを除去する例
html_content = "Title
"
pattern = "<.*?>"
result = re.sub(pattern, "", html_content)
print(result) # Title
まとめ
Pythonの`re`モジュールは、正規表現を使ってテキスト処理を行う際に非常に便利です。基本的な使用方法から応用例まで、この機能を使いこなすことで、より高度なテキスト処理が可能になります。
コメント