ビジネスパーソン・ガジェット置場 empty lot for business

営業や仕事、それに伴う生活を便利に楽にするツール、ガジェットを作ります。既にあるツールも自分用にカスタマイズ。

python:正規表現で文字列をスプリットする

備忘録です。

pythonで文字列をスプリットしようとしていたのですが、スプリットに使いたい文字が複数あったので正規表現のスプリットを使った話です。

正規表現のスプリット

通常のスプリットは区切り文字に完全一致した場合に分割されるようです。

というより、今回は、下記の文字列たちのようにいろんなパターンの区切り文字が使ってありその都度スプリットの区切り文字を入れ替えるわけにもいかないので、同時に複数の区切り文字を設定したいという状況でした。

このような状況で正規表現なら一発でかけます!

 

与えられるテキスト

text = "Hello world"、スペース区切り

text = "Hello.world"、ピリオド区切り

text = "Hello,world"、カンマ区切り

 

import re

re.split('[ ,.]', text)

#> ['Hello', 'World']
#> ['Hello', 'World']
#> ['Hello', 'World']