除了之前提到的匹配和替换操作,Scala中正则表达式还有以下应用场景:
数据验证
- 验证邮箱格式:可以使用正则表达式验证用户输入的邮箱是否符合格式要求。
scala
val emailRegex: Regex = """^[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+$""".r
val email1 = "example@example.com"
val email2 = "invalid_email"
if (emailRegex.findFirstIn(email1).isDefined) {
println(s"$email1是有效的邮箱格式")
} else {
println(s"$email1是无效的邮箱格式")
}
if (emailRegex.findFirstIn(email2).isDefined) {
println(s"$email2是有效的邮箱格式")
} else {
println(s"$email2是无效的邮箱格式")
}
- 验证手机号码格式:不同国家有不同的手机号码格式,以中国手机号码为例(1开头,后面是10位数字)。
scala
val phoneRegex: Regex = """^1\d{10}$""".r
val phone1 = "13812345678"
val phone2 = "234567890"
if (phoneRegex.findFirstIn(phone1).isDefined) {
println(s"$phone1是有效的手机号码格式")
} else {
println(s"$phone1是无效的手机号码格式")
}
if (phoneRegex.findFirstIn(phone2).isDefined) {
println(s"$phone2是有效的手机号码格式")
} else {
println(s"$phone2是无效的手机号码格式")
}
文本提取
- 从网页中提取链接:假设一个网页文本包含多个超链接,可以使用正则表达式提取这些链接。
scala
val htmlText = """<a href="https://example.com">Link1</a><a href="https://another.com">Link2</a>"""
val linkRegex: Regex = """<a href="([^"]+)">""".r
val links = linkRegex.findAllMatchIn(htmlText).map(_.group(1))
links.foreach(println)
分割文本
- 按特定模式分割句子:例如,按标点符号和空白字符分割一个句子。
scala
val sentence = "Hello, world! How are you?"
val splitRegex: Regex = """[.,!?\s]+""".r
val words = splitRegex.split(sentence)
words.foreach(println)