Проверка электронной почты для экзотических персонажей

Кажется, что проверка электронной почты в Grails просто применяет простое регулярное выражение. Несмотря на то, что он проверяет большинство писем, некоторые экзотические, но авторизованные символы могут проваливать проверку.

Например, немецкий символ ß используется в некоторых адресах электронной почты, но не пройдет проверку Grail:

package com.stuff.user.AppUser

import grails.test.mixin.Mock
import spock.lang.Specification

/**
 * Created by hschoonjans on 21/03/2016.
 */
@Mock(AppUser)
class AppUserSpec extends Specification {

    def "It doesn't validate an email with an eszett"() {
        given:
        AppUser user = new AppUser(email: "helainß@hotmail.com")

        expect:
        !user.validate(["email"])
    }
}

Используя пользовательское регулярное выражение для проверки, авторизация ß будет тривиальной, но что если пользователь попытается использовать другой экзотический, но действительный символ в своем почтовом адресе?

Чтобы избежать этой проблемы, я хотел бы знать, что существует универсальный валидатор адресов электронной почты Java/Groovy/Grails. Класс / регулярное выражение, которое будет проверять любой действительный адрес электронной почты, умнее, чем текущая проверка электронной почты Grails.

1 ответ

Я сталкивался с этим несколько раз в моих собственных проектах Grails, и у меня был довольно хороший успех с использованием этого RegEx:

/^((([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+(\.([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+)*)|((\x22)((((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(([\x01-\x08\x0b\x0c\x0e-\x1f\x7f]|\x21|[\x23-\x5b]|[\x5d-\x7e]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(\\([\x01-\x09\x0b\x0c\x0d-\x7f]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF]))))*(((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(\x22)))@((([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.)+(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.?$/i
Другие вопросы по тегам