Какой тип кодирования используется?
В настоящее время я делаю программу, в которой одной из ее функций является извлечение HTML-части составного электронного письма.
Я выполнил эту задачу хорошо, однако есть некоторые кодировки для некоторых символов, которые я не могу понять, например,
',' into '=2C'
';' into '=3B'
'=' into '=3D'
и это также ставит случайные '=' повсюду.
Кто-нибудь знает, есть ли для этого декодер (или даже как его зовут)? Я заменил несколько вещей на код, но, возможно, есть еще много, чего мне не хватает, потому что я с ними еще не сталкивался. Таким образом, я хотел бы либо выяснить тип кодировки, чтобы я мог заменить все, либо найти библиотеку, которая уже сделала это.
Ps Я отправляю письмо от учетной записи Hotmail, если это может быть причиной.
2 ответа
Это называется цитируемой для печати кодировкой.
К сожалению, существующий QuotedPrintableStream от Microsoft является внутренним, так что вы не можете его использовать. Однако вы можете взять один из проекта Mono или любой библиотеки, связанной с обработкой MIME.
Это кодировка для печати в кавычках, это объясняется в этом RFC. Позвольте мне предупредить вас, прежде чем тратить слишком много времени на свою задачу. Парсинг электронных писем может превратиться в настоящую головную боль, поэтому не стоит делать это самостоятельно. попробуйте эту бесплатную библиотеку, это лучшая, которую я когда-либо видел (и я видел много из них) http://www.lumisoft.ee/lswww/download/downloads/Net/