Преобразование из строки в строку приводит к потере кодировки

Переменная filepath который является string содержит значение Música, У меня есть следующий код:

wstring fp(filepath.length(), L' ');
copy(filepath.begin(), filepath.end(), fp.begin());

fp затем содержит значение M?sica, Как мне конвертировать filepath в fp без потери кодировки для символа ú?

2 ответа

Решение

Используйте функцию MultiByteToWideChar.

Образец кода:

std::string toStdString(const std::wstring& s, UINT32 codePage)
{
    unsigned int bufferSize = (unsigned int)s.length()+1;
    char* pBuffer = new char[bufferSize];
    memset(pBuffer, 0, bufferSize);
    WideCharToMultiByte(codePage, 0, s.c_str(), (int)s.length(), pBuffer, bufferSize, NULL, NULL);
    std::string retVal = pBuffer;
    delete[] pBuffer;
    return retVal;
}

std::wstring toStdWString(const std::string& s, UINT32 codePage)
{
    unsigned int bufferSize = (unsigned int)s.length()+1;
    WCHAR* pBuffer = new WCHAR[bufferSize];
    memset(pBuffer, 0, bufferSize*sizeof(WCHAR));
    MultiByteToWideChar(codePage, 0, s.c_str(), (int)s.length(), pBuffer, bufferSize);
    std::wstring retVal = pBuffer;
    delete[] pBuffer;
    return retVal;
}

Поскольку вы используете MFC, у вас есть доступ к макросам преобразования строк ATL.

Это значительно упрощает преобразование по сравнению с использованием MultiByteToWideChar, При условии, что filepath закодирован в кодовой странице вашей системы по умолчанию, это должно сработать:

CA2W wideFilepath(filepath.c_str());
wstring fp(static_cast<const wchar_t*>(wideFilepath));

Если filepath отсутствует в кодовой странице вашей системы по умолчанию (скажем, в UTF-8), тогда вы можете указать кодировку для преобразования:

CA2W wideFilepath(filepath.c_str(), CP_UTF8);
wstring fp(static_cast<const wchar_t*>(wideFilepath));

Чтобы преобразовать другой способ, из std::wstring в std::string, вы бы сделали это:

// Convert from wide (UTF-16) to UTF-8
CW2A utf8Filepath(fp.c_str(), CP_UTF8);
string utf8Fp(static_cast<const char*>(utf8Filepath));

// Or, convert from wide (UTF-16) to your system's default code page.
CW2A narrowFilepath(fp.c_str(), CP_UTF8);
string narrowFp(static_cast<const char*>(narrowFilepath));
Другие вопросы по тегам