Как получить цвет шрифта из фрагмента исходного кода HTML?

У меня есть кусок исходного кода HTML, как это:

<FONT color=#5a6571>Beverly Mitchell</FONT> <FONT color=#5a6571>Shawnee Smith</FONT> <FONT color=#5a6571>Glenn Plummer</FONT> <NOBR>more &gt;&gt;</NOBR>

Я попытался получить значение "цвет", как это:

MSHTML::IHTMLDocument2Ptr htmDoc1 = NULL;
SAFEARRAY *psaStrings1 = SafeArrayCreateVector(VT_VARIANT, 0, 1);
CoCreateInstance(CLSID_HTMLDocument, NULL, CLSCTX_INPROC_SERVER, IID_IHTMLDocument2, (void**) &htmDoc1);

VARIANT *param1 = NULL;
HRESULT hr = SafeArrayAccessData(psaStrings1, (LPVOID*)&param1);
param1->vt = VT_BSTR;
param1->bstrVal = SysAllocString(varSrc1.bstrVal);

hr = SafeArrayUnaccessData(psaStrings1);
hr = htmDoc1->write(psaStrings1);

MSHTML::IHTMLElementPtr pElemBody1 = NULL;
MSHTML::IHTMLDOMNodePtr pHTMLBodyDOMNode1 =NULL;

hr = htmDoc1->get_body(&pElemBody1);
if(SUCCEEDED(hr))
{
    hr = pElemBody1->QueryInterface(IID_IHTMLDOMNode,(void**)&pHTMLBodyDOMNode1);
    if(SUCCEEDED(hr))
    {
        ProcessDomNodeSmartWrapper(pHTMLBodyDOMNode1, ProcTgtTagStrVec);
    }
}    

long lLength = 0;
MSHTML::IHTMLElementCollectionPtr pElemColl1 = NULL;
MSHTML::IHTMLElementPtr pChElem1 = NULL;
MSHTML::IHTMLStylePtr pStyle1 = NULL;
IDispatchPtr ppvdisp1 = NULL;

hr = htmDoc1->get_all(&pElemColl1);
hr = pElemColl1->get_length(&lLength);
for(long i = 0; i < lLength; i++)
{
    _variant_t name(i);
    _variant_t index(i);

    ppvdisp1 = pElemColl1->item(name, index);
    if(ppvdisp1 && SUCCEEDED(hr))
    {
        hr = ppvdisp1->QueryInterface(IID_IHTMLElement, (void **)&pChElem1);

        if(pChElem1 && SUCCEEDED(hr))
        {
            BSTR bstrTagName = NULL;

            pChElem1->get_tagName(&bstrTagName);
            hr = pChElem1->get_style(&pStyle1);
            if(pStyle1 && SUCCEEDED(hr))
            {
                _variant_t varFtCol;

                hr = pStyle1->get_color(&varFtCol);
                if(hr = S_OK && varFtCol)
                {
                    hmStyles1[wstring(varFtCol.bstrVal)] = L"FontColor";
                }
            }
            if(bstrTagName)
               SysFreeString(bstrTagName);
        } // if pStyle && SUCCEEDED(hr)
    }//if ppvdisp && SUCCEEDED(hr)
}//for

Но я никогда не смогу получить значение "цвет" - varFtCol.bstrVal плохой указатель, когда я отлаживаю программу. Это то, что varFtCol показал, когда я отлаживаю программу:

- varFtCol {???} _variant_t
- tagVARIANT BSTR = 0x00000000 tagVARIANT
        Вт 8 без знака короткого
-       BSTR    0x00000000     wchar_t *
            CXX0030: Ошибка: выражение не может быть оценено

#5a6571 шестнадцатеричный цвет представляет для значения RGB (90,101,113).

Как я могу получить эту информацию о цвете?

2 ответа

Решение

Вы не должны получать стиль на pChElem1, потому что цвет не является частью стиля в вашем случае. Цвет является частью элемента Font.

Вместо этого вы должны вызвать pChElem1->getAttribute("color" . . .)

Это вернется #5a6571

Следующий код находится в MFC. Но вы можете легко конвертировать в обычный Win32, если вы не используете MFC.

COLORREF GetColorFromHexString( CString szColor )
{
    TCHAR *szScan;
    CString strTemp;
    CString strColor = szColor;
    long lRR = 0,lGG = 0,lBB = 0;

    //first we will remove # characters which come from XML document
    strColor.TrimLeft(_T('#'));
    strColor.TrimRight(_T('#'));

    //it should be of the form RRGGBB
    if (strColor.GetLength() == 6) {
        //get red color, from the hexadecimal string
        strTemp = strColor.Left(2);
        lRR = _tcstol(LPCTSTR(strTemp),&szScan,16);

        //get green color
        strTemp = strColor.Mid(2,2);
        lGG = _tcstol(LPCTSTR(strTemp),&szScan,16);

        //get blue color
        strTemp = strColor.Right(2);
        lBB = _tcstol(LPCTSTR(strTemp),&szScan,16);
    }


    return RGB(lRR,lGG,lBB);
}

Согласно документации MSDN, IHTMLStyle::get_color может возвращать BSTR или целочисленное значение в варианте. Вы пытались присвоить varFtCol целочисленное значение и проверить этот результат?

const int colorValue = static_cast<int>(varFtCol);

В качестве рекомендации при работе с _variant_t обычно лучше использовать встроенные операторы приведения, чем прямой доступ к членам самого объединения.

Другие вопросы по тегам