Удалить символы HTML из загрузки Excel в элементы Exact Online

У меня есть таблица с элементами для загрузки в Exact Online. Многие из этих пунктов все еще имеют описания статей, содержащие много HTML, такие как:

<p><span style=""font-size: 12px""><span style=""font-family: verdana, geneva, sans-serif"">text<br />
text&nbsp;max&nbsp;text<br />
text</span></span></p>

Я пытался заменить все вхождения вручную и с помощью Excel найти / заменить, но это касается тысяч статей.

Есть ли возможность использовать Invantive SQL для удаления этих специальных символов и получения простого текста?

1 ответ

Решение

Лучший способ справиться с таким сценарием - определить диапазон Excel как именованный диапазон или как таблицу Excel.

Давайте предположим, что диапазон Excel называется "MYDATA".

Тогда в Invantive SQL вы можете ввести:

select xmldecode /* Replace &amp; by & etc. */
       ( replace /* Remove line feeds for exact online when not desired. */
         ( regexp_replace /* Remove all other XML/HTML tags. */
           ( regexp_replace /* Replace line break in HTML by a line feed. */
             ( COLUMN
             , '<br/>'
             , chr(10)
             )
           , '<[^>]*>'
           , ''
           )
         , chr(10)
         , ' '
         )
       )
from   MYDATA@ic

И, конечно, вы можете сделать:

insert into exactonlinerest..items(columns) select ... -- see above
Другие вопросы по тегам