Регулярное выражение для извлечения данных в скобках

У меня есть набор данных из примерно 3000 строк в openoffice, каждый набор МОЖЕТ содержать данные в параграфе (XXXv), где XXX может быть любым 3-значным числом (обычно 110, 220, 115, 120)

Мне нужно просто игнорировать все остальное в этом поле и найти / заменить только значение.

Другие данные могут существовать в данных. большинство данных в формате HTML, в настоящее время в CSV-файле. Некоторые поля также могут не содержать значения.

EX: ITEM NUMBER 38 (115v) - (SKU)
(simplified, many will be 100-1000 characters in length, in html)

= ЕСЛИ заявления могут также работать?

2 ответа

Решение

На первый взгляд, регулярное выражение кажется лучшим способом. Регулярное выражение должно быть что-то вроде .*\(([0-9][0-9][0-9])v\).*, Захваченная группа будет значением, которое вы ищете.

Используйте это регулярное выражение для замены (?<=\()\d{3}(?=v\))если ваш движок регулярных выражений не знает о себе, используйте =\(\d{3}v\) с заменой (valuev)

Другие вопросы по тегам