Извлечение курсивного текста из документа

У меня есть текстовый документ со списком названий видов, а затем различные тексты о каждом виде. Я хотел бы просто извлечь все названия видов. Очевидный способ сделать это - просто выделить весь текст курсивом. Тем не менее, я не могу найти способ сделать это в Python, у кого-нибудь есть идеи?

Например, ввод: Acanthognathus rudis Мелкая добыча Одиночная - 1? 1? Вербовка: одиночная, часто вылавливаемая коллембола и другая мелкая добыча (GRONENBERG & al. 1998). Размер: маленький, может быть получен одним Acromyrmex coronatus

выход: Acanthognathus rudis, Acromyrmex coronatus

0 ответов

Другие вопросы по тегам