Извлечение курсивного текста из документа
У меня есть текстовый документ со списком названий видов, а затем различные тексты о каждом виде. Я хотел бы просто извлечь все названия видов. Очевидный способ сделать это - просто выделить весь текст курсивом. Тем не менее, я не могу найти способ сделать это в Python, у кого-нибудь есть идеи?
Например, ввод: Acanthognathus rudis Мелкая добыча Одиночная - 1? 1? Вербовка: одиночная, часто вылавливаемая коллембола и другая мелкая добыча (GRONENBERG & al. 1998). Размер: маленький, может быть получен одним Acromyrmex coronatus
выход: Acanthognathus rudis, Acromyrmex coronatus