Библиотеки Python - Разделение цитирования публикации

У меня есть куча цитатных строк, которые я хочу разделить на одну цитату. Вот пример, который я нашел на сайте цитирования OWL. У меня есть комбинации типов цитирования MLA, APA и т. Д. Есть ли библиотека Python или другое приложение, которое может разбить эти строки на элементы в списке. Я старался избегать регулярных выражений из-за разнообразия типов цитирования, а также пытался разбивать по '/n', однако некоторые мои строки не имеют разделителей '/ n'... так что вы можете увидеть проблему. Мне интересно, есть ли лучший способ для захвата. Я не ищу записи имени, даты, названия... нашел библиотеку, которая делает это... Мне просто нужно разделить строки. Любая помощь могла бы быть полезна!!!! Спасибо!!

Строка ввода - образец

Dean, Cornelia. "Executive on a Mission: Saving the Planet." The New York Times, 22 May 2007, www.nytimes.com/2007/05/22/science/earth/22ander.html?_r=0. Accessed 12 May 2016.

Ebert, Roger. Review of An Inconvenient Truth, directed by Davis Guggenheim. rogerebert.com, 1 June 2006, www.rogerebert.com/reviews/an-inconvenient-truth-2006. Accessed 15 June 2016.

Выход - образец

['Dean, Cornelia. "Executive on a Mission: Saving the Planet." The New York Times, 22 May 2007, www.nytimes.com/2007/05/22/science/earth/22ander.html?_r=0. Accessed 12 May 2016.',
'Ebert, Roger. Review of An Inconvenient Truth, directed by Davis Guggenheim. rogerebert.com, 1 June 2006, www.rogerebert.com/reviews/an-inconvenient-truth-2006. Accessed 15 June 2016.']

2 ответа

Если вы хотите разбить строку s переводчиком новой строки \n Вы можете использовать метод строки splitlines() с listcomp для фильтрации пустых элементов:

[i for i in s.splitlines() if i]

Пытаться split а затем удалите пустые элементы с filter:

string = '''Dean, Cornelia. "Executive on a Mission: Saving the Planet." The New York Times, 22 May 2007, www.nytimes.com/2007/05/22/science/earth/22ander.html?_r=0. Accessed 12 May 2016.

Ebert, Roger. Review of An Inconvenient Truth, directed by Davis Guggenheim. rogerebert.com, 1 June 2006, www.rogerebert.com/reviews/an-inconvenient-truth-2006. Accessed 15 June 2016.'''

result = list(filter(None, string.split('\n')))

Выход:

['Dean, Cornelia. "Executive on a Mission: Saving the Planet." The New York Times, 22 May 2007, www.nytimes.com/2007/05/22/science/earth/22ander.html?_r=0. Accessed 12 May 2016.', 'Ebert, Roger. Review of An Inconvenient Truth, directed by Davis Guggenheim. rogerebert.com, 1 June 2006, www.rogerebert.com/reviews/an-inconvenient-truth-2006. Accessed 15 June 2016.']
Другие вопросы по тегам