Библиотеки Python - Разделение цитирования публикации
У меня есть куча цитатных строк, которые я хочу разделить на одну цитату. Вот пример, который я нашел на сайте цитирования OWL. У меня есть комбинации типов цитирования MLA, APA и т. Д. Есть ли библиотека Python или другое приложение, которое может разбить эти строки на элементы в списке. Я старался избегать регулярных выражений из-за разнообразия типов цитирования, а также пытался разбивать по '/n', однако некоторые мои строки не имеют разделителей '/ n'... так что вы можете увидеть проблему. Мне интересно, есть ли лучший способ для захвата. Я не ищу записи имени, даты, названия... нашел библиотеку, которая делает это... Мне просто нужно разделить строки. Любая помощь могла бы быть полезна!!!! Спасибо!!
Строка ввода - образец
Dean, Cornelia. "Executive on a Mission: Saving the Planet." The New York Times, 22 May 2007, www.nytimes.com/2007/05/22/science/earth/22ander.html?_r=0. Accessed 12 May 2016.
Ebert, Roger. Review of An Inconvenient Truth, directed by Davis Guggenheim. rogerebert.com, 1 June 2006, www.rogerebert.com/reviews/an-inconvenient-truth-2006. Accessed 15 June 2016.
Выход - образец
['Dean, Cornelia. "Executive on a Mission: Saving the Planet." The New York Times, 22 May 2007, www.nytimes.com/2007/05/22/science/earth/22ander.html?_r=0. Accessed 12 May 2016.',
'Ebert, Roger. Review of An Inconvenient Truth, directed by Davis Guggenheim. rogerebert.com, 1 June 2006, www.rogerebert.com/reviews/an-inconvenient-truth-2006. Accessed 15 June 2016.']
2 ответа
Если вы хотите разбить строку s
переводчиком новой строки \n
Вы можете использовать метод строки splitlines()
с listcomp для фильтрации пустых элементов:
[i for i in s.splitlines() if i]
Пытаться split
а затем удалите пустые элементы с filter
:
string = '''Dean, Cornelia. "Executive on a Mission: Saving the Planet." The New York Times, 22 May 2007, www.nytimes.com/2007/05/22/science/earth/22ander.html?_r=0. Accessed 12 May 2016.
Ebert, Roger. Review of An Inconvenient Truth, directed by Davis Guggenheim. rogerebert.com, 1 June 2006, www.rogerebert.com/reviews/an-inconvenient-truth-2006. Accessed 15 June 2016.'''
result = list(filter(None, string.split('\n')))
Выход:
['Dean, Cornelia. "Executive on a Mission: Saving the Planet." The New York Times, 22 May 2007, www.nytimes.com/2007/05/22/science/earth/22ander.html?_r=0. Accessed 12 May 2016.', 'Ebert, Roger. Review of An Inconvenient Truth, directed by Davis Guggenheim. rogerebert.com, 1 June 2006, www.rogerebert.com/reviews/an-inconvenient-truth-2006. Accessed 15 June 2016.']