Как получить уникальные результаты поиска?
Я использую этот ( https://github.com/thibauts/duckduckgo) модуль для очистки результатов поиска duckduckgo:
>>> import duckduckgo
>>> for links in duckduckgo.search('Yellow Chris Martin',max_results=20):
... print links
В выводе я получаю результаты поиска и, кажется,
повторение 4 раза по одной и той же ссылке
Выход:
http://www.youtube.com/watch?v=ZTEKsbLl64w
http://www.youtube.com/watch?v=ZTEKsbLl64w
http://www.youtube.com/watch?v=ZTEKsbLl64w
http://www.youtube.com/watch?v=ZTEKsbLl64w
https://en.wikipedia.org/wiki/Yellow_(Coldplay_song)
https://en.wikipedia.org/wiki/Yellow_(Coldplay_song)
https://en.wikipedia.org/wiki/Yellow_(Coldplay_song)
https://en.wikipedia.org/wiki/Yellow_(Coldplay_song)
http://www.youtube.com/watch?v=1MwjX4dG72s
http://www.youtube.com/watch?v=1MwjX4dG72s
http://www.youtube.com/watch?v=1MwjX4dG72s
http://www.youtube.com/watch?v=1MwjX4dG72s
Как это исправить и получить те же результаты, что и при использовании поисковой системы.
1 ответ
Решение
Вы можете использовать преобразование объекта duckduckgo в список, а затем использовать set():
count = 10
while( set(list(duckduckgo.search('Yellow Chris Martin',max_results=count)) ) < some_val ):
count = count + 1
for links in set(list(duckduckgo.search('Yellow Chris Martin',max_results=count)) :
print links