Пересечение двух массивов Unicode в Python

Работа моей программы: 1) из файла test.txt я ищу строки, содержащие слово " साधु ". 2) После поиска строки я извлекаю слова, смежные с ее правым и левым. 3) После добавления этих слов в массив я пытаюсь найти Пересекающиеся слова в этих двух массивах.

1 ответ

Решение

Вы можете декодировать вашу строку в Unicode с помощью следующего кода

mylist = map(lambda word: word.decode('utf-8'), mylist)

Хотя для пересечения вам не нужно декодировать его. Вы можете просто сделать

#considering you have two lists 'list1' and 'list2'

intersection = set(list1).intersection(set(list2))
Другие вопросы по тегам