Пересечение двух массивов Unicode в Python
Работа моей программы: 1) из файла test.txt я ищу строки, содержащие слово " साधु ". 2) После поиска строки я извлекаю слова, смежные с ее правым и левым. 3) После добавления этих слов в массив я пытаюсь найти Пересекающиеся слова в этих двух массивах.
1 ответ
Решение
Вы можете декодировать вашу строку в Unicode с помощью следующего кода
mylist = map(lambda word: word.decode('utf-8'), mylist)
Хотя для пересечения вам не нужно декодировать его. Вы можете просто сделать
#considering you have two lists 'list1' and 'list2'
intersection = set(list1).intersection(set(list2))