Как распечатать клонированный список один раз и загрузить его в словарь на Python?
мой входной файл:
cs 124456 powerful cs 124456 powerful me 125454 easy me 125455 easy me 125455 easy ec 125555 done ec 127678 fine ec 127678 fine ci 127678 fine ci 127678 fine eee 125678 good eee 125678 good eee 125678 good eee 125678 bad`
Ожидаемый результат:
no.name reg perform 1.cs 124456 powerful 2.me 125454 easy 3.me 125455 easy 4.ec 125555 done 5.ec 127678 fine 6.ci 127678 fine 7.eee 125678 good 8.eee 125678 bad
мой код:
import os os.chdir("d:/filer") import re def first(line): f=re.findall("[a-z]+",line,flags=0) return f def num(line): n=re.findall("\d{6}",line,flags=0) return n with open("once.txt","r") as sa: for line in sa.readlines(): home=first(line) number=num(line) x=home[0] y=number[0] z=home[1] if x!=0 and y!=0 and z!=0: print [x,y,z]
Я открыл файл и прочитал их построчно. Затем я извлек эти числа и текст с помощью регулярных выражений и сохранил их в списке с индексами. Теперь я хочу только списки, которые являются уникальными и не клонированы. Затем загрузите их в словарь. Кто-нибудь может мне помочь?
1 ответ
Чтобы предотвратить клонирование, вы можете использовать set()
вот так:
results = set() # Construct a set
with open("once.txt","r") as sa:
for line in sa.readlines():
home=first(line)
number=num(line)
x=home[0]
y=number[0]
z=home[1]
if x!=0 and y!=0 and z!=0:
if (x,y,z) not in results: # Check if the set already contains the result
results.add((x,y,z)) # If it doesn't, add to the set and print.
print [x,y,z]
Я также предлагаю немного организовать ваш код. Вы можете просто создать 1 регулярное выражение для ясности, например, так:
results = set() # Construct a set
with open("once.txt","r") as sa:
count = 0
for line in sa: # No need for readlines()
match = re.match(r"(\w+)\s+(\d+)\s+(\w+)")
if match is None:
continue
result = match.groups()
if result not in results: # Check if the set already contains the result
count += 1
results.add(result) # If it doesn't, add to the set and print.
print count, result