Форматирование HTML-файла через Python
У меня есть лист Excel и HTML-файл. Я извлек данные из листа Excel и сделал копию HTML-файла и поместил данные в эту копию HTML-файла с помощью кода, но формат скопированного HTML-файла изменился
import xlrd
from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
import webbrowser
file_location = "E:/data.xlsx"
workbook = xlrd.open_workbook(file_location)
sheet = workbook.sheet_by_index(0)
data = [[sheet.cell_value(r,c) for c in range(sheet.ncols)]for r in range(sheet.nrows)]
type(data)
url = "E:/Master File.html"
soup = BeautifulSoup(open(url), "html.parser")
orgName = soup.find('span',{"id":"Name"})
fName = orgName.getText()
print(fName)
orgDes = soup.find('span',{"id":"Designation"})
fdes = orgDes.getText()
print(fdes)
orgLline = soup.find('td',{"id":"Landline"})
flline = orgLline.getText()
print(flline)
orgMobile = soup.find('td',{"id":"Mobile"})
fmobile = orgMobile.getText()
print(fmobile)
orgEmail = soup.find('a',{"id":"Email"})
print(orgEmail)
femail = orgEmail.getText()
print(femail)
for r in range(sheet.nrows):
for c in range(sheet.ncols):
if c == 0:
fname = data[r][c]
if c == 1:
lname = data[r][c]
if c == 2:
designation = data[r][c]
if c == 3:
email = data[r][c]
if c == 4:
phone = data[r][c]
if c == 5:
lline = data[r][c]
orgName.string = orgName.text.replace(fName, fname+lname)
orgDes.string = orgDes.text.replace(fdes,"| " + designation)
orgLline.string = orgLline.text.replace(flline, "+91-11-"+str(int(lline)))
orgMobile.string = orgMobile.text.replace(fmobile, "+91-"+str(int(phone)))
orgEmail.string = orgEmail.text.replace(femail, email)
with open("E:/new_file_"+fname+lname+".html", "w+") as outf:
outf.write(str(soup))
это код
это HTML-файл, сгенерированный из кода (копия основного файла)