Форматирование HTML-файла через Python

У меня есть лист Excel и HTML-файл. Я извлек данные из листа Excel и сделал копию HTML-файла и поместил данные в эту копию HTML-файла с помощью кода, но формат скопированного HTML-файла изменился

        import xlrd
from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
import webbrowser
file_location = "E:/data.xlsx"
workbook = xlrd.open_workbook(file_location)
sheet = workbook.sheet_by_index(0)
data = [[sheet.cell_value(r,c) for c in range(sheet.ncols)]for r in range(sheet.nrows)]
type(data)


url = "E:/Master File.html"



soup = BeautifulSoup(open(url), "html.parser")

orgName = soup.find('span',{"id":"Name"})
fName = orgName.getText()
print(fName)

orgDes = soup.find('span',{"id":"Designation"})
fdes = orgDes.getText()
print(fdes)

orgLline = soup.find('td',{"id":"Landline"})
flline = orgLline.getText()
print(flline)

orgMobile = soup.find('td',{"id":"Mobile"})
fmobile = orgMobile.getText()
print(fmobile)

orgEmail = soup.find('a',{"id":"Email"})
print(orgEmail)
femail = orgEmail.getText()
print(femail)


for r in range(sheet.nrows):
    for c in range(sheet.ncols):
        if c == 0:
            fname = data[r][c]            
        if c == 1:
            lname = data[r][c]
        if c == 2:
            designation = data[r][c]
        if c == 3:
            email = data[r][c] 
        if c == 4:
            phone = data[r][c]
        if c == 5:
            lline = data[r][c]
    orgName.string = orgName.text.replace(fName, fname+lname)
    orgDes.string = orgDes.text.replace(fdes,"| " + designation)
    orgLline.string = orgLline.text.replace(flline, "+91-11-"+str(int(lline)))
    orgMobile.string = orgMobile.text.replace(fmobile, "+91-"+str(int(phone)))
    orgEmail.string = orgEmail.text.replace(femail, email)
    with open("E:/new_file_"+fname+lname+".html", "w+") as outf:
        outf.write(str(soup))

это код

это оригинальный HTML-файл

это HTML-файл, сгенерированный из кода (копия основного файла)

0 ответов

Другие вопросы по тегам