Использование Exceldatareader, чтобы взять данные из файла Excel и вставить их в XML-файл?
У меня есть несколько XML-файлов в формате
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD with OASIS Tables v1.0 20120330//EN" "JATS-journalpublishing-oasis-article1.dtd">
<article article-type="proceedings" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:oasis="http://www.niso.org/standards/z39-96/ns/oasis-exchange/table">
<front>
<journal-meta>
<journal-id journal-id-type="publisher-id"/>
<journal-title-group>
<journal-title>Eleventh International Conference on Correlation Optics</journal-title>
</journal-title-group>
<issn pub-type="epub">0277-786X</issn>
<publisher>
<publisher-name>SPIE</publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">@@</article-id>
<title-group>
<article-title>Comparison of absorption spectra of adenocarcinoma and squamous cell carcinoma cervical tissue</article-title>
</title-group>
<pub-date>
<year>2013</year>
</pub-date>
<volume>9066</volume>
<issue>90661T</issue>
<isbn content-type="conf-proc">978-1-5106-0374-5</isbn>
<fpage>90661T-1</fpage>
<lpage>90661T-7</lpage>
</article-meta>
</front>
и у меня есть файл xlsx, как показано ниже
Filename Pages DOI Publisher Year Price
01022018_1020 14 10.1111/12.2033558 Springer 2017 $15.13
01022018_1021 7 10.1111/12.2033559 Elsevier 2018 $15.25
01022018_1130 30 10.1113/20.3023658 Elsevier 2017 $19.25
01022018_1301 10 10.1113/20.3023777 Wiley 2015 $11.50
Я хочу получить соответствующие значения полей DOI и Publisher для каждого файла (поиск по имени файла) и обновить их до файлов xml, т. Е. Если имя файла 01022018_1021.xml, то получить соответствующий DOI и Publisher, т. Е. 10.1111 / 12.2033559 и Elsevier и положить их внутри узлов, как <publisher-name>Elsevier</publisher-name>
а также <article-id pub-id-type="doi">10.1111/12.2033559</article-id>
Я никогда не использовал Exceldatareader, но я пытался так
var xmlFiles=Directory.EnumerateFiles(@"D:\test\testobject","*.xml",SearchOption.AllDirectories);
Parallel.ForEach(xmlFiles,xmlFile=>{
var name=Path.GetFileName(xmlFile);
FileStream stream = File.Open(@"C:\Don\Downloads\Download-Sample-File-xlsx.xlsx", FileMode.Open, FileAccess.Read);
IExcelDataReader excelReader = ExcelReaderFactory.CreateOpenXmlReader(stream);
DataSet result = excelReader.AsDataSet(new ExcelDataSetConfiguration() {
ConfigureDataTable = (_) => new ExcelDataTableConfiguration() {
UseHeaderRow = true
}
});
DataTable dt = result.Tables[0];
foreach (DataRow row in dt.Rows)
{
var x = (string)row["Publisher"];
var y = (string)row["DOI"];
/*how do I get the required values
var pub_name="...";
var doi="...";
*/
XDocument doc=XDocument.Load(xmlFile);
doc.Descendants("pub-name").First().Value=pub_name;
doc.Descendants("article-id").First().Value=doi;
doc.Save(xmlFile);
}
excelReader.Close();
});
Console.WriteLine("Done");
Console.ReadLine();
Кто-нибудь может помочь?
1 ответ
Решение
Похоже, у вас уже есть значения.
doc.Descendants("pub-name").First().Value=x;
doc.Descendants("article-id").First().Value=y;
Изменить: я не понял, что нужно найти правильный ряд.
DataTable dt = result.Tables[0];
var filename = Path.GetFileNameWithoutExtension(xmlFile);
// Get the row for the current file
var rowForFile = dt.Rows.Cast<DataRow>()
.SingleOrDefault(r => (string)r["Filename"] == filename);
if (rowForFile != null)
{
XDocument doc = XDocument.Load(xmlFile);
doc.Descendants("publisher-name").First().Value = (string)rowForFile["Publisher"];
doc.Descendants("article-id").First().Value = (string)rowForFile["DOI"];
doc.Save(xmlFile);
}