CSV(с дополнительными кавычками в значении поля) для массива в ColdFusion
Я конвертирую файл CSV в массив, используя этот пост. Все работало нормально. Но я получил файл, который содержит дополнительные кавычки в значениях полей, таких как:
"bash: "shortcuts" are"
а также
"bash: \"shortcuts\" are"
,
Поэтому я попытался заменить эти цитаты следующим образом:
<cffile action="read" file="#filePath#" variable="csvContent">
<cfset csvContent = reReplace(csvContent, '(?:[^,\r\n])"(?:[^,\r\n])', '"', 'ALL')>
<--- Then do the conversion --->
<cfset array = csvToArray(csv = csvContent)>
Но группа без захвата не работает. Что я делаю неправильно?
Есть ли другой способ сделать это?
Изменить 1:
Я также пытался использовать cfhttp
и получил следующую ошибку:
<cfhttp name="csvToQuery" method="get" url="#url#" />
Подробно: проверьте количество столбцов, указанное в атрибуте columns и в целевом файле.
Сообщение: неверное количество столбцов в строке.
StackTrace: coldfusion.tagext.net.HttpTag $ InvalidColumnsException: неверное количество столбцов в строке. at coldfusion.tagext.net.HttpTag.connHelper(HttpTag.java:1149) по адресу coldfusion.tagext.net.HttpTag.doEndTag(HttpTag.java:1219) по адресу cfmfhttp2ecfm308364137.runPage(C:\intpf):1) в coldfusion.runtime.CfJspPage.invoke(CfJspPage.java:244) в coldfusion.tagext.lang.IncludeTag.doStartTag(IncludeTag.java:446) в coldfusion.filter.CfincludeFilter.invoke(CfincludeFilter) j coldfusion.filter.IpFilter.invoke(IpFilter.java:64) в coldfusion.filter.ApplicationFilter.invoke(ApplicationFilter.java:430) в coldfusion.filter.RequestMonitorFilter.invoke(RequestMonitorFilter.java:48FilterMonterFusionter в Coldff)..invoke(MonitoringFilter.java:40) в coldfusion.filter.PathFilter.invoke(PathFilter.java:112) в coldfusion.filter.LicenseFilter.invoke(LicenseFilter.java:30) в coldfusion.filter.ExceptionFilter.invoke(ExceptionFilter. Java:94) в coldfusion.filter.ClientScopePersistenceFilter.invoke(ClientScopePersistenceFilter.java:28) в coldfusion.filter.BrowserFilter.invoke(BrowserFilter.java:38) по адресу coldfusion.filter.NoCacheFilter.invoke(NoCacheFilter.java:58) по адресу coldfusion.filter.GlobalsFilter.invoke(GlobalsFilter.java:38) по адресу coldfusion.filter.DatasourceFilter.inavakef:) в coldfusion.filter.CachingFilter.invoke(CachingFilter.java:62) в coldfusion.CfmServlet.service(CfmServlet.java:219) в coldfusion.bootstrap.BootstrapServlet.service(BootstrapServlet.jina.cat.java:89).core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:303) в org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:208) в coldfusion.monitor.event.MonitoringSilfF coldfusion. 208) на org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:220) по адресу org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:122) по адресу org.apache.catalina.authenticator.AuthenticatorBase.ntic.inv5.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:171) в org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:102) в org.apache.catalina.valves.Log.java:950) в org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:116) в org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:422) в org.apache.coy.ajp.AjpProcessor.process(AjpProcessor.java:199) в org.apache.coyote.AbstractProtocol$AbstractConnectionHandler.process(AbstractProtocol.java:607) в org.apache.tomcat.util.net.JIoEndpoint$SocketProcessor.Eun (Java:314) на java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145) на java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615) в org.apache.tomcat.util.threads.TaskThread$WrappingRunnable.run(TaskThread.java:61) в java.lang.Thread.run(Thread.java:722)
1 ответ
О, вы сами не сможете так легко исправить подобные данные. Регулярные выражения сломают ваши данные еще больше.
Можете ли вы создать небольшой скрипт на Java, чтобы справиться с этим? Если вы это сделаете, то используйте uniVocity-парсеры, чтобы прочитать ваш CSV-вход и записать его обратно с правильными экранированными кавычками:
Это единственный CSV-парсер, который может обрабатывать экранированные кавычки. Попробуйте этот пример:
import com.univocity.parsers.csv;
import java.io.*;
import java.util.*;
public class Test {
public static void main(String ... args){
CsvParserSettings settings = new CsvParserSettings();
settings.getFormat().setLineSeparator("\r\n");
settings.setParseUnescapedQuotes(true); // THIS IS IMPORTANT FOR YOU
CsvParser parser = new CsvParser(settings);
String line1 = "something,\"a quoted value \"with unescaped quotes\" can be parsed\", something\r\n";
System.out.println("Input line: " + line1);
String line2 = "\"after the newline \r\n you will find \" more stuff\r\n";
System.out.println("Input line: " + line2);
List<String[]> allInputLines = parser.parseAll(new StringReader(line1 + line2));
System.out.println("===============\nParsed input values\n===============");
int count = 0;
for(String[] line : allInputLines){
System.out.println("From line " + ++count + ":");
for(String element : line){
System.out.println("\t" + element);
}
System.out.println();
}
//Let's write your output CSV
StringWriter output = new StringWriter();
CsvWriterSettings writerSettings = new CsvWriterSettings();
writerSettings.getFormat().setLineSeparator("\r\n");
writerSettings.getFormat().setQuoteEscape('\\'); //it seems you are using backslash as quote escape
writerSettings.getFormat().setCharToEscapeQuoteEscaping('\\'); //when your quote escape character is not the same as the quote character, you might need to escape the escape character as well
writerSettings.setQuoteAllFields(true); //let's force quotes on all fields so whatever is parsing your input file has more chance of doing it properly
CsvWriter writer = new CsvWriter(output, writerSettings);
for(String[] row : allInputLines){
writer.writeRow(row);
}
writer.close();
System.out.println("===============\nNicely formatted output\n===============");
System.out.println(output.toString());
}
}
Этот код выдаст следующий вывод (который может быть прочитан вашим инструментом импорта данных):
Input line: something,"a quoted value "with unescaped quotes" can be parsed", something
Input line: "after the newline
you will find " more stuff
===============
Parsed input values
===============
From line 1:
something
a quoted value "with unescaped quotes" can be parsed
something
From line 2:
after the newline
you will find " more stuff
===============
Nicely formatted output
===============
"something","a quoted value \"with unescaped quotes\" can be parsed","something"
"after the newline
you will find \" more stuff"
Раскрытие: я являюсь автором этой библиотеки. Это с открытым исходным кодом и бесплатно (лицензия Apache V2.0).
Пример ColdFusion 10+:
Загрузите банку в ваш Application.cfc
this.javaSettings = { loadPaths: ["C:\path\to\univocity-parsers-1.5.6.jar" ]};
Создайте экземпляры классов анализатора с помощью createObject:
filePath = "c:\path\to\yourFile.csv"; settings = createObject("java", "com.univocity.parsers.csv.CsvParserSettings").init(); settings.getFormat().setLineSeparator(chr(13)& chr(10)); settings.getFormat().setQuoteEscape("\"); settings.setParseUnescapedQuotes(true); // THIS IS IMPORTANT FOR YOU parser = createObject("java", "com.univocity.parsers.csv.CsvParser").init(settings); reader = createObject("java", "java.io.StringReader").init(fileRead(filePath)); arrayOfLines = parser.parseAll(reader); // display results counter = 1; for (line in arrayOfLines) { writeOutput("<br>From line "& (counter++) & ":"); for (element in line) { writeOutput("<br>"& element); } }