Разбор даты в польском языке в Йоде?

У меня есть следующая дата:

например. String rawDate = "pon, 17 lis 2014, 15:51:12";

и я хотел бы разобрать это.

Я звоню:

DateTime time = new DateTimeFormatterBuilder()
                    .append(DateTimeFormat.forPattern("EEE, dd MMM yyyy, HH:mm:ss")
                            .getParser())
                    .toFormatter().withLocale(new Locale("pl")).parseDateTime(rawDate);

Но я получаю:

java.lang.IllegalArgumentException: Invalid format: "pon, 17 lis 2014, 15:51:12"

2 ответа

Решение

Хороший вопрос!

JDK использует свои собственные текстовые ресурсы. Поэтому следующий код Java-8 создает исключение:

String input = "pon, 17 lis 2014, 15:51:12";

DateTimeFormatter dtf1 = 
  DateTimeFormatter.ofPattern("EEE, dd MMM yyyy, HH:mm:ss", new Locale("pl"));
LocalDateTime ldt1 = LocalDateTime.parse(input, dtf1);
System.out.print(ldt1);
// error message:
// java.time.format.DateTimeParseException:
// Text 'pon, 17 lis 2014, 15:51:12' could not be parsed at index 0

Если мы попытаемся выяснить, в чем проблема, то мы обнаружим, что JDK использует "Pn":

DateTimeFormatter dtf1 = 
  DateTimeFormatter.ofPattern("EEE, dd MMM yyyy, HH:mm:ss", new Locale("pl"));
String output = LocalDateTime.of(2014, 11, 17, 15, 51, 12).format(dtf1);
System.out.println(output); // "Pn, 17 lis 2014, 15:51:12"
LocalDateTime ldt1 = LocalDateTime.parse(output, dtf1);

Обычно люди не могут изменить ввод. К счастью, существует обходной путь, определяющий ваши собственные текстовые ресурсы:

String input = "pon, 17 lis 2014, 15:51:12";

TemporalField field = ChronoField.DAY_OF_WEEK;
Map<Long,String> textLookup = new HashMap<>();
textLookup.put(1L, "pon");
textLookup.put(2L, "wt");
textLookup.put(3L, "\u0347r"); // śr
textLookup.put(4L, "czw");
textLookup.put(5L, "pt");
textLookup.put(6L, "sob");
textLookup.put(7L, "niedz");

DateTimeFormatter dtf2 = 
  new DateTimeFormatterBuilder()
  .appendText(field, textLookup)
  .appendPattern(", dd MMM yyyy, HH:mm:ss")
  .toFormatter()
  .withLocale(new Locale("pl"));
LocalDateTime ldt2 = LocalDateTime.parse(input, dtf2);
System.out.print(ldt2);
// output: 2014-11-17T15:51:12

Хорошо, теперь о (старой) Joda-Time. Отсутствует такой метод как appendText(field, lookupMap), Но мы можем написать реализацию для DateTimeParser:

  final Map<String, Integer> textLookup = new HashMap<String, Integer>();
  textLookup.put("pon", 1);
  textLookup.put("wt", 2);
  textLookup.put("\u0347r", 3); // śr
  textLookup.put("czw", 4);
  textLookup.put("pt", 5);
  textLookup.put("sob", 6);
  textLookup.put("niedz", 7);

  DateTimeParser parser =
    new DateTimeParser() {
    @Override
    public int estimateParsedLength() {
        return 5;
    }
    @Override
    public int parseInto(DateTimeParserBucket bucket, String text, int position) {
        for (String key : textLookup.keySet()) {
            if (text.startsWith(key, position)) {
                int val = textLookup.get(key);
                bucket.saveField(DateTimeFieldType.dayOfWeek(), val);
                return position + key.length();
            }
        }
        return ~position;
    }
  };
  DateTimeFormatter dtf =
    new DateTimeFormatterBuilder().append(parser)
    .appendPattern(", dd MMM yyyy, HH:mm:ss").toFormatter()
    .withLocale(new Locale("pl"));
  String input = "pon, 17 lis 2014, 15:51:12";
  LocalDateTime ldt = LocalDateTime.parse(input, dtf);
  System.out.println(ldt); // 2014-11-17T15:51:12.000

И наконец, вопрос к вам: в Unicode-CLDR-data точка используется за сокращенными названиями дней недели, например, "pon". вместо "pon" (моя собственная библиотека тоже использует CLDR-контент). Что чаще всего встречается в зависимости от ваших языковых знаний и ощущений относительно польского? Используя точку или нет?

Очевидно, Joda Time (или Java) рассматривает сокращенную форму poniedziałek - pn, а не pon - поэтому этот код работает (и немного проще, чем ваш):

import org.joda.time.*;
import org.joda.time.format.*;
import java.util.*;

public class Test {
    public static void main(String[] args) throws Exception {
        String rawDate = "pn, 17 lis 2014, 15:51:12";
        DateTimeFormatter parser = DateTimeFormat
            .forPattern("EEEE, dd MMM yyyy, HH:mm:ss")
            .withLocale(new Locale("pl"));
        DateTime time = parser.parseDateTime(rawDate);
        System.out.println(time);
    }
}

Если вы не можете изменить свой ввод, возможно, вы можете изменить символы, связанные с локалью?

Другие вопросы по тегам