Какой синтаксический анализатор XML лучше для Perl?

Question

Какой синтаксический анализатор XML лучше для Perl?

Я пробовал многие из Perl XML парсеров. Я был очень заинтересован в Саблотрон Парсер, но это такая боль, чтобы установить на коробке Windows. В настоящее время я начал использовать XML:: LibXML и XML::LibXSLT, которые, кажется, делают все, что мне нужно.

Они кажутся вполне стандартными. Есть ли лучшие XML-парсеры для использования, чем этот?

34

xml perl libxml2

Источник

user274 28 янв '09 в 10:48

8 ответов

Решение

Это действительно зависит от ваших потребностей, как говорили люди. Для анализа XML-файлов размером ~100 МБ (генные аннотации из TAIR, 1 файл на хромосому) я использовал модуль mirod XML::Twig, который позволяет устанавливать обратные вызовы для анализа интересующих вас элементов, представляя каждый поддокумент как XML:: Простое дерево. Он сочетает в себе преимущества парсера SAX (сканирование файла в виде потока) с парсером DOM (проще работать с интересными фрагментами).

12

Источник

user117896 18 июн '09 в 15:37

Если вам нужна скорость, мощность или возможности, XML::LibXML - это то, что вам нужно. Если вам не все так просто, XML:: Simple - жизнеспособная альтернатива.

10

Источник

user45978 28 янв '09 в 13:45

(На самом деле это не ответ, а комментарий - однако я не могу комментировать...)

XML:: Simple был упомянут здесь.
(Я знаю, что это несколько лет назад, но это появилось в Google сегодня...)

Однако его сайт ( http://metacpan.org/pod/XML::Simple) теперь говорит:

СОСТОЯНИЕ ЭТОГО МОДУЛЯ

Использование этого модуля в новом коде не рекомендуется. Доступны другие модули, которые обеспечивают более простые и согласованные интерфейсы. В частности, настоятельно рекомендуется XML::LibXML.

Основными проблемами этого модуля являются большое количество опций и произвольные способы взаимодействия этих опций - часто с неожиданными результатами.

Патчи с исправлениями ошибок и исправлениями документации приветствуются, но новые функции вряд ли будут добавлены.

5

Источник

user1543290 14 апр '13 в 13:23

По моему опыту XML::Simple лучше всего подходит для быстрого и грязного анализа XML. Мы используем его для анализа данных третьих сторон, которые не всегда соответствуют стандарту XML. XML::Simple генерирует информативные ошибки и очень быстро запускает работу.

5

Источник

user13369 28 янв '09 в 19:51

Вы также можете посмотреть на XML::Liberal, который использует LibXML внизу.

2

Источник

user36499 28 янв '09 в 21:13

Я думаю, что вы также должны попробовать XML::MyXML. Это очень просто в использовании.

1

Источник

user751910 06 апр '13 в 23:22

Я предложу тот, который НЕ ДОЛЖЕН использоваться: XML:: Parser.

Он автоматически расширяет HTML-сущности до их эквивалентов UTF-8, и возможность отключить это поведение не работает для большинства характеристик всех сущностей, &,

Кроме того, его XMLDecl-парсер будет интерпретировать и отображать standalone атрибут в <?xml ... ?> блок как "standalone"="1", что абсолютно неверно - так и должно быть "standalone"="yes",

0

Источник

user2430549 15 янв '18 в 17:13

Другие вопросы по тегам xml perl libxml2

user2635 28 янв '09 в 10:57 2009-01-28 10:57 · Accepted Answer · 2009-01-28 10:57

Я думаю, что вы используете довольно хороший. XML:: LibXML, Perl-интерфейс Мэтта Сержанта и Кристиана Глана к libxml2 Даниэля Веллиарда - один из самых быстрых анализаторов XML, который я знаю.

25

Источник

user2635 28 янв '09 в 10:57