Описание тега udpipe

UDPipe включает бесплатную библиотеку C++ и исполняемый двоичный файл для обработки естественного языка (NLP).
1 ответ

udpipe_accuracy() всегда выдает одну и ту же ошибку "Строка CoNLL-U '....' не содержит 10 столбцов!"

Это касается пакета R udpipe для НЛП. Я использую его для токенизации, тегов, лемматизации и выполнения анализа зависимостей для текстовых файлов. Я не уверен, какой шаблон conllu файл нужен для функции udpipe_accuracy Я загрузил CSV-файл из 10 стол…
25 фев '18 в 16:21
0 ответов

Ответы Text Mining с очень разными длинами ответов

У меня есть набор ответов, где людей просили ответить на ряд вопросов. Там только один столбец текстовых данных для обработки. Моя задача только очень немногие респонденты написали длинные тексты, которые мне было легко обработать, и я понял из этог…
04 янв '19 в 13:55
0 ответов

Как использовать конкретную языковую модель для UDPipe

Я хочу пометить несколько текстовых файлов с помощью программного обеспечения UDPipe ( http://ufal.mff.cuni.cz/udpipe). Я скачал двоичные пакеты UDPipe, удалось установить все зависимости, я запустил make в src папку, как указано в руководстве по ус…
04 фев '19 в 18:02
1 ответ

Для цикла при извлечении ключевых слов с UDPIPE в R

Давайте начнем с воспроизводимого примера, который представляет собой фрейм данных с именем key состоит из 8 столбцов и 3 строк: key <- structure(c("Make Professional Maps with QGIS and Inkscape", "Gain the skills to produce original, professiona…
28 окт '18 в 08:27
1 ответ

Использование content_transformer с udpipe_annotate

Поэтому я только что узнал, что у udpipe есть отличный способ показать корреляции, поэтому я начал работать над этим. Код с этого сайта отлично работает, если я использую его в файле csv после его импорта и не вносю в него никаких изменений. Но моя …
02 авг '18 в 13:04
0 ответов

Не удалось установить пакет udpipe в инстанс ubuntu EC2

Я пытаюсь настроить приложение Shiny в бесплатной пробной версии Ubuntu AWS EC2. Сделали все шаги, но когда я пытаюсь установить пакет Udpipe R в Ubuntu, он долгое время находится в состоянии зависания. Как проверить ошибку и как убить сеанс. Я смог…
21 янв '19 в 07:03
2 ответа

Извлечение ключевых слов в каждой строке фрейма данных с использованием udpipe в R

Я использую пакет R udpipe извлечь ключевые слова в моем фрейме данных. Давайте начнем с некоторых данных, содержащихся в пакете: library(udpipe) data(brussels_reviews) Если мы посмотрим на структуру, мы увидим, что она содержит 1500 комментариев (с…
23 окт '18 в 18:32
1 ответ

R - Парсинг ключевых слов из udpipe RAKE для каждой статьи обратно в dataframe.

Я пытаюсь использовать RAKE от udpipe, чтобы сгенерировать список из 25 токенов RAKE на документ в кадре данных и записать эти токены (плюс простой str_count) обратно в кадр данных. Я создал цикл for для обработки, но вместо этого я пишу один и тот …
10 фев '19 в 01:00
3 ответа

Сделайте udpipe_annotate() быстрее

В настоящее время я работаю над документом Text Mining, где хочу абстрагировать релевантные ключевые слова из моего текста (обратите внимание, что у меня есть много, много текстовых документов). Я использую пакет udpipe. Отличная виньетка онлайн ( h…
27 ноя '18 в 13:56
1 ответ

Как сохранить хэштеги и их слова в качестве одного токена

Как изменить настройки по умолчанию на случай, если я хотел бы сохранить символ хэштега и его слово без изменений (то есть #company, а не # и company) x_mod <- udpipe_load_model("D:/Users/asongara/Documents/english-ewt-ud-2.3-181115.udpipe") ud_m…
21 дек '18 в 12:20
1 ответ

Как сделать "кластеризацию слов" в R с помощью пакета udpipe?

Я использую udpipe пакет в R, чтобы сделать текстовое майнинг. Я следовал этому руководству: https://cran.r-project.org/web/packages/udpipe/vignettes/udpipe-usecase-postagging-lemmatisation.html, но сейчас я немного застрял. Действительно, я хотел б…
24 мар '18 в 12:51
1 ответ

Сходство текста с помощью тега PoS

Я хочу рассчитать сходство текста, используя только слова определенного POS-тега. В настоящее время я вычисляю сходство, используя косинус-метод, но он не учитывает POS-теги. A <- data.frame(name = c( "X-ray right leg arteries", "consultation of …
16 май '18 в 19:31
2 ответа

Найти слова в корпусе на основе леммы

Я занимаюсь анализом текста с помощью R, и у меня возникает "проблема", которую я хотел бы решить... Чтобы найти в корпусе отчеты, содержащие больше всего заданного слова или выражения, я использую kwicфункция от quantedaпакет, как это: result <-…
07 апр '18 в 12:26
0 ответов

Можно ли изменить spaCy с помощью udpipe в Rasa-NLU?

Я несколько дней тестирую Rasa-NLU, который использует spaCy. У меня было большое разочарование по поводу португальского языка. Пытаясь выяснить, как улучшить данные тренировок, я нашел отличный скрипт, сравнивающий spaCy с udpipe, который можно про…
10 апр '18 в 22:56
1 ответ

Наследует (х, "символ") не является ИСТИННЫМ в программировании на R Shiny App

Я создаю Shiny App, и цель состоит в том, чтобы ввести текстовый файл, и с помощью библиотеки udpipe необходимо создать wordcloud, аннотировать и т. Д. Я получаю "унаследовал (х," символ ") не ИСТИНА" при запуске приложения. Проблема возникает из вк…
28 май '18 в 01:52
1 ответ

Как получить время в будущем для глагола с Udpipe

У меня есть большое количество медицинских отчетов. Я пытаюсь определить предложения, которые показывают, что будущие действия будут предприняты, например 'I will prescribe a medication' Я использую модель english-ewt из udpipe, и я также пробовал e…
08 мар '19 в 16:32
0 ответов

Ошибка при параллельном запуске udpipe R и включении словосочетаний после аннотации

Я сталкиваюсь с ошибками при выполнении параллельной реализации udpipe_annotate() в R и хотел бы знать, как можно выполнить коллокации (комбинирование / слияние токенов) после выполнения этой задачи аннотации. Библиотеки, используемые как udpipe, da…
21 авг '19 в 07:00
1 ответ

SpaCy-UDpipe загрузить пользовательскую модель colab

Я пытаюсь загрузить пользовательскую модель spacy-udpipe в Google Colab. Я старался !pip install ufal.udpipe !pip install spacy-udpipe import spacy_udpipe nlp = udpipe_download_model(language = ("italian-postwita")) но я получаю следующее …
24 июн '20 в 12:09
0 ответов

Тематическое моделирование по группе с использованием LDA в R

Я застрял на одной проблеме. Я пытаюсь разбить предложения по темам с помощью LDA. Я сделал это, но проблема в том, что LDA работает со всем набором данных и предоставляет мне тематическую терминологию по всему набору данных. Я хочу получить термино…
20 ноя '19 в 11:27
2 ответа

spacy-udpipe с pytextrank для извлечения ключевых слов из неанглийского текста

Я использовал pytextrank (https://github.com/DerwenAI/pytextrank/) с просторными и английскими моделями для извлечения ключевых слов - он отлично работает! Теперь мне нужно обработать неанглийские тексты, и я нашел udpipe (https://github.com/TakeLab…
20 янв '20 в 16:33