Описание тега udpipe

Описание тега Вопросы с тегом

UDPipe включает бесплатную библиотеку C++ и исполняемый двоичный файл для обработки естественного языка (NLP).

1 ответ

udpipe_accuracy() всегда выдает одну и ту же ошибку "Строка CoNLL-U '....' не содержит 10 столбцов!"

Это касается пакета R udpipe для НЛП. Я использую его для токенизации, тегов, лемматизации и выполнения анализа зависимостей для текстовых файлов. Я не уверен, какой шаблон conllu файл нужен для функции udpipe_accuracy Я загрузил CSV-файл из 10 стол…

r nlp udpipe

25 фев '18 в 16:21

0 ответов

Ответы Text Mining с очень разными длинами ответов

У меня есть набор ответов, где людей просили ответить на ряд вопросов. Там только один столбец текстовых данных для обработки. Моя задача только очень немногие респонденты написали длинные тексты, которые мне было легко обработать, и я понял из этог…

text nlp analytics sentiment-analysis udpipe

04 янв '19 в 13:55

0 ответов

Как использовать конкретную языковую модель для UDPipe

Я хочу пометить несколько текстовых файлов с помощью программного обеспечения UDPipe ( http://ufal.mff.cuni.cz/udpipe). Я скачал двоичные пакеты UDPipe, удалось установить все зависимости, я запустил make в src папку, как указано в руководстве по ус…

pos-tagging debian-stretch udpipe

04 фев '19 в 18:02

1 ответ

Для цикла при извлечении ключевых слов с UDPIPE в R

Давайте начнем с воспроизводимого примера, который представляет собой фрейм данных с именем key состоит из 8 столбцов и 3 строк: key <- structure(c("Make Professional Maps with QGIS and Inkscape", "Gain the skills to produce original, professiona…

r for-loop keyword udpipe

28 окт '18 в 08:27

1 ответ

Использование content_transformer с udpipe_annotate

Поэтому я только что узнал, что у udpipe есть отличный способ показать корреляции, поэтому я начал работать над этим. Код с этого сайта отлично работает, если я использую его в файле csv после его импорта и не вносю в него никаких изменений. Но моя …

r tm udpipe

02 авг '18 в 13:04

0 ответов

Не удалось установить пакет udpipe в инстанс ubuntu EC2

Я пытаюсь настроить приложение Shiny в бесплатной пробной версии Ubuntu AWS EC2. Сделали все шаги, но когда я пытаюсь установить пакет Udpipe R в Ubuntu, он долгое время находится в состоянии зависания. Как проверить ошибку и как убить сеанс. Я смог…

r udpipe

21 янв '19 в 07:03

2 ответа

Извлечение ключевых слов в каждой строке фрейма данных с использованием udpipe в R

Я использую пакет R udpipe извлечь ключевые слова в моем фрейме данных. Давайте начнем с некоторых данных, содержащихся в пакете: library(udpipe) data(brussels_reviews) Если мы посмотрим на структуру, мы увидим, что она содержит 1500 комментариев (с…

r keyword udpipe

23 окт '18 в 18:32

1 ответ

R - Парсинг ключевых слов из udpipe RAKE для каждой статьи обратно в dataframe.

Я пытаюсь использовать RAKE от udpipe, чтобы сгенерировать список из 25 токенов RAKE на документ в кадре данных и записать эти токены (плюс простой str_count) обратно в кадр данных. Я создал цикл for для обработки, но вместо этого я пишу один и тот …

r nlp udpipe

10 фев '19 в 01:00

3 ответа

Сделайте udpipe_annotate() быстрее

В настоящее время я работаю над документом Text Mining, где хочу абстрагировать релевантные ключевые слова из моего текста (обратите внимание, что у меня есть много, много текстовых документов). Я использую пакет udpipe. Отличная виньетка онлайн ( h…

r keyword tm udpipe

27 ноя '18 в 13:56

1 ответ

Как сохранить хэштеги и их слова в качестве одного токена

Как изменить настройки по умолчанию на случай, если я хотел бы сохранить символ хэштега и его слово без изменений (то есть #company, а не # и company) x_mod <- udpipe_load_model("D:/Users/asongara/Documents/english-ewt-ud-2.3-181115.udpipe") ud_m…

r token udpipe

21 дек '18 в 12:20

1 ответ

Как сделать "кластеризацию слов" в R с помощью пакета udpipe?

Я использую udpipe пакет в R, чтобы сделать текстовое майнинг. Я следовал этому руководству: https://cran.r-project.org/web/packages/udpipe/vignettes/udpipe-usecase-postagging-lemmatisation.html, но сейчас я немного застрял. Действительно, я хотел б…

r cluster-analysis text-mining udpipe

24 мар '18 в 12:51

1 ответ

Сходство текста с помощью тега PoS

Я хочу рассчитать сходство текста, используя только слова определенного POS-тега. В настоящее время я вычисляю сходство, используя косинус-метод, но он не учитывает POS-теги. A <- data.frame(name = c( "X-ray right leg arteries", "consultation of …

r quanteda udpipe

16 май '18 в 19:31

2 ответа

Найти слова в корпусе на основе леммы

Я занимаюсь анализом текста с помощью R, и у меня возникает "проблема", которую я хотел бы решить... Чтобы найти в корпусе отчеты, содержащие больше всего заданного слова или выражения, я использую kwicфункция от quantedaпакет, как это: result <-…

r text-mining quanteda udpipe

07 апр '18 в 12:26

0 ответов

Можно ли изменить spaCy с помощью udpipe в Rasa-NLU?

Я несколько дней тестирую Rasa-NLU, который использует spaCy. У меня было большое разочарование по поводу португальского языка. Пытаясь выяснить, как улучшить данные тренировок, я нашел отличный скрипт, сравнивающий spaCy с udpipe, который можно про…

rasa-nlu udpipe

10 апр '18 в 22:56

1 ответ

Наследует (х, "символ") не является ИСТИННЫМ в программировании на R Shiny App

Я создаю Shiny App, и цель состоит в том, чтобы ввести текстовый файл, и с помощью библиотеки udpipe необходимо создать wordcloud, аннотировать и т. Д. Я получаю "унаследовал (х," символ ") не ИСТИНА" при запуске приложения. Проблема возникает из вк…

r shiny udpipe

28 май '18 в 01:52

1 ответ

Как получить время в будущем для глагола с Udpipe

У меня есть большое количество медицинских отчетов. Я пытаюсь определить предложения, которые показывают, что будущие действия будут предприняты, например 'I will prescribe a medication' Я использую модель english-ewt из udpipe, и я также пробовал e…

r udpipe

08 мар '19 в 16:32

0 ответов

Ошибка при параллельном запуске udpipe R и включении словосочетаний после аннотации

Я сталкиваюсь с ошибками при выполнении параллельной реализации udpipe_annotate() в R и хотел бы знать, как можно выполнить коллокации (комбинирование / слияние токенов) после выполнения этой задачи аннотации. Библиотеки, используемые как udpipe, da…

r parallel-processing nlp udpipe

21 авг '19 в 07:00

1 ответ

SpaCy-UDpipe загрузить пользовательскую модель colab

Я пытаюсь загрузить пользовательскую модель spacy-udpipe в Google Colab. Я старался !pip install ufal.udpipe !pip install spacy-udpipe import spacy_udpipe nlp = udpipe_download_model(language = ("italian-postwita")) но я получаю следующее …

model google-colaboratory spacy udpipe

24 июн '20 в 12:09

0 ответов

Тематическое моделирование по группе с использованием LDA в R

Я застрял на одной проблеме. Я пытаюсь разбить предложения по темам с помощью LDA. Я сделал это, но проблема в том, что LDA работает со всем набором данных и предоставляет мне тематическую терминологию по всему набору данных. Я хочу получить термино…

r lda topic-modeling udpipe

20 ноя '19 в 11:27

2 ответа

spacy-udpipe с pytextrank для извлечения ключевых слов из неанглийского текста

Я использовал pytextrank (https://github.com/DerwenAI/pytextrank/) с просторными и английскими моделями для извлечения ключевых слов - он отлично работает! Теперь мне нужно обработать неанглийские тексты, и я нашел udpipe (https://github.com/TakeLab…

python nlp spacy udpipe

20 янв '20 в 16:33