Описание тега textacy
1
ответ
Textacy не может создать корпус из класса textacy.doc.Doc
Я просто работаю, думал текстовые учебники с данными за пределами модуля наборов данных для работы. Я получаю некоторые текстовые данные из фрейма данных и храню их как строковую переменную для работы. def mergeText(df): content = '' for i in df['te…
11 дек '17 в 15:03
1
ответ
Итерация по списку строк в Python 3, сопоставление каждого элемента с остальными и возвращение наибольшего совпадения
У меня есть список питонов. В этом списке мне нужно сравнить каждый элемент с остальными и заменить короткие строки самыми длинными. РЕДАКТИРОВАТЬ: У меня есть список имен людей, которые я получаю с помощью модуля Spacy и его извлечения сущности. Я …
17 авг '18 в 01:28
0
ответов
Вычислительный TTR на корпусе
Я пытаюсь вычислить TTR корпуса "Capitol Words", используя леммы для всего словаря каждого говорящего. Я тоже пытаюсь defaultdict перетасуйте каждую запись, а затем укажите процент TTR для каждого докладчика. Пока у меня есть код выше, но не уверен,…
13 мар '18 в 02:56
1
ответ
Более эффективная реализация Textacy / spacy 'subject_verb_object_triples'
Я пытаюсь реализовать функцию 'extract.subject_verb_object_triples' из textacy в моем наборе данных. Однако код, который я написал, очень медленный и требует много памяти. Есть ли более эффективная реализация? import spacy import textacy def extract…
27 дек '18 в 13:11
1
ответ
Python: как сопоставить значение словаря с именем файла?
Я относительно новичок в Python и борюсь со следующим: У меня есть список из около 52 000 словарей, содержащих метаданные в PDF (которые хранятся отдельно). Теперь я хочу сопоставить 5000 из этих PDF-файлов с соответствующими словарями метаданных, н…
17 июл '17 в 09:40
0
ответов
Невозможно установить текстовые сообщения в Python 3.0
Я пытаюсь установить textacy для выполнения задач NLP, но получаю ошибку при попытке сделать: pip install textacy в Анаконде подскажите. Я получаю ошибку ошибка: требуется Microsoft Visual C++ 14.0. Получите его с помощью средств сборки Microsoft Vi…
02 мар '19 в 04:19
2
ответа
Как инициализировать `Doc` в текстовой версии 0.6.2?
Пытаясь следовать простому Doc инициализация в документах в Python 2 не работает: >>> import textacy >>> content = ''' ... The apparent symmetry between the quark and lepton families of ... the Standard Model (SM) are, at the very …
19 июл '18 в 20:21
0
ответов
Как сопоставить образец SVO с Textacy
Как вы используете Textacy's pos_regex_match() способ найти тройки субъект-глагол-объект, используя их синтаксис псевдо-регулярного выражения? И да, я в курсе textacy.extract.subject_verb_object_triples(), но эта функция очень неточная и находит оче…
02 июл '17 в 00:48
1
ответ
Использование простора и текстовых сообщений. Нужно найти оценку tf-idf в корпусе оригинальных твитов, но не могу импортировать текстовую векторизацию
Я новичок в этих рамках, а также НЛП. Я следую примеру, который дает мне следующий фрагмент кода для вычисления значения tf-idf всех токенов в твитах. Однако я получаю либо ошибки импорта, либо неопределенный векторизатор. Код: import spacy from tex…
20 апр '18 в 15:01
2
ответа
ImportError: невозможно импортировать имя "константы"
Мне нужно импортировать библиотеку констант, но она не работает... import spacy import pandas import textacy import pandas as pd from pandas import Series from . import constants ERREUR: ImportError Traceback (most recent call last) <ipython-inpu…
22 окт '18 в 09:43
1
ответ
Textacy с Jupyter Notebook: как подавить несколько предупреждений об ошибках?
Я использую Textacy (поверх Spacy) для обработки многих фрагментов текста. В частности, я использую оценки читабельности Textacy. Поскольку у меня много коротких текстов, я получаю предупреждение, которое мне нужно подавить, потому что в противном с…
23 сен '17 в 17:54
1
ответ
Как реализовать функцию в столбце pandas dataframe
Я пытаюсь применить textacy.extract.subject_verb_object_triples функция к столбцу панд df. Функция возвращает пустые объекты-генераторы вместо subject_verb_object_triples при применении следующим образом: sp500news3['title'].apply(lambda x: textacy.…
04 фев '19 в 16:25
1
ответ
Textacy - ошибка взвешивания векторизатора
Недавно я нашел Textacy, и, просматривая справочное руководство по API, я сталкиваюсь с ошибкой для Vectorizer. Если я добавлю какие-либо параметры из ссылки на API, я получу аргумент TypeError: неожиданное ключевое слово. Я получаю эту ошибку для д…
12 мар '18 в 14:42
0
ответов
Как применить функцию списка к генератору текстовых сообщений obj в pandas df
Я применяю функцию "список" к столбцу панд, который содержит объекты генератора, в попытке показать все объекты генератора в столбце. При применении col возвращает пустые списки. 'Subject_verb_object_triples' - это функция textacy ( https://chartbea…
04 фев '19 в 14:00
2
ответа
Ключевые слова Textacy возвращают пустой список
Я хотел бы использовать textacy для извлечения ключевых терминов, но функция, которую я использую keyterms.key_terms.pagerank(doc), просто возвращает пустой список. Я попробовал связанные функции, включая более длинный keyterms.key_terms_from_semant…
30 май '19 в 20:51
1
ответ
Не могу установить пакеты spaCy и textacy
Не может установить spacy и textacy в python 3.7 в среде pip и windows 10 Я попытался установить пакет spacy and textacy, но получил ошибку. Я искал ошибку и обнаружил, что мне нужно установить Visual C++ Toolkit 2017. Поэтому я сделал это. После эт…
26 мар '19 в 15:19
2
ответа
Рассчитать TD-IDF для одного слова в текстовой
Я пытаюсь использовать Textacy, чтобы вычислить оценку TF-IDF для одного слова в стандартном корпусе, но немного неясно, какой результат я получаю. Я ожидал единственного числа, которое представляло частоту слова в корпусе. Так почему я получаю спис…
19 апр '19 в 16:19
2
ответа
Как удалить пробелы в слове с помощью Python?
Это вход дан John plays chess and l u d o. Я хочу, чтобы вывод был в этом формате (указан ниже) John plays chess and ludo. Я пробовал регулярное выражение для удаления пробелов, но у меня не работает. import re sentence='John plays chess and l u d o…
26 апр '19 в 09:04
1
ответ
Текстовая установка убит без причины
Я пытаюсь установить textacy на образ Python 3.6 Docker. Без причины процесс завершается с оператором "Killed" в конце Вот команда: pip install textacy Вот журнал: Collecting textacy Downloading https://files.pythonhosted.org/packages/34/3b/9c5ff72f…
15 май '19 в 14:27
1
ответ
У меня вопрос по поводу "модуль 'textacy' не имеет атрибута 'Doc'"
Не удается найти модуль 'textacy' не имеет атрибута 'Doc' Я пытаюсь извлечь глагольные фразы из spacy, но такой библиотеки нет. Пожалуйста, помогите мне, как я могу извлечь глагольные фразы или фразы прилагательного, используя spacy. Я хочу сделать …
23 июн '19 в 04:00