Описание тега wordsegment

1 ответ

Сегментация текста с использованием пакета слов Python

Folks, Я использую библиотеку Python wordsegment Грант Дженкс за последние пару часов. Библиотека прекрасно работает для любых неполных слов или разделения комбинированных слов, таких как e nd ==> end а также thisisacat ==> this is a cat, Я работаю …
30 ноя '18 в 00:12
0 ответов

Представление пространства состояний и цели в проблеме сегментации слова

Мне дано слово без пробелов, моя цель состоит в том, чтобы сегментировать это слово, вставляя пробелы в нужное место. Допустим, данное слово "ineedyou", тогда мой результат сегментации слова должен быть "я нуждаюсь в тебе". Для этой задачи мне дали …
30 мар '19 в 00:41
0 ответов

Как решить проблему сегментации слов, тега pos и анализа тональности в SnowNLP?

Я использую пакет SnowNLP для выполнения программы, затем я использовал следующий веб-сайт github, чтобы загрузить этот инструмент: https://github.com/isnowfy/snownlp В этом инструменте я видел, что он может выполнять 3 программы. Он включает в себя…
1 ответ

библиотека python wordsegement: ValueError: max() arg - пустая последовательность

Я использую wordsegment библиотека python для токенизации моего текста следующим образом: from wordsegment import load, segment tweet = 'Sobering stats: 110,000 homes worth $20B in flood-affected areas in Baton Rouge region, #lawx ... via @theadvoca…
17 фев '20 в 14:47
1 ответ

jieba segmenter применяется к столбцу "содержимое", а затем создает новый столбец "слова" с разделенными символами в r

Я пытаюсь сегментировать китайские предложения из столбца "содержимое" на слова с помощью пакета jieba в r, а затем создать новый соответствующий столбец "слова", где каждая строка содержит сегментированные слова соответствующих строк из предыдущего…
25 окт '20 в 18:15
1 ответ

Как использовать segment() из wordsegment внутри для re.sub для извлечения слов из хэштегов в Python?

Я работаю над анализом настроений твитов с помощью Python. В процессе очистки твитов хочу извлекать слова из хэштегов. Я обнаружил, что библиотека wordsegment выполняет эту работу очень эффективно. Однако моя проблема в том, что библиотека wordsegme…
10 сен '20 в 07:45
0 ответов

Слияние сегментов слов, которые перекрываются или содержатся в других сегментах python

Я работаю над проектом, который включает сегментацию слов в изображениях, содержащих рукописный текст. Для этого я использую технику масштабного пространства для сегментации слов . Одна из проблем - это перекрывающиеся сегменты, как показано на рису…
31 май '21 в 21:42
0 ответов

Как понять эти команды BPE?

'''subword-nmt learn-bpe -s {num_operations} < {train_file} > {codes_file}''' '''subword-nmt apply-bpe -c {codes_file} < {test_file} > {out_file}''' Эти две команды взяты из github BPE. Я пытаюсь запустить его в Google Collab, но я не п…
19 май '22 в 04:39