Описание тега semantic-analysis
В машинном обучении семантический анализ корпуса - это задача построения структур, которые аппроксимируют концепции из большого набора документов.
2
ответа
Какая польза от Brown Corpus для измерения семантического сходства на основе WordNet?
Я сталкивался с несколькими методами измерения семантического сходства, которые используют структуру и иерархию WordNet, например, мера Цзяна и Конрата (JNC), мера Ресника (RES), мера Лин (LIN) и т. Д. Они измеряются с помощью NLTK: sim2=wn.jcn_simi…
09 сен '13 в 19:45
1
ответ
Использование WordNet для определения семантического сходства между двумя текстами?
Как вы можете определить семантическое сходство между двумя текстами в Python, используя WordNet? Очевидная предварительная обработка будет состоять в удалении стоп-слов и переноса, но что тогда? Единственный способ, которым я могу придумать, - это …
13 июл '12 в 02:35
1
ответ
Как управлять семантическим правилом объявления переменных в зубрах
Я должен построить компилятор, который переводит язык Java в Pyhton. Я использую инструменты Flex и Bison. Я создал гибкий файл и определил синтаксическую грамматику в Bison для некоторых ограничений, которые я должен реализовать (например, массив, …
29 авг '18 в 10:08
1
ответ
Есть ли в Stanford NLP Parser методы для семантической маркировки ролей?
Я пытаюсь найти смысловые метки английских предложений. Я использую анализатор Stanford NLP. Есть ли у него методы для этого? Я просматривал документацию, но самое близкое, что я мог найти, было: CoreAnnotations.SemanticWordAnnotation CoreAnnotation…
29 июн '15 в 14:22
2
ответа
Семантический анализ твитов
Я знаю, как общаться с твиттером и как получать твиты, но я ищу дальнейшую работу над этими твитами. У меня есть две категории еды и спорта. Теперь я хочу разделить твиты на еду и спорт. Может кто-нибудь предложить мне, как классифицировать на основ…
14 фев '13 в 10:45
0
ответов
Структура байтов
Исходя из данной ситуации, мы можем сказать, что мы можем объявить массив структур по-разному. Как я заключаю, разница заключается в оптимизации пространства, а именно в следующем: struct { /* 1600 bytes */ int a, c, e; char b, d; } array_of_struct …
19 апр '12 в 10:02
2
ответа
Расстояние между значениями двух предложений
Я ищу способ измерить семантическое расстояние между двумя предложениями. Предположим, у нас есть следующие предложения: (S1) The beautiful cherry blossoms in Japan. (S2) The beautiful Japan. S2 создается из S1 путем исключения слов "вишня", "цветет…
16 апр '14 в 19:02
1
ответ
Представление текстовых объектов в виде векторов для SVM
Я изучаю задачу Semantic Role Labeling (SRL). Я много читал, и теперь я сталкиваюсь с проблемой того, как представлять текстовые объекты как векторы. Например, для предложения: We like Stackru very much учитывая предикатный глагол: likeНекоторые фун…
01 ноя '14 в 07:40
1
ответ
Абстрактное синтаксическое дерево - Фазы компилятора
На вход семантического анализатора входит AST (синтаксическое дерево асбракта). У меня вопрос: вывод семантического анализатора - это тот же оформленный AST, или должно быть новое дерево? Как называется это дерево? Чтобы создать это новое дерево, мо…
04 май '14 в 17:12
1
ответ
Наименьшее количество контейнеров, которые содержат все заданные элементы
Предполагать C относится к набору контейнеров {c1,c2,c3....cn}где каждый из этих контейнеров содержит конечный набор целых чисел {i1,i2,i3...im}, Кроме того, предположим, что целое число может существовать в нескольких контейнерах. Учитывая конечный…
25 авг '12 в 16:23
0
ответов
Независимая от языка клавиатура: культивирование нейтрального текста на английском языке -kbd без таких вещей, как умлаут?
Мне нравится использовать американскую клавиатуру Dvorak International при программировании - каждое руководство, каждую документацию, а также программировать с ней. Я схожу с ума от своих учителей, потому что время от времени они требуют, чтобы я п…
17 ноя '12 в 19:15
1
ответ
Система маркировки семантических ролей с использованием SVM
Может кто-нибудь сказать мне рабочий SRL(Semantic Role Label) на основе классификатора SVM? Python или Java предпочтительнее. Мое намерение состоит в том, чтобы узнать, как особенности в предложениях представлены в виде векторов, учитывая предикатны…
01 ноя '14 в 07:30
2
ответа
Каков наилучший способ в Java для анализа семантических данных из источника?
Я хотел бы прочитать и разобрать размеченный текст (возможно, микроформат, микроданные, rdf или аналогичные). Должен ли я создать свой собственный анализатор или есть какая-либо библиотека Java, которая может помочь с этим?
20 сен '11 в 12:53
0
ответов
Кто-нибудь знает о каких-либо хороших библиотеках семантического анализа для определения, является ли посылка законным предложением, а не просто искаженными словами?
Привет, у меня есть куча текста, который мне нужно проанализировать, и я хочу определить, законные ли это предложения или просто искаженные слова. Интересно, существует ли этот тип библиотеки и есть ли у кого-нибудь рекс?
28 авг '18 в 19:33
2
ответа
Компиляторы - выбор инструкций для объявлений типов в AST
Я изучаю компиляторы и создаю генератор кода для простого языка, который работает с двумя типами: символами и целыми числами. После того, как пользовательский ввод был отсканирован сканером, а затем проанализирован синтаксическим анализатором, я пол…
18 ноя '11 в 14:57
3
ответа
Найти похожие тексты на основе обнаружения перефразирования
Я заинтересован в поиске подобного контента (текста) на основе перефразирования. Как мне это сделать? Существуют ли какие-либо конкретные инструменты, которые могут сделать это? В питоне желательно.
18 янв '14 в 15:25
1
ответ
Как определить прилагательные или наречия?
Я довольно новичок в НЛП.... Есть ли какой-либо API или способ, которым я мог бы определить глагол или прилагательное или наречия из предложения? Мне это нужно в проекте?
01 сен '12 в 16:57
1
ответ
Рамки для семантической аннотации для определяемой пользователем модели домена
У меня есть некоторые документы и онтология для некоторых понятий. Существуют ли какие-либо структуры, которые автоматически извлекают эти понятия из данных документов и создают тройки? Онтология должна содержать специальные свойства? Я нашел UIMA, …
08 ноя '11 в 16:57
2
ответа
Повторное использование таблицы символов из фазы семантического анализа для генерации кода
В настоящее время я создаю компилятор для языка, который имеет глобальную переменную и функцию вложенных подпрограмм. Раньше я только когда-либо создавал компилятор для языков, в котором есть только локальная переменная без вложенной подпрограммы. У…
03 фев '16 в 19:05
1
ответ
Ошибка при установке 'terrier3.5'
Я пытаюсь установить терьера 3.5. При этом я получаю следующую ошибку и не знаю, что делать, чтобы это исправить. terrier-3.5/lib/fastutil5-5.0.9.jar terrier-3.5/lib/findbugs-1.3.2-annotations.jar terrier-3.5/lib/hadoop-0.20.2+228-core.jar gzip: std…
13 июн '13 в 06:59