Описание тега semantic-analysis

В машинном обучении семантический анализ корпуса - это задача построения структур, которые аппроксимируют концепции из большого набора документов.
2 ответа

Какая польза от Brown Corpus для измерения семантического сходства на основе WordNet?

Я сталкивался с несколькими методами измерения семантического сходства, которые используют структуру и иерархию WordNet, например, мера Цзяна и Конрата (JNC), мера Ресника (RES), мера Лин (LIN) и т. Д. Они измеряются с помощью NLTK: sim2=wn.jcn_simi…
09 сен '13 в 19:45
1 ответ

Использование WordNet для определения семантического сходства между двумя текстами?

Как вы можете определить семантическое сходство между двумя текстами в Python, используя WordNet? Очевидная предварительная обработка будет состоять в удалении стоп-слов и переноса, но что тогда? Единственный способ, которым я могу придумать, - это …
13 июл '12 в 02:35
1 ответ

Как управлять семантическим правилом объявления переменных в зубрах

Я должен построить компилятор, который переводит язык Java в Pyhton. Я использую инструменты Flex и Bison. Я создал гибкий файл и определил синтаксическую грамматику в Bison для некоторых ограничений, которые я должен реализовать (например, массив, …
1 ответ

Есть ли в Stanford NLP Parser методы для семантической маркировки ролей?

Я пытаюсь найти смысловые метки английских предложений. Я использую анализатор Stanford NLP. Есть ли у него методы для этого? Я просматривал документацию, но самое близкое, что я мог найти, было: CoreAnnotations.SemanticWordAnnotation CoreAnnotation…
29 июн '15 в 14:22
2 ответа

Семантический анализ твитов

Я знаю, как общаться с твиттером и как получать твиты, но я ищу дальнейшую работу над этими твитами. У меня есть две категории еды и спорта. Теперь я хочу разделить твиты на еду и спорт. Может кто-нибудь предложить мне, как классифицировать на основ…
14 фев '13 в 10:45
0 ответов

Структура байтов

Исходя из данной ситуации, мы можем сказать, что мы можем объявить массив структур по-разному. Как я заключаю, разница заключается в оптимизации пространства, а именно в следующем: struct { /* 1600 bytes */ int a, c, e; char b, d; } array_of_struct …
19 апр '12 в 10:02
2 ответа

Расстояние между значениями двух предложений

Я ищу способ измерить семантическое расстояние между двумя предложениями. Предположим, у нас есть следующие предложения: (S1) The beautiful cherry blossoms in Japan. (S2) The beautiful Japan. S2 создается из S1 путем исключения слов "вишня", "цветет…
16 апр '14 в 19:02
1 ответ

Представление текстовых объектов в виде векторов для SVM

Я изучаю задачу Semantic Role Labeling (SRL). Я много читал, и теперь я сталкиваюсь с проблемой того, как представлять текстовые объекты как векторы. Например, для предложения: We like Stackru very much учитывая предикатный глагол: likeНекоторые фун…
1 ответ

Абстрактное синтаксическое дерево - Фазы компилятора

На вход семантического анализатора входит AST (синтаксическое дерево асбракта). У меня вопрос: вывод семантического анализатора - это тот же оформленный AST, или должно быть новое дерево? Как называется это дерево? Чтобы создать это новое дерево, мо…
1 ответ

Наименьшее количество контейнеров, которые содержат все заданные элементы

Предполагать C относится к набору контейнеров {c1,c2,c3....cn}где каждый из этих контейнеров содержит конечный набор целых чисел {i1,i2,i3...im}, Кроме того, предположим, что целое число может существовать в нескольких контейнерах. Учитывая конечный…
0 ответов

Независимая от языка клавиатура: культивирование нейтрального текста на английском языке -kbd без таких вещей, как умлаут?

Мне нравится использовать американскую клавиатуру Dvorak International при программировании - каждое руководство, каждую документацию, а также программировать с ней. Я схожу с ума от своих учителей, потому что время от времени они требуют, чтобы я п…
1 ответ

Система маркировки семантических ролей с использованием SVM

Может кто-нибудь сказать мне рабочий SRL(Semantic Role Label) на основе классификатора SVM? Python или Java предпочтительнее. Мое намерение состоит в том, чтобы узнать, как особенности в предложениях представлены в виде векторов, учитывая предикатны…
2 ответа

Каков наилучший способ в Java для анализа семантических данных из источника?

Я хотел бы прочитать и разобрать размеченный текст (возможно, микроформат, микроданные, rdf или аналогичные). Должен ли я создать свой собственный анализатор или есть какая-либо библиотека Java, которая может помочь с этим?
20 сен '11 в 12:53
0 ответов

Кто-нибудь знает о каких-либо хороших библиотеках семантического анализа для определения, является ли посылка законным предложением, а не просто искаженными словами?

Привет, у меня есть куча текста, который мне нужно проанализировать, и я хочу определить, законные ли это предложения или просто искаженные слова. Интересно, существует ли этот тип библиотеки и есть ли у кого-нибудь рекс?
28 авг '18 в 19:33
2 ответа

Компиляторы - выбор инструкций для объявлений типов в AST

Я изучаю компиляторы и создаю генератор кода для простого языка, который работает с двумя типами: символами и целыми числами. После того, как пользовательский ввод был отсканирован сканером, а затем проанализирован синтаксическим анализатором, я пол…
3 ответа

Найти похожие тексты на основе обнаружения перефразирования

Я заинтересован в поиске подобного контента (текста) на основе перефразирования. Как мне это сделать? Существуют ли какие-либо конкретные инструменты, которые могут сделать это? В питоне желательно.
18 янв '14 в 15:25
1 ответ

Как определить прилагательные или наречия?

Я довольно новичок в НЛП.... Есть ли какой-либо API или способ, которым я мог бы определить глагол или прилагательное или наречия из предложения? Мне это нужно в проекте?
01 сен '12 в 16:57
1 ответ

Рамки для семантической аннотации для определяемой пользователем модели домена

У меня есть некоторые документы и онтология для некоторых понятий. Существуют ли какие-либо структуры, которые автоматически извлекают эти понятия из данных документов и создают тройки? Онтология должна содержать специальные свойства? Я нашел UIMA, …
2 ответа

Повторное использование таблицы символов из фазы семантического анализа для генерации кода

В настоящее время я создаю компилятор для языка, который имеет глобальную переменную и функцию вложенных подпрограмм. Раньше я только когда-либо создавал компилятор для языков, в котором есть только локальная переменная без вложенной подпрограммы. У…
1 ответ

Ошибка при установке 'terrier3.5'

Я пытаюсь установить терьера 3.5. При этом я получаю следующую ошибку и не знаю, что делать, чтобы это исправить. terrier-3.5/lib/fastutil5-5.0.9.jar terrier-3.5/lib/findbugs-1.3.2-annotations.jar terrier-3.5/lib/hadoop-0.20.2+228-core.jar gzip: std…
13 июн '13 в 06:59