Существуют ли какие-либо правила идентификатора синтаксиса Wordnet?

Я новичок в базе данных Imagenet и Wordnet. Я пытаюсь более классифицировать изображения и категории Imagenet (например, "растение", "рыба", "люди", ...).

Я понимаю, что изображения могут быть загружены на http://www.image-net.org/synset?wnid=[wnid]и этот файл сопоставляет идентификатор набора с соответствующими именами, но существуют ли какие-либо правила, регулирующие идентификаторы (например, означает ли каждое число идентификатора некоторую категорию или подкатегорию?).

2 ответа

Как говорится в официальной документации API, wnid - это идентификация в ImageNet, а не nltk. Вы можете отобразить слово в wnid в соответствии с отображением между ImageNet и WordNet в документации API.

Чтобы однозначно идентифицировать синтаксис, мы используем "WordNet ID" (wnid), который представляет собой конкатенацию POS (то есть части речи) и SYNSET OFFSET WordNet.

Во-первых, получите синапсы и смещения в nltk:

from nltk.corpus import wordnet as wn

plant_list = wn.synsets('plant')
# plant_list is: [Synset('plant.n.01'), Synset('plant.n.02'), Synset('plant.n.03'), Synset('plant.n.04'), Synset('plant.v.01'), Synset('implant.v.01'), Synset('establish.v.02'), Synset('plant.v.04'), Synset('plant.v.05'), Synset('plant.v.06')]

offset = plant_list[0].offset()

Во-вторых, объединить POS и сместить

Поскольку в ImageNet учитываются только существительные, просто выберите синтаксис существительных в plant_list и объединить wnid = "n{:08d}".format(offset) чтобы получить wnid,

Поскольку есть список синтаксисов, вы получите несколько wnid для "завода".

По состоянию на 11 марта 2021 года Imagenet публично заявил:

Новый сайт проще; мы удалили второстепенные или устаревшие функции, чтобы сосредоточиться на основном варианте использования, позволяя пользователям загружать данные, включая полный набор данных ImageNet и задачу ImageNet Large Scale Visual Recognition Challenge (ILSVRC).Источник

Это означает, что теперь необходимо использовать любые службы, использующие так называемую «официальную документацию» для синтаксического анализа и поиска изображений в сети (вопреки ответу на плакате выше).

Это было подтверждено только после того, как я отправил заявку в службу поддержки после того, как моя служба начала возвращать все сообщения 404 следующим образом:

      Begin forwarded message:

From: ImageNet Support <imagenet.help.desk@gmail.com>
Subject: Re: wordnet api
Date: March 16, 2021 at 11:21:37 AM EDT
To: Aaron Soellinger <me@me>

Unfortunately we have updated the website and do not maintain these APIs any more. Any URLs from the old website may become invalid if they are not on the new website. For your use case, a workaround may be to query the WordNet hierarchy, e.g., by using the WordNet NLTK interface. 

On Tue, Mar 16, 2021 at 11:18 AM Aaron Soellinger <me@me> wrote:
below:

ss = 'http://www.image-net.org/synset?wnid={wnid}'
hyp = 'http://www.image-net.org/api/text/wordnet.structure.hyponym?wnid={wnid}'
word = 'http://www.image-net.org/api/text/wordnet.synset.getwords?wnid={wnid}'
mapg = 'http://www.image-net.org/api/text/imagenet.synset.geturls.getmapping?wnid={wnid}'
urlf = 'http://www.image-net.org/api/text/imagenet.synset.geturls?wnid={wnid}'

On Mar 16, 2021, at 11:17 AM, ImageNet Support <imagenet.help.desk@gmail.com> wrote:

Hello Aaron,

What is the URL of the API?

Best, 

On Tue, Mar 16, 2021 at 8:15 AM Aaron Soellinger <me> wrote:
Hi,

I was using the wordnet api found at image-net.org/api ..  I have noticed that it no longer works.  All my links return 404s. 

Can you help?

—aaron

Итак, да, Это.

Другие вопросы по тегам