Как реализуется программа one-hot? Массив единиц и нулей или это просто число?

Итак, я изучаю ML и слышал об одном горячем кодировании. Я в порядке с концепцией, но у меня есть сомнения по поводу реализации...

Скажем, у нас есть словарь 10000, и мы кодируем слова с ним. Использование одного горячего означает, что каждое слово является вектором, поэтому:

  • первое слово: [1,0,0,...]
  • второе слово: [0,1,0,...]
  • и т.п.

Мне кажется немного странным хранить каждое слово, используя 10000 бит... Я бы использовал 11 бит для каждого слова, потому что 10000 в двоичном коде - это 111 0001 0000. Таким образом:

  • первое слово: 000 0000 0001
  • второе слово: 000 0000 0010
  • третье слово: 000 0000 0011

(Или вы можете начать отсчет с 0: 000 0000 0000)

Это как то горячее реализовано?

0 ответов

Другие вопросы по тегам