Как реализуется программа one-hot? Массив единиц и нулей или это просто число?
Итак, я изучаю ML и слышал об одном горячем кодировании. Я в порядке с концепцией, но у меня есть сомнения по поводу реализации...
Скажем, у нас есть словарь 10000, и мы кодируем слова с ним. Использование одного горячего означает, что каждое слово является вектором, поэтому:
- первое слово: [1,0,0,...]
- второе слово: [0,1,0,...]
- и т.п.
Мне кажется немного странным хранить каждое слово, используя 10000 бит... Я бы использовал 11 бит для каждого слова, потому что 10000 в двоичном коде - это 111 0001 0000. Таким образом:
- первое слово: 000 0000 0001
- второе слово: 000 0000 0010
- третье слово: 000 0000 0011
(Или вы можете начать отсчет с 0: 000 0000 0000)
Это как то горячее реализовано?