Как мне создать новую таблицу данных в Orange?
Я использую Orange (в Python) для некоторых задач интеллектуального анализа данных. Более конкретно, для кластеризации. Несмотря на то, что я прошел учебник и прочитал большую часть документации, у меня все еще есть проблема. Все примеры в документах и руководствах предполагают, что у меня есть таблица с разделителями табуляции с данными в ней. Тем не менее, ничего не говорится о том, как можно создать новую таблицу с нуля. Например, я хочу создать таблицу частот слов в разных документах.
Может быть, я что-то упускаю, так что если у кого-то есть понимание, это будет оценено.
Спасибо Джордж
РЕДАКТИРОВАТЬ:
Вот как я создаю свою таблицу
#First construct the domain object (top row)
vars = []
for var in variables:
vars.append(Orange.data.variable.Continuous(str(var)))
domain = Orange.data.Domain(vars, classed) #The second argument indicated that the last attr must not be a class
#Add data rows assuming we have a matrix
t = Orange.data.Table(domain, matrix)
2 ответа
Это заняло у меня несколько часов, чтобы понять. В Python сделайте это:
Import Orange
List, Of, Column, Variables = [Orange.feature.Discrete(x) for x in ['What','Theyre','Called','AsStrings']]
Domain = Orange.data.Domain([List, Of, Column, Variables])
Table = Orange.data.Table(Domain)
Table.save('NewTable.tab')
Я бы сказал вам, что делает каждый бит кода, но на данный момент я не совсем уверен. Забавно, что такой мощный инструментарий должен иметь такую сложную для понимания документацию, но я подозреваю, что это потому, что вся его база пользователей имеет докторские степени.
Документация действительно недостаточна, если вы спросите меня. Возможно, это не ответ на вопрос, но это может быть полезно для кого-то еще. Я часами пытался создать Таблицу, используя конструкторы и Домены, а что нет, только для задачи извлечения правил ассоциации, и, наконец, обнаружил, что самый простой способ создать таблицу - просто записать ваши данные в файл с расширением.tab. или.basket и создайте таблицу из этого.
Orange.data.Table("yourFile.basket")
Конечно, структура файла должна быть правильной. Смотрите предоставленные файлы примеров, расположенные в каталоге пакетов Orange внутри наборов данных /