Оранжевые таблицы данных - объединение 2 таблиц

Я пытался скопировать одну таблицу данных без столбца решений во вторую таблицу, затем перетасовать данные и объединить эти две таблицы в одну. Я не могу достичь этого, потому что я получаю ошибки. Оранжевая документация, на мой взгляд, недостаточно хороша, и я не знаю, как этого добиться. Вот мой код и ошибка, которую я получаю. Если кто-нибудь знает, как это сделать, пожалуйста, помогите мне.

db_name = "titanic"
data = Orange.data.Table(db_name)

new_domain = data

input_domain = new_domain.domain

all_vars = (list(input_domain.variables) +
            list(input_domain.class_vars) +
            input_domain.getmetas().values())

edited_vars = []

# Apply any saved transformations as listed in
# `domain_change_hints`
import OWEditDomain

for var in range(len(all_vars)-1):
    for x in range(len(all_vars[var].values)):
        all_vars[var].values[x] +='_1'

    all_vars[var].name += '_1'

    desc = OWEditDomain.variable_description(all_vars[var])

    try:
        new = OWEditDomain.variable_from_description(desc)
    except ValueError, ex:
        new = None

    if new is not None:
        # Make  sure orange's domain transformations will work.
        new.source_variable = all_vars[var]
        new.get_value_from =               Orange.core.ClassifierFromVar(whichVar=all_vars[var])
        all_vars[var] = new

    edited_vars.append(all_vars[var])

tabela = Orange.data.Table(new_domain, edited_vars)

tabela.shuffle()

data = Orange.data.Table(db_name)

merged = Orange.data.Table([data, tabela])
#
print "Domain 1: ", data.domain
print "Domain 2: ", tabela.domain
print "Merged:   ", merged.domain

Ошибка:

Traceback (most recent call last):
  File "C:/Python27/Lib/site-packages/Orange/OrangeWidgets/Classify/OWCN2.py", line 412, in <module>
    merged = Orange.data.Table([data, tabela])
orange.KernelException: 'orange.ExampleTable': mismatching value of attribute 'survived' in example #0

1 ответ

Попробуй это

def clone_var(var, namefmt="%s"):
    if isinstance(var, Orange.feature.Discrete):
        newvar = Orange.feature.Discrete(namefmt % var.name, values=var.values)
    elif isinstance(var, Orange.feature.Continuous):
        newvar = Orange.feature.Continuous(namefmt % var.name)
        newvar.number_of_decimals = var.number_of_decimals
        newvar.scientific_format = var.scientific_format
    elif isinstance(var, Orange.feature.String):
        newvar = Orange.feature.String(namefmt % var.name)
    else:
        raise TypeError
    newvar.attributes = dict(var.attributes)
    return newvar


def clone_table(table):
    features = [clone_var(var, "%s_1") for var in table.domain.features]
    if table.domain.class_var is not None:
        class_var = clone_var(table.domain.class_var, "%s_1")
    else:
        class_var = None
    class_vars = [clone_var(var, "%s_1") for var in table.domain.class_vars]
    domain = Orange.data.Domain(features, class_var, class_vars=class_vars)
    return Orange.data.Table(domain, table.native(2))

# copy of table without the class column
table_nocls = Orange.data.Table(Orange.data.Domain(table.domain.features, None), table)
# clone it, creating new variables, and shuffle
table_clone = clone_table(table_nocls)
table_clone.shuffle()

merged = Orange.data.Table([table, table_clone])
Другие вопросы по тегам