Проблемы при объединении обучающих данных из разных образцов
У меня есть два файла данных обучения, каждый из которых был разделен по отдельности как данные обучения и тестирования. как извлечь обучающие образцы с заданными файлами
У меня четыре файла
- file1: некоторые функции
- file2: некоторые другие функции с несколькими столбцами, общими для файла 1
Детализация на примере
столбцы файла 1 - метка времени, событие, результат,
тест 1 - это разделение данных теста из файла 1,
файл 2 столбца - метка времени, тип пользователя, eventduration, результат,
test2 содержит данные теста, разделенные из файла 2.....
Когда я это делаю, я не могу объединить тренировочные данные или тестовые данные, или я сообщаю о потере данных (внутреннее соединение) или неоднозначных данных (в случае внешнего соединения). Мне нужно выполнить логистическую регрессию с этими двумя данными
тест 1 и тест 2 - это наборы тестовых данных, которые были отдельно извлечены как тестовые данные из файла 1 и файла 2
Мне нужно выполнить логистическую регрессию на обучающих образцах и проверить ее с помощью файла 3 и файла 4. У меня проблемы с объединением из-за этого отдельного разделения. Может кто-нибудь посоветовать как можно лучше решить эту проблему?