Идентичность записи Python
Проблема, аналогичная R-идентификатору, но в python. Алгоритм генерирует новую идентичность, которая не отражает правильную идентичность записей, которые были совпадают. Предполагая дублирование данных с одним кадром данных.
PS: в примере с дублированием данных все в порядке
1 ответ
Столбец индекса, сгенерированный с помощью pandas, необходимо удалить и заменить предпочтительным столбцом в кадре данных, чтобы использовать его в качестве столбца идентификации.
Логика есть
replace index column with identify column in dataframe