Идентичность записи Python

Проблема, аналогичная R-идентификатору, но в python. Алгоритм генерирует новую идентичность, которая не отражает правильную идентичность записей, которые были совпадают. Предполагая дублирование данных с одним кадром данных.

PS: в примере с дублированием данных все в порядке

1 ответ

Столбец индекса, сгенерированный с помощью pandas, необходимо удалить и заменить предпочтительным столбцом в кадре данных, чтобы использовать его в качестве столбца идентификации.

Логика есть

replace index column with identify column in dataframe
Другие вопросы по тегам