Агрегация данных из CSV-файла с использованием Pandas Python

Мне нужно обработать данные из файла csv таким образом, чтобы выходные данные выводили три столбца, например c1,c2 и c3, где c1 и c2 должны использовать выражение group by, как в mysql, а c3 - сумма двух других столбцов.

Я новичок в Python, идеи действительно помогут мне.

1 ответ

Я сделал немного этого в C#. Сначала вы открываете файл и начинаете читать строки текста. Первая строка в.csv должна быть столбцом заголовка, поэтому обрабатывайте это отдельно. Следующие строки должны быть ваши данные.

Теперь, когда у вас есть строка текста, вставьте ее в строку, а затем разделите запятыми. Это даст вам массив строк. Затем создайте массив int, преобразовав строки в текст. Это не должно быть проблемой, если все данные в столбце являются целыми числами. Если нет, проверьте не целочисленные значения и преобразуйте их в строки, которые являются допустимыми значениями. Например, если array[0] == "no data" array[0] = "0", или array[0] = null. Затем создайте столбец 3, сложив целочисленные значения для первого и второго столбцов вместе.

Другие вопросы по тегам