Описание тега pandas
Pandas- это библиотека Python для обработки и анализа данных, например фреймов данных, многомерных временных рядов и перекрестных наборов данных, обычно используемых в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas- одна из основных библиотек науки о данных в Python.
pandas - это библиотека Python для манипулирования и анализа PAN-el DA-ta, то есть многомерных временных рядов и наборов перекрестных данных, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах.pandas
реализовано в основном с использованием NumPy и Cython; он предназначен для очень простой интеграции с научными библиотеками на основе NumPy, такими как statsmodels.
Чтобы создать воспроизводимый пример панд:
- Как сделать хорошие воспроизводимые примеры панд
- Как предоставить воспроизводимую копию вашего DataFrame с помощью to_clipboard()
Основные особенности:
- Структуры данных: для одно- и двумерных помеченных наборов данных (соответственно
Series
а такжеDataFrames
). Некоторые из их основных функций включают в себя: - Автоматическое выравнивание данных и интерполяция
- Обработка недостающих наблюдений в расчетах
- Удобные функции нарезки и изменения формы ("переиндексации")
- Категориальные типы данных
- Предоставлять функцию агрегирования или преобразования "группировка по"
- Инструменты для слияния / объединения наборов данных
- Простая интеграция с https://matplotlib.org/ для построения графиков и графиков
- Мультииндексирование обеспечивает структуру индексов, которая позволяет представлять произвольное количество измерений.
- Инструменты даты: объекты для выражения смещения дат или создания диапазонов дат; некоторые функции аналогичны scikits.timeseries. Даты могут быть привязаны к определенному часовому поясу и преобразованы / сравнены по желанию
- Статистические модели: удобные реализации обычного метода наименьших квадратов и панельной МНК для внутривыборочных или скользящих временных рядов / поперечных регрессий. Мы надеемся, что это станет отправной точкой для внедрения моделей.
- Интеллектуальная разгрузка Cython; сложные вычисления выполняются быстро благодаря этим оптимизациям.
- Статические и подвижные статистические инструменты: среднее значение, стандартное отклонение, корреляция, ковариация
- Расширенная пользовательская документация с использованием Sphinx
Задавать вопросы:
- Прежде чем задавать вопрос, убедитесь, что вы прошли через 10 минут до введения панд. Он охватывает все основные функции pandas.
- См. Этот вопрос, задавая хорошие вопросы: Как сделать хорошие воспроизводимые примеры панд
- Пожалуйста, укажите версию pandas, NumPy и сведения о платформе (при необходимости) в своих вопросах.
Полезные каноники:
- Как повернуть фрейм данных
- Слияние панд 101
- Каковы аргументы "уровни", "ключи" и имена в функции concat Pandas?
- Выберите строки в pandas MultiIndex DataFrame
- Как бороться с SettingWithCopyWarning в Pandas?
- Производительное декартово произведение (CROSS JOIN) с пандами
- Оценка динамического выражения в пандах с использованием pd.eval()
- Как мне работать с DataFrame с серией для каждого столбца