Описание тега pandas

Pandas- это библиотека Python для обработки и анализа данных, например фреймов данных, многомерных временных рядов и перекрестных наборов данных, обычно используемых в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas- одна из основных библиотек науки о данных в Python.

pandas - это библиотека Python для манипулирования и анализа PAN-el DA-ta, то есть многомерных временных рядов и наборов перекрестных данных, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах.pandasреализовано в основном с использованием NumPy и Cython; он предназначен для очень простой интеграции с научными библиотеками на основе NumPy, такими как statsmodels.

Чтобы создать воспроизводимый пример панд:

Основные особенности:

  • Структуры данных: для одно- и двумерных помеченных наборов данных (соответственно Series а также DataFrames). Некоторые из их основных функций включают в себя:
  • Автоматическое выравнивание данных и интерполяция
  • Обработка недостающих наблюдений в расчетах
  • Удобные функции нарезки и изменения формы ("переиндексации")
  • Категориальные типы данных
  • Предоставлять функцию агрегирования или преобразования "группировка по"
  • Инструменты для слияния / объединения наборов данных
  • Простая интеграция с https://matplotlib.org/ для построения графиков и графиков
  • Мультииндексирование обеспечивает структуру индексов, которая позволяет представлять произвольное количество измерений.
  • Инструменты даты: объекты для выражения смещения дат или создания диапазонов дат; некоторые функции аналогичны scikits.timeseries. Даты могут быть привязаны к определенному часовому поясу и преобразованы / сравнены по желанию
  • Статистические модели: удобные реализации обычного метода наименьших квадратов и панельной МНК для внутривыборочных или скользящих временных рядов / поперечных регрессий. Мы надеемся, что это станет отправной точкой для внедрения моделей.
  • Интеллектуальная разгрузка Cython; сложные вычисления выполняются быстро благодаря этим оптимизациям.
  • Статические и подвижные статистические инструменты: среднее значение, стандартное отклонение, корреляция, ковариация
  • Расширенная пользовательская документация с использованием Sphinx

Задавать вопросы:

Полезные каноники:

Ресурсы и руководства:

Книги: