Введение в библиотеку pandas

С.В. Лемешевский (sergey.lemeshevsky at gmail.com)

Институт математики НАН Беларуси

Apr 1, 2020


Библиотека pandas содержит структуры данных и инструменты управления данными, предназначенные для очистки данных и быстрого и простого анализа данных в Python. Библиотека pandas часто используется в тандеме с инструментами для численных расчетов, такими как NumPy и SciPy, библиотеками для анализа данных, такими как statmodels и scikit-learn, и библиотеками для визуализации, такими как matplotlib.

Ниже будем использовать следующее соглашение для импорта библиотеки pandas:

import pandas as pd

Содержание

Структуры данных в pandas
      Класс Series
      Класс DataFrame
      Объекты типа Index
Основная функциональность
      Переиндексация
      Удаление записей с оси
      Арифметические операции и выравнивание данных
      Операции между объектами DataFrame и Series
      Применение функций и отображение
      Сортировка и ранжирование
      Индексация с повторяющимися метками
Описательная и сводная статистика
Чтение и запись данных
Задания
      Быстрый анализ данных
      Жертвы
      Преступления, пол и возраст
      Происхождение
      Место проишествия