Pandas основные объекты. Series

Series — это одномерный помеченный массив, способный хранить данные любого типа.

ПараметрОписание
dataмассив данные принимают различные формы, такие как ndarray, list, constants
indexзначения индекса должны быть уникальными и иметь хешируемую длину и соответствовать данным.
dtypedtype для типа данных. Если None, то определяется автоматически
copyкопирование данных, по-умолчание false
import pandas as pd

Series может быть создана с помощью следующего конструктора

data = pd.Series([0.25, 0.5, 0.75, 1.0])
print(data)
0    0.25
1    0.50
2    0.75
3    1.00
dtype: float64

Как мы видим из выходных данных, Series оборачивает как последовательность значений, так и последовательность индексов, к которым мы можем обращаться с помощью values и атрибутов index.

При вызове values выводится все значение.

print(data.values)
array([ 0.25,  0.5 ,  0.75,  1.  ])

А при index возрождается объект RangeIndex.

print(data.index)
RangeIndex(start=0, stop=4, step=1)

Доступ к данным можно получить с помощью ассоциированного индекса через знакомую запись в квадратных скобках Python:

data[1]
0.5

или

data[1:3]
1    0.50
2    0.75
dtype: float64

А также доступ осуществляется с использованием .loc или .iloc.

data = pd.Series(['Понедельник', 'Вторник', 'Cреда', 'Четверг'],
                 index = ['Первый', "Второй", "Третий", "Четвёртый"])

.loc в него принимают указатель индекс или массив указателей. Например:

data.loc["Первый"]
data.loc[["Первый", "Третий"]]

А в .iloc принимает индекс или массив индексов

data.iloc[0]
data.iloc[[0, 2]]

Если в .loc передать название индекса, а в .iloc номер индекса, которого нет в данных, то будет вызвана ошибка.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *