Series — это одномерный помеченный массив, способный хранить данные любого типа.
Параметр | Описание |
data | массив данные принимают различные формы, такие как ndarray, list, constants |
index | значения индекса должны быть уникальными и иметь хешируемую длину и соответствовать данным. |
dtype | dtype для типа данных. Если None, то определяется автоматически |
copy | копирование данных, по-умолчание false |
import pandas as pd
Series может быть создана с помощью следующего конструктора
data = pd.Series([0.25, 0.5, 0.75, 1.0])
print(data)
0 0.25
1 0.50
2 0.75
3 1.00
dtype: float64
Как мы видим из выходных данных, Series оборачивает как последовательность значений, так и последовательность индексов, к которым мы можем обращаться с помощью values и атрибутов index.
При вызове values выводится все значение.
print(data.values)
array([ 0.25, 0.5 , 0.75, 1. ])
А при index возрождается объект RangeIndex.
print(data.index)
RangeIndex(start=0, stop=4, step=1)
Доступ к данным можно получить с помощью ассоциированного индекса через знакомую запись в квадратных скобках Python:
data[1]
0.5
или
data[1:3]
1 0.50
2 0.75
dtype: float64
А также доступ осуществляется с использованием .loc или .iloc.
data = pd.Series(['Понедельник', 'Вторник', 'Cреда', 'Четверг'],
index = ['Первый', "Второй", "Третий", "Четвёртый"])
.loc в него принимают указатель индекс или массив указателей. Например:
data.loc["Первый"]
data.loc[["Первый", "Третий"]]
А в .iloc принимает индекс или массив индексов
data.iloc[0]
data.iloc[[0, 2]]
Если в .loc передать название индекса, а в .iloc номер индекса, которого нет в данных, то будет вызвана ошибка.