Como criar Pivottable com pandas
Neste tutorial veremos como criar Pivottable com pandas.
Introdução
Neste artigo vou mostrar como criar e como popular um Pivotable no Python usando somente a lib do Pandas, será um tutorial breve mas muito útil para organização de dados onde uma tabela no padrão normal não é útil .
O que é o Python?
O Python é uma linguagem de programação de alto nível, interpretada, orientada a objetos, funcional, e possui uma tipagem tanto dinâmica quanto forte. O Python foi lançada em 1991 e seu criador foi Guido Van Rossum.
O que é o Pandas?
Para que server o Pandas, O Pandas nada mais é que uma biblioteca da linguagem Python com intuito de facilitar a manipulação e análise de dados muito utilizada para ciência de dados .
Os requisitos para execução deste tutorial são:
- Python 3.x;
- Pandas;
O que é uma PivotTable
A PivotTable é um estilo de tabela amplamente utilizada em ambientes de negócios, análise de dados e relatórios, servindo para transformar grandes volumes de dados brutos em informações úteis e compreensíveis.
Com isso a PivotTable nos permite a reorganização e a sumarização de grandes conjuntos de dados, facilitando a compreensão e a extração de insights significativos.
Como criar Pivottable com Pandas
Antes de iniciar a codificação precisamos ter instaler a lib do Pandas
para isto basta digitar os comandos abaixo no terminal:
pip install pandas
Após a instalação da lib, podemos iniciar a implementação do código, primeiro vamos importa a lib do Pandas:
import pandas as pd
Logo após a importação do pandas no inicio do código, já podemos definir os dados do nosso dataframe:
df = pd.DataFrame({ 'ano': [2021,2022,2021,2022,2021,2022],
'mes': ['Jan', 'Fev','Fev', 'Fev', 'Mar','Mar'],
'usuarios': [215,167,123,193,235,241]})
Com o dataframe criado, para conseguir imprimir as informações no terminal usamos a função (print
) do Python:
print(df)
#### Saída:
ano mes usuarios
0 2021 Jan 215
1 2022 Fev 167
2 2021 Fev 123
3 2022 Fev 193
4 2021 Mar 235
5 2022 Mar 241
Com isso vamos para transformação do nosso dataframe criado em uma pivottable com agregação, para isso vamos utilizar a função pivot_table
do pandas, segue abaixo o código:
pivotTable = df.pivot_table(values = 'usuarios', index = 'mes', columns = 'ano', aggfunc = 'sum')
print(pivotTable)
#### Saída:
ano 2021 2022
mes
Fev 123.0 360.0
Jan 215.0 NaN
Mar 235.0 241.0
Descrição dos parâmetros da função pivot_table
- values: Serve para identificar os valores da tabela;
- index: Serve para identificar o índice da tabela;
- columns: Serve para identificar as colunas da tabela;
- aggfunc: Esse parâmetro serve para informa o tipo de agregação que será utilizado, quando houver índices com a mesma informação, no caso acima estou somando os valores que ocorrem no mesmo mês/ano;
Código fonte do tutorial: