Python

Como criar Pivottable com pandas

Neste tutorial veremos como criar Pivottable com pandas.


como criar pivottable com pandas
como criar pivottable com pandas

Introdução

Neste artigo vou mostrar como criar e como popular um Pivotable no Python usando somente a lib do Pandas, será um tutorial breve mas muito útil para organização de dados onde uma tabela no padrão normal não é útil  .

 

O que é o Python?

 

O Python é uma linguagem de programação de alto nível, interpretada, orientada a objetos, funcional, e possui uma tipagem tanto dinâmica quanto forte. O Python foi lançada em 1991 e seu criador foi Guido Van Rossum.

 

O que é o Pandas?

 

Para que server o Pandas, O Pandas nada mais  é que uma biblioteca da linguagem Python com intuito de facilitar a manipulação e análise de dados muito utilizada para ciência de dados .

 

Os requisitos para execução deste tutorial são:

 

  • Python 3.x;
  • Pandas;

 

O que é  uma PivotTable

 

A PivotTable é um estilo de tabela amplamente utilizada em ambientes de negócios, análise de dados e relatórios, servindo para transformar grandes volumes de dados brutos em informações úteis e compreensíveis.

Com isso a PivotTable nos permite a reorganização e a sumarização de grandes conjuntos de dados, facilitando a compreensão e a extração de insights significativos.

 

Como criar Pivottable com Pandas

 

Antes de iniciar a codificação precisamos ter instaler a lib do Pandas para isto basta digitar os comandos abaixo no terminal:

 

pip install pandas

 

Após a instalação da lib, podemos iniciar a implementação do código, primeiro vamos importa a lib do Pandas:

 

import pandas as pd

 

Logo após a importação do pandas no inicio do código, já podemos definir os dados do nosso dataframe:

 

df = pd.DataFrame({ 'ano': [2021,2022,2021,2022,2021,2022],
                    'mes': ['Jan', 'Fev','Fev', 'Fev', 'Mar','Mar'],
                    'usuarios': [215,167,123,193,235,241]})

 

Com o dataframe criado, para conseguir imprimir as informações no terminal usamos a função (print) do Python:

print(df)

#### Saída:

      ano   mes     usuarios
0     2021  Jan     215
1     2022  Fev     167
2     2021  Fev     123
3     2022  Fev     193
4     2021  Mar     235
5     2022  Mar     241

 

Com isso vamos para transformação do nosso dataframe criado em uma pivottable com agregação, para isso vamos utilizar a função pivot_table do pandas, segue abaixo o código:

 

pivotTable = df.pivot_table(values = 'usuarios', index = 'mes', columns = 'ano', aggfunc = 'sum')

print(pivotTable)

#### Saída:

ano   2021   2022
mes
Fev  123.0  360.0
Jan  215.0    NaN
Mar  235.0  241.0

 

Descrição dos parâmetros da função pivot_table

  • values: Serve para identificar os valores da tabela;
  • index: Serve para identificar o índice da tabela;
  • columns: Serve para identificar as colunas da tabela;
  • aggfunc: Esse parâmetro serve para informa o tipo de agregação que será utilizado, quando houver índices com a mesma informação, no caso acima estou somando os valores que ocorrem no mesmo mês/ano;

 

 

Código fonte do tutorial:

Código Fonte

 

Referências:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *