Python

Como Iterar Dataframe no Pandas

Neste tutorial veremos como iterar em linhas os DataFrames do Pandas, usando os métodos iterrows() e itertuples().


Introdução

Neste breve tutorial veremos como Iterar Dataframe no Pandas, mostrarei de forma rápida e prática como iterar um Dataframe no Pandas usando para isso os métodos iterrows e itertuples.

 

O que é o Python?

 

O Python é uma linguagem de programação de alto nível, interpretada, orientada a objetos, funcional, e possui uma tipagem tanto dinâmica quanto forte. O Python foi lançada em 1991 e seu criador foi Guido Van Rossum.

 

O que é o Pandas?

 

O Pandas é uma biblioteca da linguagem Python, com intuito de facilitar a manipulação e análise de dados.

 

Requisitos para execução deste tutorial:

  • Python 3.x;
  • Pandas;

 

 

Iteração utilizando o método DataFrame.iterrows()

 

No método(iterrows) cada iteração será retornado um índice e uma série que representando os valores da linha do dataframe.

Vamos ao primeiro exemplo de iteração de Dataframe do pandas neste exemplo será utilizado o método (iterrows), para iterar cada linha do dataframe e assim conseguir manipular as informações deste dataframe.

Para isso segue abaixo o código utilizado para este exemplo:

 

# Importa a lib do Pandas
import pandas as pd
  
# Cria uma lista de dictionary, para realizar os testes
list_df = [{'nome':'Ana', 'idade': 25},
            {'nome':'Paulo', 'idade':40},
            {'nome':'Ivan', 'idade':32}]
  
# Cria um dataframe com a lista criada
df = pd.DataFrame(list_df)
# Imprime o dataframe criado
print('DataFrame: \n', df)
  
# Itera o dataframe usando o metódo iterrows()
print('\n Linhas Iteradas usando o metódo iterrows() : ')
for index, row in df.iterrows():
    print(row['nome'], row['idade'])            

Executando o  código acima será gerado no console do terminal a saída abaixo :

 

DataFrame: 
    nome   idade
0   Ana    25 
1   Paulo  40 
2   Ivan   32
Linhas Iteradas usando o método iterrows() :
Ana 25
Paulo 40
Ivan 32
            

 

Iteração utilizando o método DataFrame.itertuples():

 

O método(itertuples) ,  geralmente é mais eficiente do que o método(iterrows) , porque ele retorna as linhas como tuplas nomeadas ao invés de séries, o que acaba consumindo menos memória.

Para o segundo exemplo de iteração de Dataframe do pandas será utilizado o método (itertuples), para iterar cada linha do dataframe e assim conseguir manipular as informações deste dataframe.

Segue abaixo o código utilizado para o segundo exemplo de iteração com o método (itertuples) :

 

# Importa a lib do Pandas
import pandas as pd
  
# Cria uma lista de dictionary, para realizar os testes
list_df = [{'nome':'Ana', 'idade': 25},
            {'nome':'Paulo', 'idade':40},
            {'nome':'Ivan', 'idade':32}]
  
# Cria um dataframe com a lista criada
df = pd.DataFrame(list_df)
# Imprimi o dataframe criado
print('DataFrame: \n', df)
  
# Itera o dataframe usando o metódo itertuples()
print('\n Linhas Iteradas usando o metódo itertuples() : ')
for row in df.itertuples():
    print(getattr(row, 'nome'), getattr(row, 'idade'))             

Ao executar o  código acima será gerado no console do terminal a saída abaixo :

 

DataFrame: 
    nome   idade
0   Ana    25
1   Paulo  40
2   Ivan   32

Linhas Iteradas usando o metódo itertuples() :
Ana 25
Paulo 40
Ivan 32            

 

Este foi um breve tutorial mostrando como realizar uma iteração em um Dataframe do pandas de forma rápida, existe várias formas de realizar essa iteração más abordei a mais utilizada, vou deixar abaixo o link com as referências utilizadas neste turorial. 

 

Referências:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *