Python

Como ler planilha Excel com Pandas

Neste tutorial veremos os dados de uma planilha do excel, utilizando a lib do pandas.


IntroduĂ§Ă£o

Neste artigo, demonstrarei como utilizar a biblioteca Pandas para ler dados de uma planilha Excel em Python. Este tutorial breve destaca a simplicidade de acessar os dados usando Pandas e a biblioteca Xlrd

O que Ă© o Pandas?

 

 O Pandas Ă© uma biblioteca da linguagem Python, com intuito de facilitar a manipulaĂ§Ă£o e anĂ¡lise de dados, muito utilizada por cientista de dados.

 

Para execuĂ§Ă£o deste tutorial serĂ¡ necessĂ¡rio os requisitos abaixo:

  • Python;
  • Pandas;
  • Xlrd (lib utilizada para manipular arquivos xls…);

 

Como ler uma planilha do excel com Pandas

Antes de iniciarmos a codificaĂ§Ă£o precisamos ter instalada as  libs do Pandas e do Xlrd. Para instalarmos basta  abrir o terminal de comandos e digitar as seguintes instruções:

 

pip install pandas
pip install xlrd            

 

ApĂ³s a instalarmos as libs podemos iniciar a implementaĂ§Ă£o do cĂ³digo, entĂ£o 1ª Importamos a lib do Pandas no inicio do cĂ³digo:

 

import pandas as pd

 

Depois informamos o nome do arquivo que serĂ¡ lido:

 

file_name = "dados.xls" 

 

ApĂ³s armazenamos o nome do arquivo a ser lido  na varĂ¡vel (file_name) jĂ¡ podemos definir a variĂ¡vel que corresponderĂ¡ a linha do cabeçalho da tabela, precisamos sempre lembrar que as linhas no Excel a contagem começa no nĂºmero "0".

 

header = 0

 

ApĂ³s a definiĂ§Ă£o do cabeçalho para leitura do arquivo utlizaremis a funĂ§Ă£o (read_excel) do pandas, passando em seus parĂ¢metros o nome do arquivo a ser lido e  a variĂ¡vel que contĂ©m a identificaĂ§Ă£o do cabeçalho.

Ao executarmos a funĂ§Ă£o (read_excel)  ela nos retornarĂ¡ um dataframe com as informações contidas no arquivo que acabamos de ler.

 

df = pd.read_excel(file_name,  header = header)

 

Pronto apĂ³s a leitura do arquivo com a funĂ§Ă£o (read_excel) e armazenamos a informaĂ§Ă£o na variĂ¡vel df, podemos imprimir o cabeçalho da tabela, para isso utilizamos a funĂ§Ă£o df.columns do Pandas, conforme mostrado abaixo;

 

print(df.columns)

#SaĂ­da:
Index(['Order', 'Name', 'Sexo', 'Date'], dtype='object')            

 

Para conseguirmos imprimir todo conteĂºdo da tabela basta digitar o  comando (print) passando o dataframe como parĂ¢metro, segue o cĂ³digo implementado abaixo:

 

print(df)

#SaĂ­da:
        Order   Name          Sexo    Date
0       1       Paulo Santos  M       2020-04-25
1       2       Lais Souza    F       2022-08-05
2       3       Ana Clara     F       2021-06-04
3       4       Ivan Silva    M       2022-01-05
4       5       Clara Rosa    F       2022-07-12            

 

Logo abaixo mostro o cĂ³digo completo que utilizamos na execuĂ§Ă£o deste artigo:

 

# Importamos a lib do Pandas
import pandas as pd

# Informamos o nome do arquivo
file_name = "dados.xls" 

# Atribuimos indice do cabeçalho
header = 0

# Utilizamos a funĂ§Ă£o (read_excel) do pandas, para ler o arquivo
# Passando para a funĂ§Ă£o o nome do arquivo a ser lido e informando a linha que contĂ©m o cabeçalho
df = pd.read_excel(file_name,  header = header)

# Imprime o cabeçalho da tabela
print(df.columns)
# Imprime os dados da tabela
print(df)            

 

CĂ³digo fonte do tutorial:

CĂ³digo Fonte

 

ReferĂªncias:

Leave a Reply

Your email address will not be published. Required fields are marked *