Como ler planilha Excel com Pandas
Neste tutorial veremos os dados de uma planilha do excel, utilizando a lib do pandas.
IntroduĂ§Ă£o
Neste artigo, demonstrarei como utilizar a biblioteca Pandas para ler dados de uma planilha Excel em Python. Este tutorial breve destaca a simplicidade de acessar os dados usando Pandas e a biblioteca Xlrd
O que Ă© o Pandas?
 O Pandas Ă© uma biblioteca da linguagem Python, com intuito de facilitar a manipulaĂ§Ă£o e anĂ¡lise de dados, muito utilizada por cientista de dados.
Para execuĂ§Ă£o deste tutorial serĂ¡ necessĂ¡rio os requisitos abaixo:
- Python;
- Pandas;
- Xlrd (lib utilizada para manipular arquivos xls…);
Como ler uma planilha do excel com Pandas
Antes de iniciarmos a codificaĂ§Ă£o precisamos ter instalada as libs do Pandas e do Xlrd. Para instalarmos basta abrir o terminal de comandos e digitar as seguintes instruções:
pip install pandas
pip install xlrd
ApĂ³s a instalarmos as libs podemos iniciar a implementaĂ§Ă£o do cĂ³digo, entĂ£o 1ª Importamos a lib do Pandas no inicio do cĂ³digo:
import pandas as pd
Depois informamos o nome do arquivo que serĂ¡ lido:
file_name = "dados.xls"
ApĂ³s armazenamos o nome do arquivo a ser lido na varĂ¡vel (file_name) jĂ¡ podemos definir a variĂ¡vel que corresponderĂ¡ a linha do cabeçalho da tabela, precisamos sempre lembrar que as linhas no Excel a contagem começa no nĂºmero "0".
header = 0
ApĂ³s a definiĂ§Ă£o do cabeçalho para leitura do arquivo utlizaremis a funĂ§Ă£o (read_excel) do pandas, passando em seus parĂ¢metros o nome do arquivo a ser lido e a variĂ¡vel que contĂ©m a identificaĂ§Ă£o do cabeçalho.
Ao executarmos a funĂ§Ă£o (read_excel) ela nos retornarĂ¡ um dataframe com as informações contidas no arquivo que acabamos de ler.
df = pd.read_excel(file_name, header = header)
Pronto apĂ³s a leitura do arquivo com a funĂ§Ă£o (read_excel) e armazenamos a informaĂ§Ă£o na variĂ¡vel df, podemos imprimir o cabeçalho da tabela, para isso utilizamos a funĂ§Ă£o df.columns do Pandas, conforme mostrado abaixo;
print(df.columns)
#SaĂda:
Index(['Order', 'Name', 'Sexo', 'Date'], dtype='object')
Para conseguirmos imprimir todo conteĂºdo da tabela basta digitar o comando (print) passando o dataframe como parĂ¢metro, segue o cĂ³digo implementado abaixo:
print(df)
#SaĂda:
Order Name Sexo Date
0 1 Paulo Santos M 2020-04-25
1 2 Lais Souza F 2022-08-05
2 3 Ana Clara F 2021-06-04
3 4 Ivan Silva M 2022-01-05
4 5 Clara Rosa F 2022-07-12
Logo abaixo mostro o cĂ³digo completo que utilizamos na execuĂ§Ă£o deste artigo:
# Importamos a lib do Pandas
import pandas as pd
# Informamos o nome do arquivo
file_name = "dados.xls"
# Atribuimos indice do cabeçalho
header = 0
# Utilizamos a funĂ§Ă£o (read_excel) do pandas, para ler o arquivo
# Passando para a funĂ§Ă£o o nome do arquivo a ser lido e informando a linha que contĂ©m o cabeçalho
df = pd.read_excel(file_name, header = header)
# Imprime o cabeçalho da tabela
print(df.columns)
# Imprime os dados da tabela
print(df)
CĂ³digo fonte do tutorial:

