Pandas

Explicação

Pandas é uma biblioteca do Python que permite extrair dados de diversos arquivos, como Excel, Json, HTML, SQL, etc...

A mesma possui funcionalidades voltadas para análises de dados e ferramentas de manipulação de tabelas.

Glossário

DataFrame

Estrutura para dados que é composta de duas dimensões, estas sendo linhas e colunas. Assemelha-se à uma tabela de Excel.

pd_dataframe

Series

Estrutura de dados de uma dimensão, sendo basicamente composta dos valores de uma linha ou coluna que representa apenas uma fatia do DataFrame.

pd_series

Comandos

Instalando a biblioteca
```
pip install pandas
```
Importando a biblioteca
```
import pandas as pd
```

Lendo um arquivo Excel

df = pd.read_excel("tabela_clientes.xlsx")

Resumo das dimensões do DataFrame
```
df.shape
```
Ver nome das colunas
```
df.columns
```
Ver os primeiros resultados Como padrão a quantidades de linhas à ser trazido são cinco, porém esse valor pode ser alterado se preenchido os parênteses de acordo com o desejado.
```
df.head()

# ou

df.head(20)
```
Ver os últimos resultados
```
df.tail()
```
Selecionar uma coluna específica - pelo nome O segundo método apresentado no exemplo somente é permitido de usar em nomes de colunas sem espaço entre palavras.
```
df["Nome_Completo"]

# ou

df.Nome_Completo
```
Selecionar o primeiro valor de uma coluna específica
```
df["Nome_Completo"].values[0]
```
Selecionar uma linha através do index
```
df.iloc[0]
```
Selecionar uma linha e uma coluna através do index
```
df.iloc[0,0]
```

Criando um DataFrame

data = {
    "Nome": ["Harry", "Hermione", "Rony", "Luna", "Neville"],
    "Herbologia": [8,5,6,9,7],
    "Alquimia": [7,9,5,4,7],
    "Adivinhacao": [7,4,7,6,8]
}

df_hp = pd.DataFrame(data)

Estatísticas descritivas das colunas - media, desvio padrão, mínimo, máximo, etc ...
```
df.describe()
```

Extraindo o DataFrame em um arquivo Excel

df_hp.to_excel("Boletins_Alunos.xlsx", index=False)