Análise de Dados com Pandas
Pandas é uma ferramenta poderosa e amplamente utilizada na linguagem de programação Python, projetada especificamente para a manipulação e análise de dados. Ela fornece estruturas de dados de alto desempenho e ferramentas fáceis de usar para trabalhar com grandes quantidades de dados de maneira eficiente.
LISTA DE EXERCÍCIOS
QUESTÃO 1- FILTRAR PAÍSES COM MAIS DE 10.000 IMIGRANTES EM UM DETERMINADO ANO
Neste exercício, você vai filtrar os países que tiveram mais de 10.000 imigrantes para o Canadá em um ano específico, e exibir uma tabela com os resultados.
PASSOS:
- Selecione o ano de interesse (por exemplo, 2010).
- Filtre os países que tiveram mais de 10.000 imigrantes nesse ano.
- Exiba uma tabela com os países e o número de imigrantes.
DICA:
- Utilize
df[df['2010'] > 10000]
para filtrar o DataFrame.
import pandas as pd
def filtrar_paises_acima_de_10000(df, ano):
# Filtrar os países com mais de 10.000 imigrantes no ano selecionado
paises_filtrados = df[df[ano] > 10000]
# Exibir a tabela de países filtrados
print(f"Países com mais de 10.000 imigrantes em {ano}:")
print(paises_filtrados[['País', ano]])
def main():
# Carregar os dados e rodar a função
dados = 'imigrantes_canada.csv'
df = pd.read_csv(dados)
filtrar_paises_acima_de_10000(df, '2010')
if __name__ == "__main__":
main()
QUESTÃO 2- PLOTAR UM HISTOGRAMA DO NÚMERO TOTAL DE IMIGRANTES POR PAÍS
Neste exercício, você vai criar um histograma que mostra a distribuição do número total de imigrantes por país ao longo de todos os anos.
PASSOS:
- Some o número total de imigrantes de cada país ao longo de todos os anos.
- Plote um histograma da distribuição desses valores.
DICA:
- Utilize
df.sum(axis=1)
para calcular o total por país. - Use
matplotlib.pyplot.hist()
para gerar o histograma.
import pandas as pd
import matplotlib.pyplot as plt
def plotar_histograma_imigrantes(df):
# Somar o número total de imigrantes por país
anos = df.columns[4:]
total_por_pais = df[anos].sum(axis=1)
# Plotar o histograma
plt.hist(total_por_pais, bins=10, edgecolor='black')
plt.xlabel("Número total de imigrantes")
plt.ylabel("Frequência")
plt.title("Distribuição do número total de imigrantes por país")
plt.show()
def main():
# Carregar os dados e rodar a função
dados = 'imigrantes_canada.csv'
df = pd.read_csv(dados)
plotar_histograma_imigrantes(df)
if __name__ == "__main__":
main()
QUESTÃO 3- CALCULAR A MÉDIA DE IMIGRANTES POR ANO DE UM PAÍS ESPECÍFICO
Neste exercício, você vai calcular a média anual de imigrantes de um país específico (por exemplo, Brasil) para o Canadá.
PASSOS:
- Selecione um país de interesse (por exemplo, Brasil).
- Calcule a média de imigrantes ao longo dos anos.
- Exiba a média calculada.
DICA:
- Utilize o método
mean()
do Pandas para calcular a média.
import pandas as pd
def calcular_media_imigrantes(df, pais):
# Selecionar os anos e os dados do país
anos = df.columns[4:]
imigrantes_pais = df.loc[df['País'] == pais, anos].values.flatten()
# Calcular a média
media = imigrantes_pais.mean()
# Exibir a média calculada
print(f"A média anual de imigrantes de {pais} para o Canadá é: {media:.2f}")
def main():
# Carregar os dados e rodar a função
dados = 'imigrantes_canada.csv'
df = pd.read_csv(dados)
calcular_media_imigrantes(df, 'Brasil')
if __name__ == "__main__":
main()
QUESTÃO 4- CALCULAR A MEDIANA DO NÚMERO DE IMIGRANTES POR PAÍS AO LONGO DOS ANOS
Neste exercício, você vai calcular a mediana do número de imigrantes de um país (por exemplo, Índia) ao longo dos anos.
PASSOS:
- Selecione um país de interesse (por exemplo, Índia).
- Calcule a mediana do número de imigrantes ao longo dos anos.
- Exiba a mediana calculada.
DICA:
- Utilize o método
median()
do Pandas para calcular a mediana.
import pandas as pd
def calcular_mediana_imigrantes(df, pais):
# Selecionar os anos e os dados do país
anos = df.columns[4:]
imigrantes_pais = df.loc[df['País'] == pais, anos].values.flatten()
# Calcular a mediana
mediana = pd.Series(imigrantes_pais).median()
# Exibir a mediana calculada
print(f"A mediana de imigrantes de {pais} ao longo dos anos é: {mediana}")
def main():
# Carregar os dados e rodar a função
dados = 'imigrantes_canada.csv'
df = pd.read_csv(dados)
calcular_mediana_imigrantes(df, 'Índia')
if __name__ == "__main__":
main()
QUESTÃO 5- CALCULAR A MÉDIA DE IMIGRANTES PARA TODOS OS PAÍSES EM UM DETERMINADO ANO
Neste exercício, você vai calcular a média de imigrantes para todos os países no Canadá em um ano específico (por exemplo, 2010), e visualizá-la em um gráfico de barras comparando cada país com a média geral.
PASSOS:
- Selecione o ano de interesse (por exemplo, 2010).
- Calcule a média de imigrantes para todos os países nesse ano.
- Crie um gráfico de barras que mostre o número de imigrantes de cada país, destacando a linha da média calculada.
DICA:
- Utilize o método
mean()
para calcular a média no ano selecionado. - Utilize
matplotlib.pyplot.bar()
para criar o gráfico de barras.
import pandas as pd
import matplotlib.pyplot as plt
def calcular_media_por_ano_com_grafico(df, ano):
# Calcular a média de imigrantes para o ano selecionado
media = df[ano].mean()
# Exibir a média calculada
print(f"A média de imigrantes no ano de {ano} para todos os países é: {media:.2f}")
# Dados para o gráfico
paises = df['País']
imigrantes = df[ano]
# Criar o gráfico de barras
plt.figure(figsize=(12, 6))
plt.bar(paises, imigrantes, color='skyblue')
plt.axhline(y=media, color='red', linestyle='--', label=f'Média: {media:.2f}')
plt.xticks(rotation=90)
plt.title(f'Número de Imigrantes para o Canadá em {ano} por País')
plt.ylabel('Número de Imigrantes')
plt.legend()
plt.tight_layout()
plt.show()
def main():
# Carregar os dados e rodar a função
dados = 'imigrantes_canada.csv'
df = pd.read_csv(dados)
calcular_media_por_ano_com_grafico(df, '2010')
if __name__ == "__main__":
main()
Caso o Python ainda não esteja instalado em seu dispositivo, clique no botão abaixo para realizar a instalação.