pandas

Análise de Dados com Pandas

Pandas é uma ferramenta poderosa e amplamente utilizada na linguagem de programação Python, projetada especificamente para a manipulação e análise de dados. Ela fornece estruturas de dados de alto desempenho e ferramentas fáceis de usar para trabalhar com grandes quantidades de dados de maneira eficiente.

QUESTÃO 1- FILTRAR PAÍSES COM MAIS DE 10.000 IMIGRANTES EM UM DETERMINADO ANO

Neste exercício, você vai filtrar os países que tiveram mais de 10.000 imigrantes para o Canadá em um ano específico, e exibir uma tabela com os resultados.

PASSOS:

  1. Selecione o ano de interesse (por exemplo, 2010).
  2. Filtre os países que tiveram mais de 10.000 imigrantes nesse ano.
  3. Exiba uma tabela com os países e o número de imigrantes.

DICA:

  • Utilize df[df['2010'] > 10000] para filtrar o DataFrame.
				
					import pandas as pd

def filtrar_paises_acima_de_10000(df, ano):
    # Filtrar os países com mais de 10.000 imigrantes no ano selecionado
    paises_filtrados = df[df[ano] > 10000]
    
    # Exibir a tabela de países filtrados
    print(f"Países com mais de 10.000 imigrantes em {ano}:")
    print(paises_filtrados[['País', ano]])

def main():
    # Carregar os dados e rodar a função
    dados = 'imigrantes_canada.csv'
    df = pd.read_csv(dados)
    filtrar_paises_acima_de_10000(df, '2010')

if __name__ == "__main__":
    main()

				
			

QUESTÃO 2- PLOTAR UM HISTOGRAMA DO NÚMERO TOTAL DE IMIGRANTES POR PAÍS

Neste exercício, você vai criar um histograma que mostra a distribuição do número total de imigrantes por país ao longo de todos os anos.

PASSOS:

  1. Some o número total de imigrantes de cada país ao longo de todos os anos.
  2. Plote um histograma da distribuição desses valores.

DICA:

  • Utilize df.sum(axis=1) para calcular o total por país.
  • Use matplotlib.pyplot.hist() para gerar o histograma.
				
					import pandas as pd
import matplotlib.pyplot as plt

def plotar_histograma_imigrantes(df):
    # Somar o número total de imigrantes por país
    anos = df.columns[4:]
    total_por_pais = df[anos].sum(axis=1)
    
    # Plotar o histograma
    plt.hist(total_por_pais, bins=10, edgecolor='black')
    plt.xlabel("Número total de imigrantes")
    plt.ylabel("Frequência")
    plt.title("Distribuição do número total de imigrantes por país")
    plt.show()

def main():
    # Carregar os dados e rodar a função
    dados = 'imigrantes_canada.csv'
    df = pd.read_csv(dados)
    plotar_histograma_imigrantes(df)

if __name__ == "__main__":
    main()

				
			

QUESTÃO 3- CALCULAR A MÉDIA DE IMIGRANTES POR ANO DE UM PAÍS ESPECÍFICO

Neste exercício, você vai calcular a média anual de imigrantes de um país específico (por exemplo, Brasil) para o Canadá.

PASSOS:

  1. Selecione um país de interesse (por exemplo, Brasil).
  2. Calcule a média de imigrantes ao longo dos anos.
  3. Exiba a média calculada.

DICA:

  • Utilize o método mean() do Pandas para calcular a média.
				
					import pandas as pd

def calcular_media_imigrantes(df, pais):
    # Selecionar os anos e os dados do país
    anos = df.columns[4:]
    imigrantes_pais = df.loc[df['País'] == pais, anos].values.flatten()
    
    # Calcular a média
    media = imigrantes_pais.mean()
    
    # Exibir a média calculada
    print(f"A média anual de imigrantes de {pais} para o Canadá é: {media:.2f}")

def main():
    # Carregar os dados e rodar a função
    dados = 'imigrantes_canada.csv'
    df = pd.read_csv(dados)
    calcular_media_imigrantes(df, 'Brasil')

if __name__ == "__main__":
    main()

				
			

QUESTÃO 4- CALCULAR A MEDIANA DO NÚMERO DE IMIGRANTES POR PAÍS AO LONGO DOS ANOS

Neste exercício, você vai calcular a mediana do número de imigrantes de um país (por exemplo, Índia) ao longo dos anos.

PASSOS:

  1. Selecione um país de interesse (por exemplo, Índia).
  2. Calcule a mediana do número de imigrantes ao longo dos anos.
  3. Exiba a mediana calculada.

DICA:

  • Utilize o método median() do Pandas para calcular a mediana.
				
					import pandas as pd

def calcular_mediana_imigrantes(df, pais):
    # Selecionar os anos e os dados do país
    anos = df.columns[4:]
    imigrantes_pais = df.loc[df['País'] == pais, anos].values.flatten()
    
    # Calcular a mediana
    mediana = pd.Series(imigrantes_pais).median()
    
    # Exibir a mediana calculada
    print(f"A mediana de imigrantes de {pais} ao longo dos anos é: {mediana}")

def main():
    # Carregar os dados e rodar a função
    dados = 'imigrantes_canada.csv'
    df = pd.read_csv(dados)
    calcular_mediana_imigrantes(df, 'Índia')

if __name__ == "__main__":
    main()

				
			

QUESTÃO 5- CALCULAR A MÉDIA DE IMIGRANTES PARA TODOS OS PAÍSES EM UM DETERMINADO ANO

Neste exercício, você vai calcular a média de imigrantes para todos os países no Canadá em um ano específico (por exemplo, 2010), e visualizá-la em um gráfico de barras comparando cada país com a média geral.

PASSOS:

  1. Selecione o ano de interesse (por exemplo, 2010).
  2. Calcule a média de imigrantes para todos os países nesse ano.
  3. Crie um gráfico de barras que mostre o número de imigrantes de cada país, destacando a linha da média calculada.

DICA:

  • Utilize o método mean() para calcular a média no ano selecionado.
  • Utilize matplotlib.pyplot.bar() para criar o gráfico de barras.
				
					import pandas as pd
import matplotlib.pyplot as plt

def calcular_media_por_ano_com_grafico(df, ano):
    # Calcular a média de imigrantes para o ano selecionado
    media = df[ano].mean()
    
    # Exibir a média calculada
    print(f"A média de imigrantes no ano de {ano} para todos os países é: {media:.2f}")
    
    # Dados para o gráfico
    paises = df['País']
    imigrantes = df[ano]
    
    # Criar o gráfico de barras
    plt.figure(figsize=(12, 6))
    plt.bar(paises, imigrantes, color='skyblue')
    plt.axhline(y=media, color='red', linestyle='--', label=f'Média: {media:.2f}')
    plt.xticks(rotation=90)
    plt.title(f'Número de Imigrantes para o Canadá em {ano} por País')
    plt.ylabel('Número de Imigrantes')
    plt.legend()
    
    plt.tight_layout()
    plt.show()

def main():
    # Carregar os dados e rodar a função
    dados = 'imigrantes_canada.csv'
    df = pd.read_csv(dados)
    calcular_media_por_ano_com_grafico(df, '2010')

if __name__ == "__main__":
    main()

				
			

Caso o Python ainda não esteja instalado em seu dispositivo, clique no botão abaixo para realizar a instalação.

Posts Similares

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *