Projeto de Análise de Dados de Aluguéis de Imóveis em São Paulo
Este projeto realiza uma análise exploratória de dados sobre imóveis alugados na cidade de São Paulo. O conjunto de dados contém informações sobre imóveis disponíveis para locação, incluindo detalhes como endereço, tipo, área, número de quartos, garagem, aluguel e custo total.
Objetivo
O objetivo principal deste projeto é analisar as variáveis do conjunto de dados e obter insights sobre o mercado de aluguel de imóveis em São Paulo, explorando tendências, correlações e comparações entre diferentes tipos de imóveis, bairros e características financeiras.
Dados
O conjunto de dados contém as seguintes colunas:
- address: Localização completa da propriedade.
- district: Região onde o imóvel está situado.
- area: Tamanho do imóvel em metros quadrados (m²).
- bedrooms: Número de quartos disponíveis.
- garage: Total de vagas na garagem.
- type: Tipo de propriedade (apartamento, casa, etc.).
- rent: Valor do aluguel mensal.
- total: Soma do aluguel, impostos e outras taxas.
import pandas as pd
df = pd.read_csv('data.csv', sep=',')
Tratamento e Limpeza de Dados
Durante o processo de análise, foram realizados os seguintes tratamentos de dados:
- Remoção de registros com área menor que 5 m².
- Remoção de registros com 0 quartos.
df.isnull().sum() # Verifica os valores nulos
df.describe() # Estatísticas descritivas
Análise Exploratória
Estatísticas Descritivas
- Área média, mínima e máxima dos imóveis.
- Valor médio de aluguel por tipo de imóvel.
- Custo total médio por bairro.
Correlação e Relações
correlacao = df[['area','rent']].corr()
Gráficos e Visualizações
Diversos gráficos foram gerados, como:
- Distribuição do número de quartos.
- Comparação do aluguel médio por tipo de imóvel.
- Top 15 bairros com maior custo total médio.
plt.bar(categoria, valores, color='orange')
plt.title("Comparação do Aluguel Médio por Tipo de Imóvel")
Insights Obtidos
- Imóveis maiores tendem a ter aluguéis mais altos.
- Bairros como Alphaville são os mais caros, enquanto Jardim Jaçanã é mais acessível.
- Imóveis com garagem têm custos totais mais elevados.
Tecnologias Utilizadas
- Pandas: Manipulação e análise de dados.
- Matplotlib: Visualização de dados.
- Seaborn: Gráficos estatísticos.
Como Rodar o Projeto
- Clone o repositório.
- Instale as dependências:
pip install pandas matplotlib seaborn
- Execute o script para carregar os dados e realizar a análise:
python analise_imoveis.ipynb