Как пузырь показывает лучшие города для жизни в США

1656647289 kak puzyr pokazyvaet luchshie goroda dlya zhizni v ssha

Чжэнь Лю

1*HffpBV9kNhHCBT0D77zm3w

В этой статье я покажу вам несколько увлекательных фактов об американских городах, значении пузырьков в решении, в каком городе жить, и как создать эти участки.

Думаете ли вы об инвестировании в недвижимость в 2018 году? Переезд в новый город? Рассматривая эти решения, вам нужно учесть различные факторы, такие как уровень безработицы, стоимость жилья, размер города, безопасность и т.д. Даже со всеми этими данными и четырьмя соответствующими гистограммами вы все равно не узнаете, глядя на эту таблицу. Вы попытаетесь найти лучших кандидатов, но эти факторы говорят разные истории… Звучит как сложная проблема.

1*YJKL-SBnPHPO5Eb69w-eGQ

Итак, есть ли способ, как мы можем визуализировать все эти факторы в одной диаграмме и сравнить их ВСЕ? Да, мы можем использовать пузырьковый график!

Что такое пузырь?

Пузырьковая диаграмма – это тип диаграммы, отображающий более двух измерений данных (по сравнению с традиционными точечными диаграммами). Помимо построения точки на плоскости XY она использует размер, цвет или форму точки для отображения дополнительных размеров.

Мы используем уровень безработицы как ось X, медиана цены на жилье как ось Yи население городов как размер точек. Это хорошее третье измерение. Цвет присваивается каждому городу случайным образом.

Лучший город для жизни в США – это… (подождите)

1*wyVxxjaM_oQF0utG6__cog

Победитель: Нэшвилл!

Другие рекомендации: Остин, Омаха, Милуоки, Даллас, Миннеаполис, Денвер и Аврора.

У них низкий уровень безработицы (и потому есть больший шанс найти работу) и низкая цена на жилье, поскольку они находятся в нижней левой части участка. Что это значит?

Это означает, что вы можете сделать свой выбор на основе этого сюжета.

Например, если вы считаете уровень безработицы более важным и не против более высоких цен на жилье, то Гонолулу, Окленд, Бостон и Сан-Диего являются сильными кандидатами.

А как насчет добавления безопасности как еще одного фактора?

Давайте добавим безопасность как четвертый фактор (другими тремя факторами все еще являются цена жилья, уровень безработицы и населения). Вместо того чтобы случайно назначать цвет для города, мы используем цветовая гамма для преступления (Уровень преступности на 100 тыс. человек). Красный означает больше преступности и голубой значит меньше.

Изменяется ли результат?

1*hjgKmyxuTeXeNTyxE9shiA

Это удалось! Если безопасность для вас очень важна, тогда Милуоки может быть не столь замечательным выбором среди предыдущих рекомендаций (хотя это в левой нижней части графика).

Теперь вы видите силу пузырчатой ​​диаграммы: возможность продемонстрировать несколько факторов на одном двумерном графике. Если у вас есть столбчатые диаграммы для этих факторов, вам трудно определить города с идеальной комбинацией факторов. Пузырьковый график по сути создал для вас «визуальную целевую функцию» для оптимизации проблемы принятия решений со многими переменными.

Как уровень безработицы и цена на жилье меняются с течением времени?

Мы можем создать интерактивную диаграмму движения, чтобы добавить время как измерение (2013–2017), чтобы увидеть, как изменяются факторы для этих городов со временем.

1*yYFcThB3pQ8wxPODrP4ZgQ

Чтобы избежать слишком большого количества визуальной информации, я не использовал данные о преступлениях и использовал различные цвета для представления нескольких избранных городов.

Хорошая новость состоит в том, что уровень безработицы почти во всех городах значительно снизился (двигая справа налево). Но плохая новость состоит в том, что цены на жилье растут достаточно быстро (особенно в Сан-Франциско, Сан-Хосе, Лос-Анджелесе, Нью-Йорке и Сиэтле).

Хотите создать диаграммы самостоятельно? Вот мой код для пузырьковых графиков и диаграммы движения в R. Развлекайтесь, играя с графиками:)

################ Bubble Plot ################library(data.table)library(ggplot2)library(ggrepel)
bubble_data <-fread("https://raw.githubusercontent.com/zhendata/Medium_Posts/c007346db1575aca391a6623c87bb5a31a60b365/bubble_plot_merged_city_data.csv",sep=",")
bubble_plot <- ggplot(bubble_data,                aes(x = Unemployment_Rate, y = Home_Price/1000)) + 
geom_point(aes(size = Population, fill = Total_Crime),shape=21) +# Create 'Bubble' by assigning size a variable #
scale_fill_continuous(low = "#33FFFF", high ="#FF6699" ) +scale_size_area(max_size = 20)+# Select bubble color scale and bubble maximum size #
geom_text_repel(          aes(label = City),nudge_x = 0,nudge_y = 0.75,size = 6) +# Use geom_text_repel to repel the labels away from each other #
theme_bw()+# Use white background instead of the default grey one #
ggtitle("Best Cities in US to Live in") +labs(x = "Unemployment Rate%", y = "Home Price",       size = "Population",fill="Crime") +theme(plot.title = element_text(size=25, hjust = 0.5),        axis.title=element_text(size=20, face = "bold"),        axis.text=element_text(size=15)) +# Style title and axis #
scale_y_continuous(name="Home Price", breaks = seq(0, 1500, by=250),                       labels=c("0", "250K", "500K", "750K", "1000k",    "1250k", "1500K"))# Make y-axis more readable by replacing scientific number by "K" #
print(bubble_plot)
################# Motion Chart #################library(data.table)library(googleVis)
motion_data <-fread("https://raw.githubusercontent.com/zhendata/Medium_Posts/c007346db1575aca391a6623c87bb5a31a60b365/motion_chart_merged_city_data.csv",sep=",")
motion_chart <- gvisMotionChart(motion_data, idvar = "City", timevar = "Year",xvar = "Unemployment Rate",yvar= "Home Price",sizevar="Population")
plot(motion_chart)# R automatically opens a tab in the browser for you# The flash player needs to be enabled in browser 
1*J9UiAP39_gGy14vmn_Qtrw
Чтобы включить Flash, нажмите значок «⌽».
######### Data #########"""The datasets I used are from Zillow (medium housing), FBI’s UCR program, census.gov (population), Bureau of Labor (unemployment). I did some data cleaning and joining for the format I needed in this article, and you can click the links below to download."""bubble_plot_merged_city_data.csv, motion_chart_merged_city_data.csv

Следите за мной и похлопайте меня, если вы считаете это полезным!

Вы также можете прочитать мои предыдущие статьи о науке о данных, недвижимости и принятии решений:

Как анализировать сезонность и тенденции сэкономить на аренде квартиры.
Когда я искал новую квартиру для аренды, я стал задаваться вопросом: существует ли стратегия принятия решений на основе данных…medium.freecodecamp.orgКак использовать данные для прогнозирования арендной платы и оптимизировать продолжительность аренды, чтобы вы могли сэкономить деньги
В последней публикации мы говорили о том, как выбрать лучший месяц для заключения договора аренды с учетом сезонности. Теперь, как долго…medium.freecodecamp.org

Добавить комментарий

Ваш адрес email не будет опубликован.