История Airbnb, управляемая данными

istoriya airbnb upravlyaemaya dannymi?v=1656571962

Содержание статьи

от Акшаджа Верма

0*PTkrnracmwpkL44M
AirBnB [Image [0] Изображение предоставлено: https://iacs.seas.harvard.edu/negotiation-tool-airbnb]

Пользователи AirBnB могут забронировать жилье более чем в 34 000 городах в более чем 190 странах. Целью этого сообщения в блоге является проанализировать данные, выявить проблемы и возможности, а также получить информацию для увеличения дохода. Эти данные взяты из Kaggle. Если вас интересуют подобные проекты, посмотрите мои другие публикации в блоге.

Но почему AirBnB?

Ну, я хотел бы поработать над набором данных реального мира, который имел последствия для реального мира с небольшой предварительной обработкой. AirBnB был наиболее интересным набором данных, который я нашел. Итак, мы идем.

Импорт библиотеки.

Импорт набора данных.

1*7iJE0oM86yO4FSSKdu7wCg
Фрейм данных [Image[1]]

Предварительная обработка

Превратите в формат даты и времени с помощью lubridate. Заменить -unknown- пол за NA.

1*UQEwoq5hF8BWwJyrDut2Xg
Резюме df [Image [2]]
  • Значение NA в date_first_booking В столбце указано, что пользователь не забронировал номера.
  • Значение NA в age означает, что пользователь не указал свой возраст. Мы можем заполнить фиктивные значения в age колонка.
  • Значение NA в gender означает, что пользователь не указал свой пол.

Примечание что в столбце гендера имеется 95688 значений NA и 117763 заполненных значения. Итак, наш анализ на основе гендерной демографии может оказаться не совсем правильным в реальном мире.

Количество значений NA в каждом столбце кадра данных.

colSums(is.na(train_users_2))
1*Szdo-TSw4gaj6VGekehAGQ
Количество НА [Image [3]]

The age столбец содержит значение менее 18 и более 80. На самом деле, age содержит значения 104 и 2014. Мы назначим им значение NA.

Чтобы заполнить значение NA в age столбца, мы вычислим среднее значение и стандартное отклонение age колонка. Тогда мы сгенерируем п числа как случайные целые числа между средним и стандартным отклонением для заполнения значений NA. п – количество значений NA в age колонка.

Создайте новый столбец под названием age_brackets и добавьте его в кадр данных.

Наконец, мы добавим 2 новых столбца в кадр данных.

  • Первый столбец time_first_active_to_bookingчто равно числу дней между date_first_booking и timestamp_first_active.
  • Второй столбец time_signup_to_bookingчто равно числу дней между date_first_booking и date_account_created

Просмотрите количество NA на столбец.

colSums(is.na(train_users_2))
1*T0sn8BDjySyLEACQfOSbVw
Количество НА [Image [4]]
  • Как вы можете видеть в таблице выше, только date_first_booking, time_first_active_to_bookingи gender столбцы имеют значение NA. Это вполне нормально.
  • Значение NA в date_first_booking означает, что пользователь еще не забронировал ни одной гостиницы.
  • Значение NA в gender означает, что пользователь не указал свой пол. time_first_active_to_booking является производным от date_first_bookingпоэтому он будет иметь значение NA.

Сбросьте настройки gender уровней. Если вы этого не сделаете, то -unknown- уровень все равно будет отображаться в levels(train_users_2$gender). Мы этого не хотим, потому что мы уже все установили -unknown- гендерные ценности к NA.

train_users_2$gender <- factor(train_users_2$gender)

Мы закончили с предварительной обработкой. ну 😛

Исследовательский анализ данных

Возраст, пол и язык

1*9r5yQfwEZHNPAOZnRK720w
Возраст, пол и язык [Image [5]]
  1. Мы видим, что для гендера не хватает много значений. Большинство пользователей не заполнили свой пол на платформе.
  2. На втором графике мы наблюдаем, что возрастная группа большинства пользователей составляет от 25 до 47 лет, причем большинство пользователей в возрасте примерно 30 лет. Это говорит нам, что доминируют пользователи молодого и среднего возраста.
  3. Для компании, базирующейся в США, не удивительно, что наиболее используемым языком на их портале/приложении является английский.
  4. Если мы удалим английский язык из сюжета, китайский (zh) является следующим по популярности языком на AirBnB, за ним следуют французский и испанский. Это говорит о том, что AirBnB, после США, действительно популярен во франкоязычных и испаноязычных странах/сообществах. Во Франции преимущественно говорят на французском, поэтому мы знаем, что это приложение популярно во Франции. Но мы не можем сказать этого об испанском, потому что на испанском говорят во многих странах, включая Испанию, Колумбию и США, среди многих других.

Эти данные вместе с местонахождением пользователя можно использовать, чтобы определить, какие регионы (внутри страны) используют какой-либо язык. Тогда, может быть, мы могли бы показывать целевую рекламу этим сообществам.

Возраст против пола

1*goavdH-aHWSbVeK2DBiyWg
Деление возраста и пола [Image [6]]

В зависимости от возраста почти нет разницы между количеством мужчин и женщин, которые используют AirBnB. Мужчины и женщины в возрасте 30 лет являются наиболее заметными пользователями AirBnB.

Партнерский маркетинг или реклама

Прежде чем начать анализировать графики, давайте разберемся, что такое партнерский маркетинг.

Партнерский маркетинг – это тип маркетинга, основанного на результативности, в котором компания вознаграждает один или несколько филиалов за каждого посетителя или клиента, привлеченного собственными маркетинговыми усилиями филиалов. Партнерский маркетинг быстро становится мощным способом увеличения продаж.

1*jfpMnEsdaFv5Pxb5vih7RA
Партнерский поставщик и канал [Image [7]]

2 графика показывают распределение партнерских каналов, которые используются разными партнерскими провайдерами.

Прямой маркетинг, который выполняет сама AirBnB, имел самый большой охват с точки зрения маркетинга. Прямой маркетинг – это форма рекламы, при которой организации непосредственно общаются с клиентами с помощью различных средств массовой информации, включая текстовые сообщения, электронную почту, веб-сайты, онлайн рекламу, рекламные письма и целевое телевидение.

Google является вторым партнерским поставщиком, а полубрендинг – его самый популярный партнерский канал. Bing, Facebook и Craigslist являются другими «основными» участниками.

0*inbmoBh9IOUetxyA
Прямой маркетинг — Канатная дорога. [Image [8]]

Таргетированный маркетинг на основе возраста

Эти графики показывают сравнение использования платформы AirBnB на основе возрастной демографии.

1*IbllGPnchClgQ1oPGJ__hw
Таргетированный маркетинг по возрасту [Image [9]]

Целевой маркетинг на основе пола

Эти графики показывают сравнение использования платформы AirBnB на основе гендерной демографии.

1*kwZni5Bp6my9whz48rs-SA
Целевой маркетинг по полу [Image [10]]
  1. Больше женщин, чем мужчины, ориентированы на прямой партнерский канал.
  2. То же касается прямого партнера.
  3. Если мы удалим direct партнерский канал, мы наблюдаем, что полуфирменный и полубезбрендовый являются двумя популярными каналами, за которыми следуют API и SEO (поисковая оптимизация). За исключением канала API, все остальные каналы обслуживают больше женщин, чем мужчин.
  4. Google, как аффилированный поставщик, чаще встречается среди женщин, чем мужчин.
0*BIA5n9ARSjjo7dEW
Целевой маркетинг [Image [11]]

Приложение для регистрации и способ регистрации

1*e_Tz_UOdUldQOEVnEznLWQ
Приложение и метод регистрации [Image [12]]
  1. Регистрация с помощью электронной почты – самый популярный вариант, а затем регистрация с помощью Facebook. Никто не любит связывать свою учетную запись Google со своей учетной записью Airbnb.
  2. Большинство людей получают доступ к платформе AirBnB с помощью браузеров на своих компьютерах, а затем через приложение iOS. Тот факт, что пользователей Android меньше, чем пользователей iOS, может показаться странным, но помните, что AirBnB – американская компания, самая большая база пользователей – американцы. iOS популярнее в США, чем Android.
  3. Люди, вероятно, не так часто используют программу. Это может быть потому, что им не нравится интерфейс или функциональность приложения для Android/iOS. Возможно, веб-версия предлагает более функциональные возможности и более легкая в использовании. Или люди не знают о приложении AirBnB.

Приложение и метод регистрации на основе возраста и пола

1*7pN3fVuJrwIlLsa_pep5rw
Возраст и пол регистрации [Image [13]]
  1. Как и ожидалось, пожилые люди вообще не используют смартфоны для использования AirBnB. Большое количество людей в возрасте 20, 30 и 40 лет используют свои компьютеры для доступа к платформе AirBnB. Можно было бы ожидать, что технически подкованные подростки и 20-летние подростки будут больше использовать смартфоны, но это не так. (Обратите внимание, что людей в возрасте 30 лет гораздо больше. Это предположение может быть ошибочным.)
  2. Большинство женщин предпочитают регистрироваться с помощью своих компьютеров, тогда как больше мужчин предпочитают приложения iOS/Android.
  3. Намного больше людей в возрасте 30 лет предпочитают регистрироваться с помощью электронной почты, чем Facebook. Почти удивительно равное количество людей в возрасте от 20 до 30 лет предпочитают регистрироваться с помощью Facebook.
  4. Больше женщин, чем мужчин, предпочитают использовать Facebook и методы регистрации по электронной почте. По сравнению с другими двумя метод регистрации в Google похож на ошибку 404, не существует.

Первый тип устройства против возраста и пола

1*G1u8CZ839C4S3jiDZGuIgQ
Первый тип устройства – пол[Image [14]]
  1. Компьютеры Mac являются наиболее предпочтительными ноутбуками для доступа к платформе AirBnB, а затем Windows Desktop. Опять же, Apple очень популярна в США.
  2. Устройства iPhone и iPad являются вторым по распространенности устройством для доступа к платформе AirBnB.
1*naCcqnOMjtuu22rhXZBKLg
Первый тип устройства-возраст[Image[15]]
  1. Настольные компьютеры Mac очень популярны среди людей в возрасте от 20 до 30 лет, чтобы получить доступ к платформе AirBnB, а затем на рабочем столе Windows.
  2. Мы видим тенденцию к уменьшению использования компьютеров Mac с возрастом. Нет разницы между настольными компьютерами Mac и настольными компьютерами Windows для людей в возрасте 60 лет.
  3. Однако смартфоны становятся непопулярны с возрастом.

Бронирование и счета в течение многих лет

1*lFSA9eQNF7btIYku_43sEA
Бронирование и счета [Image [16]]
  1. Количество заказов с каждым годом стремительно растет.
  2. Резкое падение бронирований в 2015 году связано с тем, что у нас есть данные только до 29–06–2015. filter(train_users_2, date_first_booking >= "2015-06-29″)
  3. О количестве созданных аккаунтов мы имеем данные только до 2014-06-30. filter(train_users_2, date_account_created >= "2014-06-30″)

Количество первых бронирований в год

1*zjpdeFl6KFdk6UuSmK162A
Первое бронирование [Image [17]]
  1. Количество первых бронирований является самым низким примерно в январе. Возможно, это связано с тем, что год только что закончился, поэтому люди так скоро никуда не ездят. Кроме того, на улице очень холодно?
  2. Количество первых бронировок всегда растет с июля по октябрь. Это может быть в ожидании таких фестивалей как День благодарения и Октоберфест (или летние каникулы).
  3. Однако мы видим резкое снижение количества бронирований, начиная с июля 2014 по июль 2015 года.

«В июле 2014 года Airbnb внес изменения в дизайн сайта и мобильного приложения и представил новый логотип. Некоторые считали, что новый логотип визуально похож на гениталии, но опрос потребителей, проведенный Survata, показал, что только меньшинство респондентов считает, что это так».

Google «AirBnB 2014», чтобы найти причину внезапного снижения количества заказов в 2014 году.

Количество счетов, созданных за год

1*PE5rAKyRIXCEukOpl4rQsw
Первая учетная запись [Image [18]]
  1. Этот сюжет имеет схожую тенденцию, что и приведенное выше.
  2. Количество созданных новых (первых) аккаунтов уменьшается примерно в январе и растет в сентябре и октябре.
  3. Люди, вероятно, создают новые аккаунты, чтобы бронировать, а также сравнивать цены на другие услуги.

AirBnB, вероятно, может снизить цены или предоставить больше скидок и предложений в течение августа, сентября и октября, чтобы больше людей бронировало места.

Время между регистрацией и первым бронированием в зависимости от возраста и пола

1*MwrAART4ipCW2ra5LEGBNA
Бронирование — Регистрация [Image[19]]

Цветные поля указывают межквартильный диапазон, представляющий средние 50% данных. Усы протягиваются по обе стороны коробки. Усы представляют диапазоны для нижних 25% и верхних 25% значений данных, за исключением выбросов.

  1. Большинство людей, независимо от возраста и пола, бронируют комнаты в день регистрации. Среднее значение равно 0.
  2. Вы можете просматривать номера, забронировавшие «неприятные», через 1000 дней после регистрации на платформе.
  3. Время ожидания для средних 50% пользователей из каждой возрастной группы обычно имеет тенденцию уменьшаться с возрастом.

Время от первого бронирования до первого действия

1*l4T9Bprkdg5UdScqaD-9YA
Бронирование — Активное [Image [20]]
  1. Время между первым бронированием и первой активностью пользователей 0 или около 0 для многих людей.
  2. Есть люди, которые забронировали свой первый номер спустя более 100 дней после своей первой активности на платформе AirBnB. проклятый.

Время между первым бронированием и регистрацией

1*gvA4x1b6PpYOV0zeoe9euA
Бронирование — Регистрация [Image [21]]
  1. Здесь мы видим, что количество дней отрицательное для многих людей. Люди бронировали номера за год до создания аккаунта. Кроме этого, данные похожи на приведенный выше график.
  2. Множество людей бронирует номера в тот же день, когда они регистрируются на платформе AirBnB.

Разберем отрицательные значения. Сколько отрицательных значений?

1*D-rYnKE-qUhVWnu5W4zLmw
Негативное время [Image [22]]

Мы видим, что всего 29 отрицательных значений. Это значит, что 29 пользователей смогли забронировать номера без создания аккаунта!

Посмотрим, в какие годы это вышло. После фильтрации только отрицательные значения time_signup_to_booking, то есть людей, забронировавших номера до регистрации, мы построим следующий график. Этот график показывает, что пользователи могли зарегистрироваться перед бронированием на платформе AirBnB с 2010 по 2013 год.

1*EmFSzPTsprBzTNidPzG28A
Учитывайте год бронирования перед регистрацией [Image [23]]

Следующее заявление обнародовала AirBnB.

«До начала 2013 года было несколько потоков, когда пользователь мог забронировать номер до того, как полностью создать аккаунт (по определению создания аккаунта, которое мы используем сегодня). После начала 2013 это уже невозможно».

Результаты

Забронировано против не забронировано

NDF означает, что бронирование не было сделано.

1*2PLKtzYL1DrpJImHLoe7ig
Забронировано против не забронировано [Image [24]]
  1. Очевидно, что инертных пользователей больше активных.
  2. Соотношение мужчин и женщин почти одинаково для бронирующих пользователей и тех, кто этого не делает. Однако значения NA отличаются. Есть много пользователей, которые не указывают свой пол и не бронируют номера.
  3. Люди в возрасте 30 лет являются самыми высокими в лоте, как для бронирования, так и для небронирования номеров. Соотношение Забронировано : NotBooked менее 1 для людей в возрасте 20, 30 и 40 лет. Хотя то же соотношение неизменно для людей в возрасте 50, 60 и 70 лет.
  4. Как видите, множество людей не бронирует номера. После этого в США больше всего бронирований. Большое количество этих заказов должно быть внутренним, поскольку компания находится в США.

На графике видно, что основными клиентами AirBnB есть люди в возрасте 20, 30 и 40 лет.

Частота страны назначения

1*o6D-Hmf0iV5egfkQqNHWlg
Частота страны назначения [Image [25]]
  1. Наибольшее количество неактивных пользователей (людей, не забронировавших номер) в возрасте 30 лет.
  2. Женщины путешествуют чуть больше мужчин, используя AirBnB.
  3. После США и других стран Франция является следующим по популярности направлением.
  4. Больше женщин путешествует во Францию, чем мужчин, в то время как мужчин посещает Канаду, чем женщин.

Обратите внимание, что путешествия не должны быть только международными. Он может быть национальным или международным, поскольку страна происхождения пользователей не указана в наборе данных.

Влияние партнерского канала на страну назначения

1*UP2mI1xz1wf_3gAOlRAqgw
Влияние партнерских каналов на место назначения [Image [24]]
  1. Прямые партнерские каналы играют немаловажную роль в подтверждении бронирований.
  2. Партнерский канал с полубрендингом играет немаловажную роль в подтверждении бронирований, особенно в США.

Влияние аффилированного поставщика на страну назначения

1*HA0F0dPpQF5fGzIYTVgi8g
Влияние аффилированных поставщиков на пункт назначения [Image [25]]

После прямого аффилированного поставщика важную роль в подтверждении бронирования играет Google.

Ежемесячная статистика бронирования на основе пола

1*urQsFGGVWyoqwltIHdFC2Q
Ежемесячное бронирование и пол [Image [26]]
  1. Женщины всегда бронировали больше отелей на AirBnB, чем мужчины, за исключением одного месяца – декабря 2013 года.
  2. Мы видим, что общее количество бронирований достигло пика примерно в июле, за исключением 2014 и 2015 годов.

Еженедельная статистика бронирования на основе пола

1*W9_6fqIv1SbncelwNMo_Xg
Еженедельное бронирование против пола [Image [27]]
  1. Количество бронирований всегда меньше в выходные, т.е. Суббота и воскресенье.
  2. Количество заказов всегда достигает максимума в четверг и пятницу. Люди, вероятно, бронируют номера по выходным в четверг и пятницу.
  3. Мужское бронирование гостиниц значительно уменьшается в воскресенье по сравнению с субботами, а для женщин – наоборот.
  4. Количество заказов продолжает увеличиваться с понедельника по пятницу, чтобы уменьшаться только на выходные.

Ежедневное изменение количества бронирований

1*Osmuk0J07N7s7bNBcIE1ag
Ежедневное бронирование против пола [Image [28]]

Мы наблюдаем, что AirBnB выросла с 0–50 бронирований в день в 2010 году до почти 200 бронирований в день в первые месяцы 2014 года.
После этого количество заказов упало примерно до 100 в день.

Выводы

Прежде чем начать работать над этим, у меня было несколько пристрастных представлений о том, какие результаты я получу. К примеру, я не ожидал, что iOS будет чрезвычайно популярной. Больше чем Android.

Из 432 миллионов смартфонов, проданных в последнем квартале 2016 года, 352 миллиона работали под управлением Android (81,7 процента), а 77 миллионов – с iOS (17,9 процента).

0*gNLL25B636vyy50f
Мировые продажи смартфонов в четвертом квартале 2016 года. (тысячи единиц) [Image [29] кредиты: Gartner]

Резкое падение количества пользователей примерно в июле 2014 года также несколько неожиданно. Я имею в виду, что к этому моменту компания имела ошеломляющие темпы роста. После этого все начало идти вниз. Хотя у нас есть данные только до середины 2015 года, кто знает, что бронирование могло появиться после этого.

Кто ожидал, что количество бронирований в выходные дни уменьшится? Конечно, не я. Но как оказалось, если вы хотите выйти на выходные, вам нужно забронировать отели до этого. Простите. 😛

Забронировать номер перед созданием аккаунта? Эта часть отняла мне много времени, чтобы понять. Я думал, что ошибся. Но когда я наконец погугнул, то оказалось, что это было возможно до начала 2013 года. AirBnB исправил ошибку вскоре после этого.

Другое дело, которое поразило это то, что люди в возрасте 30 лет были более активными на AirBnB, чем люди в возрасте 20 лет. КАК? Я, конечно, не ожидал, что люди в возрасте 70 лет будут путешествовать, а тем более использовать AirBnB. *_*

Спасибо, что читаете. Предложения и конструктивная критика приветствуются. 🙂 Вы можете найти меня на LinkedIn. Вы можете просмотреть полный код здесь.

Вы также можете ознакомиться с другими моими публикациями в блоге. Исследовательский анализ набора данных FIFA 18 с помощью R, Начало работы с Hive и GgPlot ‘Em All | Покемон на R.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *