Назад

Предсказание цен на недвижимость с помощью Big Data

3 Марта 2017

В условиях кризиса на рынке недвижимости снижается спрос на квартиры. Вместе с этим растут цены на отдельные предложения. Это связано с человеческой психологией - одни стараются продать квартиру на падающем рынке и понижают цену в надежде привлечь оставшихся покупателей, другие пытаются компенсировать нестабильность рубля и рост потребительских цен, завышая стоимость недвижимости. Рынок недвижимости крайне неоднороден.

Решение - разработка обучаемой системы оценки стоимости объектов недвижимости (в частности квартир), которая, проанализировав объявления в интернете, сможет оценивать их реальную стоимость. Клиент - условное агентство недвижимости, которому нужно автоматизировать процесс определения рыночной стоимости квартир и анализа рынка.

Задача сводится к мониторингу объявлений рынка недвижимости и обучению системы по ним (мы ее назвали РиэлтПред). Когда системе предоставляются на анализ новые объявления, она должна оценить предложение и вынести вердикт, справедлива ли цена или нет, привести аргументы за и против. Мы имеем большой опыт в разработке подобных систем.

АЛГОРТИМ РАБОТЫ СИСТЕМЫ

РиэлтПред собирает объявления с самых популярных площадок о продаже и покупке недвижимости: ЦИАН, Авито, часть Яндекс.Недвижимость (так как Я.Н является больше аггрегатором нежели площадкой). С помощью композиции алгоритмов (таких как TF-IDF и градиентный бустинг, о них поговорим подробнее в следующей статье), РиэлПред находит закономерности в цене объявлений и выясняет влияние харакетристик недвижимости на цену. По полученным сведениям системы оценивает вновь поступаемые объявления на предмет выгодности покупки.

Например, если квартира на ЦИАН стоит 9 млн, а ее среднерыночная цена — 10 млн, то  можно заработать миллион на выгодной сделке без особых проблем. В случае завышенной стоимости программа укажет на негативные параметры объявления, риэлтор оценит объект и укажет предварительную стоимость жилья без визита на объект.

РиэлтПред оценивает важность всех характеристик объектов недвижимости и их влияние на итоговую цену.

Предположим, в системе указан параметр оценки жилья "близость к метро". 15 минут ходьбы до станции для одного человека могут оцениваться так же, как и 5 минут для другого. Система рассчитывает стоимость объекта в зависимости от расстояния, используя указанные геоданные.

Тип дома - также очень важный параметр. Квартира в панельном доме серии КОПЭ дороже, чем в доме серии И-15, даже в силу возраста домов. Квадратный метр в домах серии П-44, дороже чем в КОПЭ. Дома с индивидуальными планировками ценятся еще выше, так как они зачастую обладают качественной отделкой и современной инфраструктурой.

Сильно влияет на оценку объектов и размещение на этажах. Квартиры на первом этаже продаются на 10% дешевле, так же как и на последнем, без технического этажа.

Не стоит забывать о вторичном жилье и новостройках. Квартиры в новых домах — не всегда выгодная сделка, т. к. часто не являются основным жильем собственников, и они редко идут на уступки. Жилье во «вторичках» обустроено для въезда «здесь и сейчас», а потому есть шансы на быструю и выгодную сделку.

Собственники  склонны завышать стоимость на жилье. Допустим, продавец продает квартиру с хорошим ремонтом на 500 000 выше рыночной стоимости, желая окупить стоимость ремонта годовалой давности на 100%, в то время как покупатели склонны менять ремонт в первый год  после покупки жилья. Программа собирает текстовые объявления со словом «евроремонт» и выдает стоимость квартиры по объявлению наряду с указанной среднерыночной стоимостью жилья. Риэлтор выезжает на объект, оценивает квартиру по всем параметрам и указывает реальную цену.

БОРЬБА С МОШЕННИЧЕСТВОМ

К сожалению, рынок недвижимости является одним из самых мошеннических. Существует множество серых схем, которые тяжело анализировать на этапе анализа объявлений. Нередки объявления-приманки с фиктивными фотографиями и заниженной ценой, когда недобросовестные риэлторы указывают неправильный адрес для завлечения. Но мы отлавливаем такие “мусорные” объявления на раннем этапе: анализируем схожесть текстов, проверяем дубли фотографий, помещаем в черный список номера мошенников, проводим сравнения с другими объявлениями в подобных домах и др.

В ЗАКЛЮЧЕНИЕ

При решении этой задачи мы также выясняем, какиехарактеристики квартир наиболее весомые в определении цены (конкретно за квадратный метр Москве). Вы будете “удивлены”, но это близость метро и тип дома. А самым незначительный из общих параметров квартиры - количество комнат - этот фактор точно не влияет на стоимость квадратного метра.

РиэлтПред позволяет понять, по каким параметрам продавцы склонны завышать или занижать стоимость недвижимости. Анализ данных даст представление о поведении клиентов и продавцов и окажет большое влияние на отрасль. Также есть преимущества в виде специализированных услуг оперативного принятия решений.