ООО «Стерникс Консалтинг»
(Sternik's Consulting)
+7 (495) 749-77-65
Информационный
партнер:
информационный партнер

Библиотека

Применение нейросетей на рынке недвижимости (Евгений Бодягин)

О роли объявлений на рынке недвижимости

Сравнивая объявления недвижимости с котировками ценных бумаг можно говорить о том, что оба источника информации говорят о готовности продать (купить) товар. В первом случае товаром является ценная бумага во втором – объект недвижимости. Теперь о различиях. Вообще, ценные бумаги – товар более стандартизированный, особенно если говорить о «первом эшелоне» акций. На объявления по недвижимости ложится более весомая нагрузка по сравнению с котировками. За объявлениями стоят самые разнородные объекты, и задача объявлений заключается не только в заявке продать определенное количество квадратных метров, но и в описании самого товара. Если дополнительная информация по акциям может быть получена с сайтов выпустивших их эмитентов, создание сайта на каждый предлагаемый объект недвижимости представляется малореализуемым.

Итак, во-первых, то, что стоит за объявлениями о недвижимости стандартизировать труднее. Во-вторых, существуют естественные ограничения на объем информации, который может быть передан.

Податель объявления должен как минимум:

1. уложиться в максимум 200 символов;

2. описать главные параметры;

3. донести позитивную эмоциональную окраску;

4. привлечь внимание потенциального покупателя именно к своему объекту.

Язык объявлений

У объявлений свой язык, язык который весьма отдаленно напоминает язык Пушкина и Лермонтова. Плохо ли это? Навряд ли, просто язык объявлений, это, прежде всего, язык передачи информации. Такие тексты можно быстрее читать. Вероятность сфокусировать внимание на нужной позиции повышается.

Сила слова

При составлении объявлений участники рынка вкладывают в каждое слово определенное значение. За фразой стоит сумма в рублевом эквиваленте. Есть ли в тесте объявления строчки «с мебелью» или их нет? Присутствует ли выражение «возможно под нежилое» и т.д.?

Проблема достоверности информации в объявлениях

Рассмотрим два объявления: в первом встречаются слова «о прекрасном виде из окна», близости автобусной остановки; во втором эти термины отсутствуют. Вероятно, первая квартира при прочих равных условиях будет дороже второй. Вместе с тем, можно считать, что податель первого объявления нашел аргументы для того чтобы установить большую цену, а второй не нашел плюсов в собственном объекте недвижимости. Эта проблема решается увеличением анализируемой выборки (до 2000). Если вид из окна и автобусная остановка есть на самом деле, большинство участников рынка о ней все же упомянут. Другими словами, при обработке действительно больших массивов данных количество информации порождает ее качество. Большинство людей не склонно скрывать положительные стороны предлагаемого ими товара.

Лингвистический анализ – инструмент переговорщика

При проведении анализа «словарного набора» из которого состоят объявления (лингвистического анализа) следует понимать, то, что если фраза/слово присутствует в тексте, значит, оно несет определенный смысл для составителя объявления. Велика вероятность того, что встретившись с подателем объявления «вживую» обоснование требуемой цены будет происходить с употреблением именно тех самых аргументов, о которых он уже упоминал в газете. Таким образом, с помощью анализа соответствия слов-аргументов и цены объявления можно подготовиться к будущим переговорам с продавцом.

Немого статистики

Строго говоря, при использовании лингвистического анализа следует рассматривать комбинации слов, например пара «мебель» и «хрущевка» дает меньший эффект в цене чем «мебель» и «Исторический центр». И все же, для примера, рассмотрим небольшой набор отдельных слов встречающихся в объявлениях:

1. об отличном либо хорошем состоянии прилегающей территории (детская площадка, подъезд и проч.)

Общее число объявлений с поисковыми словами->482

- из них с ценой выше средней->248

- из них с ценой ниже средней->203

- из них с ценой соответствующей средней->31

- из них с ценой выше своего значения нейросети->214

- из них с ценой ниже своего значения нейросети->268

Среднее отклонение при упоминание поисковых слов от средней-> 1985.45 руб.

Среднее отклонение при упоминание поисковых слов от значения нейросети-> 204 руб.

2. упоминание о наличии раздельного санузла

Общее число объявлений с поисковыми словами-> 989

- из них с ценой выше средней-> 439

- из них с ценой ниже средней-> 451

- из них с ценой соответствующей средней-> 99

- из них с ценой выше своего значения нейросети-> 441

- из них с ценой ниже своего значения нейросети-> 548

Среднее отклонение при упоминание поисковых слов от средней-> 548.87 руб.

Среднее отклонение при упоминание поисковых слов от значения нейросети-> 182.11 руб.

3. упоминание о том, что квартира продается с мебелью, встроенной кухней и проч.

Общее число объявлений с поисковыми словами-> 279

- из них с ценой выше средней-> 180

- из них с ценой ниже средней-> 75

- из них с ценой соответствующей средней-> 24

- из них с ценой выше своего значения нейросети-> 109

- из них с ценой ниже своего значения нейросети-> 170

Среднее отклонение при упоминание поисковых слов от средней-> 4942.59 руб.

Среднее отклонение при упоминание поисковых слов от значения нейросети-> -1739.24 руб.

4. упоминание о лоджии, балконе

Общее число объявлений с поисковыми словами-> 1758

- из них с ценой выше средней-> 788

- из них с ценой ниже средней-> 801

- из них с ценой соответствующей средней-> 169

- из них с ценой выше своего значения нейросети-> 816

- из них с ценой ниже своего значения нейросети-> 942

Среднее отклонение при упоминание поисковых слов от средней-> 619.9 руб.

Среднее отклонение при упоминание поисковых слов от значения нейросети-> 645.7 руб.

Под средней ценой здесь понимается средняя цена за 1м2 по объектам (квартирам) в том же районе что и объект, по которому было составлено объявление, с таким же количеством комнат (на дату составления объявления).

Под значением нейросети понимается значение, полученное для квартиры на основании слов-аргументов, которые присутствовали в тексте объявления. Нейронная сеть имеет архитектуру: многослойный персептрон (MLP).

Объем исследуемой выборки: 3 133 объявлений.

Рассмотрим упоминание об отличном либо хорошем состоянии прилегающей территории (детская площадка, подъезд и проч.). Из 3 133 объявлений с такими поисковыми фразами/словами их оказалось 482. 248 имеют цену выше средней, 203 – ниже; 31 - соответствуют средней. Таким образом, при описании квартиры составители объявлений полагают, что факт хорошего состоянии прилегающей территории является одним из решающих аргументов, которые в ходе беседы с покупателем могут обосновать большую стоимость. Среднее отклонение в данном случае говорит о том, что составители объявлений в среднем за счет данного аргумента увеличивают стоимость на 1985.45 рублей на 1 квадратный метр.

Похожая ситуация наблюдается с аргументом мебель: 180(!) заявок на продажу имеют стоимость выше средней, и лишь только 75 ниже. Т.е. заявители, упомянувшие о мебели в 2,4 раза чаще выставляют квартиру дороже уровня средней цены. Сопоставление со средней говорит о том, что авторы объявлений завышают стоимость на 4942.59 руб. над средней ценой.

Лоджия (балкон) и раздельный санузел – эти аргументы имеют наиболее высокие показатели относительно цен, которые соответствуют средним. Это говорит о том, что если соответствующие фразы и упоминаются, то лишь для того, чтобы «просто было», «как у всех» подателей объявлений, либо у заявителей не нашлось больше аргументов, для того чтобы повысить цену за объект. Подобные фразы можно отнести к шумовым эффектам, не содержащим какой либо качественной информации. Об этом говорят цифры с общим количеством объявлений по данным фразам: у лоджии и балкона: 1758 объявлений, у аргумента «раздельный санузел» 989 объявлений.

Нейронная сеть «обучается» на заявках продавцов и определяет цену, принимая во внимание не только четыре описанных аргумента, но и такие как: Район, Количество населения района, Широта района, Долгота района, Отдаленность района от города км, Цена продажи объекта общая, Количество комнат, Тип дома, Этаж, Этажность, Материал наружных стен, Общая площадь объекта, Площадь кухни объекта, Лоджия (балкон), Мебель, Интернет, Телефон, Санузел, Год постройки, Состояние отделки, Охрана, Парковка автотранспорта, Домофон, Лифт, Состояние подъезда, прилегающей территории, Наличие реки, озера в пешеходной доступности и т.д. всего 89 аргументов.

Данные нейросети формируются как раз на комбинациях словосочетаний; она может дать более точные оценки. Упоминание такого аргумента как мебель характеризуется тем, что цены на квартиры в которых упоминается мебель не завышены (смотрите сопоставление со средней), а наоборот, участники рынка, упоминавшие о мебели вправе запросить дополнительно 1 739.24 за квадрат. Нейросеть говорит о том, что в принципе упоминание лоджии/балкона и раздельном санузле, приводит к незначительному повышению над средней: 645.7 руб. и 182.11 руб. соответственно.

Рассмотренные здесь значения имеют место быть на 2010-06-16. Поскольку рынок меняется каждый день, меняются и аргументы для обоснования цен продавцами. Целью описания вышеприведенных данных было ознакомить читателя с логикой сравнения отдельных показателей. С текущими данными можно ознакомиться на странице: http://gdedom.com/linguistic_analysis_of_announcements/

Результаты статистики - практикам!

Когда начинается торг по объекту недвижимости? С момента первого звонка по объявлению? Раньше. Торг уже начался. Каждое слово в объявлении на вес золота. Каждое слово носит единственную роль – убедить покупателя, что именно его квартира – лучшая. Каждое слово – аргумент. В то же время аргументы бывают основательными либо безосновательными. Используя данные средних отклонений можно вести аргументированный торг. Когда слово имеет ценовой эквивалент, эмоции уступают место делу. Аргументируя словом лишь словом колясочная в хрущевке и указывая цену в 80 тыс. руб. за метр квадратный на фоне других предложений Ваш аргумент будет не убедительным. Таким образом, определенным словам-аргументам можно сопоставить определенные значения цены. Если набор слов-аргументов соответствует более высокой цене, а в объявлении указана невысокая цена у профессионального участника рынка появляется возможность проконсультировать подателя объявления о том, что цену можно было бы и повысить (с попутным предложением услуг оформления сделки, разумеется). По выражениям, встречающимся в объявлениях можно, что называется "прослушать рынок" выявляя с помощью нейросетевых моделей, объекты с заниженными ценами (http://www.gdedom.com/neural_network_value_all/).

Евгений Бодягин, тел. +79044951403

Объявления

04.10.2019.

В связи с 10-летием выхода монографии Г.М.Стерника и С.Г.Стерника "АНАЛИЗ РЫНКА НЕДВИЖИМОСТИ ДЛЯ ПРОФЕССИОНАЛОВ" Москва, издательство "ЭКОНОМИКА", 2009 г.-606 с. компания "Стерникс Консалтинг" осущ

04.09.2019.

Информационное агентство "Строительство" Подробнее...

29.08.2019.

Московская Ассоциация Риэлторов провела АНАЛИТИЧЕСКУЮ НАУЧНО-ПРАКТИЧЕСКУЮ КОНФЕРЕНЦИЮ «РЫНОК НЕДВИЖИМОСТИ: СИТУАЦИЯ, ТЕНДЕНЦИИ,