Новая компания сооснователя Maps.Me Юрия Мельничка AIMatter сложилась совсем недавно, но к Новому году они уже успели запустить первый продукт — мобильное приложение Fabby. Оно играет в модной сейчас нише «нейросети для селфи», но у Мельничка большие планы и на приложение, и на компанию. О желании развивать IT в Беларуси, серьёзности забавных картинок, старой команде в новом проекте и новой команде в старом проекте Мельничек рассказал в интервью «Роем!».

Сергей Уланкин: Ты отошёл от операционного руководства Maps.me в начале года, но некоторое время оставался консультантом. Ты участвовал в выборе Евгения Лисовского на пост руководителя?
Юрий Мельничек: Конечно.
И почему выбрали именно его?
Мы смотрели в первую очередь на профессиональные качества: хотелось увидеть, с одной стороны, лидера, с другой стороны, чтобы он понимал и в маркетинге, и в бизнесе, и в мобильных продуктах. «Литрес» — это как раз история про мобильные продукты и маркетинг. И по личным, лидерским качествам Женя всем очень понравился. Как оказалось, мы не ошиблись. Мне очень нравится, какую он деятельность сейчас ведёт.
Ты имеешь в виду планы монетизировать сервис через Uber и доставку еды?
Это да. Но ещё пиар в open-source-сообществе, интеграция с Open Street Map — там тоже всё не просто, в этом он тоже молодец.
Лисовский, CEO Maps.me: Зачем Uber нужен свой картографический проект
Первый партнёр по монетизации Maps.me был Booking. Это же была ещё твоя идея?
На самом деле это была идея в самом первом бизнес-плане ещё лет пять назад. (смеётся) Но об этом лучше говорить в интервью с Женей.
Но раз задумка была твоя, то ты можешь оценить, правильно ли Maps.me сейчас всё делает. Есть Booking, Uber, Delivery Club, а дальше что? Ведь не так много таких глобальных компаний. Придётся спускаться на локальный уровень.
Есть глобальные агрегаторы еды, экскурсий и многих других вещей. Но я бы не сказал, что идея моя, она просто лежала на поверхности.
Что вы ещё пять лет назад в бизнес план написали?
Мы думали так: когда человек пользуется картой, то он либо знает, куда ему нужно, но не знает, как туда попасть, либо знает, какая ему услуга нужна, но не знает где. Ближайшие магазины, аптеки — все запросы так или иначе связаны с коммерцией. А путь из точки, А в точку Б — это транспорт, не обязательно такси, есть и самолёты, и общественный транспорт.
Я правильно понимаю, что ты намекаешь на схему, отработанную в 2ГИС. Если ты ищешь ближайшую крафтовую бургерную, то первой строчкой тебе покажет ту бургерную, которая заплатила 2ГИС.
Такая схема тоже имеет право на жизнь. Вопрос в том, как это сделать не так навязчиво, как в 2ГИС. Если есть задача зарабатывать деньги, то можно смотреть и на конкурентов тоже.
Когда ты начинал Maps.me, не было ощущения, что вы выходите на занятый рынок?
Нет. Скорее был такой момент, когда все вокруг говорили, что Google всё-всё захватит.
И ещё когда мы начинали, все говорили, что пройдёт ещё три года и интернет будет везде, вообще везде. Зачем какой-то офлайн, кеширование делать? Чуть-чуть подождать, и интернет будет в каждой точке планеты.
А сейчас, Google советует разработчикам учитывать то, что их приложения используются часто там, где интернета нет.
Мы пошли против тренда. А оказалось, что тренд-то был ошибочным, а наше мнение — верным.
А сейчас у тебя нет ощущения, что Fabby тоже выходит на переполненный рынок?

Нет. Сейчас такое время, что технологии уже позволяют, а приложений мало. Можно придумать с десяток крутых применений, которые до сих пор не реализованы. Мне кажется, что сейчас ситуация диаметрально противоположная.
Есть мнение, что это быстро схлопывающийся тренд: вирусная волна популярности, которая быстро схлынет.
Если ничего не делать, может так и будет. Наша первоочередная задача сейчас — посмотреть реакцию рынка и кейсы, где наши технологии не работают. Пока это только развлекательное применение. Намного круче это всё будет работать в режиме реального времени. Например, можно будет менять фон, разговаривая по видео связи, что может быть полезно в корпоративной среде.
Сейчас уже есть идеи, как это можно применить на b2b-рынке?
Я уже сказал про самое очевидное — заменять фон во время видеосвязи, чтобы человек не видел, что происходит у тебя за спиной. К нам приходят запросы от товарищей, которые, условно говоря, пользуются продуктами Adobe — им нужно обтравливать фотографии, снимать на фоне зелёного экрана, но мы фокусируемся на b2c-рынке.
Я тоже хотел намекнуть на съёмку кино и наложение спецэффектов.
Когда технология будет на таком уровне, чтобы она подходила для тех, кто снимает кино — посмотрим. Мы ещё смотрим в сторону Twitch и прочих подобных вещей. Стримеры же обычно показывают себя поверх экрана с игрой.
Если набрать массив публичных фотографий и натренировать сеть на нём, то пользователи всё равно будут использовать приложение по-другому. Когда мы запустили пилот Fabby, то оказалось, что люди не фотографируются так, как выкладывают себя в публичное поле. В реальности и освещение хуже, и шумов больше, и позы немного другие. Всё приходит к тому, что идеально модель может обучаться только на реальных пользователях. Сейчас наша задача — научить модель всему разнообразию, что ей подсовывают. Как оказалось, люди любят специально фотографировать кошек, собак…
И это ты ещё про неприличные фотографии не говоришь.
(смеётся) Но я пока таких не видел, но думаю, что и они будут. Если серьёзно, мы будем либо их выкидывать, используя для определения другую нейронную сеть, либо делать так, чтобы у людей к ним не было доступа, только у алгоритмов.
Ты говорил, что спонсорские фильтры у вас будут проще, чем у конкурентов.
Если мы говорим про абстрактную Coca-Cola, то мне легко представить как сделать из неё прикольный фон. Если мы говорим про Prisma, то неочевидно, как натренировать сеть так, чтобы это было похоже на Coca-Cola. У Prisma очень круто получился стиль Gett, например. Но у Gett очень узнаваемая корпоративная стилистика. Это если мы говорим про нейростили. Если говорить про маски, то понятно, как можно рекламировать фильмы и некоторых других рекламодателей, но в основном это менее очевидные способы. Если говорить про замену фона, то здесь это сделать проще и вариативность больше.
Расскажи про скорый запуск видео — как это будет выглядеть? Движущийся человек и движущийся фон или статичный фон?
Движущийся человек и слегка движущийся фон. Мы хотим, чтобы с помощью Fabby можно было записать новогоднее поздравление и отправить его друзьям.
Можно сказать, что вы специально торопились запуститься до Нового года?
Да. И ещё мы хотели успеть чуть раньше, чем начнётся зашумление всех каналов брендами, распродажами и всем остальным.
Юрий Гурский был ментором Prisma, ментором MSQRD. Можно сказать, что он серийный ментор приложений с прикольными картиночками. Чем он занимается в Fabby?
Он помогает со стратегией, с маркетингом, с продуктом.
Со всем то есть?
Кодить не помогает.
Какая у вас долгосрочная цель? Хотите растить большую компанию, которая будет заниматься компьютерным зрением, или цель — продаться Facebook или Snapchat?
Долгосрочная цель у нас такая — делать в Беларуси исследовательский центр по нейросетям, компьютерному зрению и распознаванию звука. Fabby мы сейчас немного отделяем от этих планов. AIMatter сейчас работает над одним продуктом, а потом посмотрим. Мне нравится такой пример: все школьники хотят стать космонавтами, а в процессе обучения их планы меняются. Я, правда, программистом хотел стать…
Мечта сбылась.
(смеётся) Но вообще дети хотят стать космонавтами, а потом как сложится. Сложно строить стратегию в начале пути. Понятно, кому бы это хотелось купить. Понятно, как на этом зарабатывать, если строить отдельный продукт и развивать. Сейчас мы просто работаем над тем, чтобы алгоритмы работали идеально и продукт был интересен пользователю. Если всё это получится, то куда это потом вести — меньший из вопросов.
Ты упомянул компьютерное звукораспознавание. Чем вам эта сфера интересна и что в ней сейчас происходит?
Вся концепция нейронных сетей хорошо зашла в компьютерное зрение. А в звуке всё ещё много проблем, поэтому говорю я об этом осторожно. Сейчас у нас есть путь от фото к видео, а звук является важной частью видео. Потому он нам и интересен с продуктовой точки зрения.
Я слышал много команд, которые пытались применить концепцию Леона Гатиса для звука (она используется для нейростилей, когда алгоритм учиться воспроизводить одно изображение в стиле другого — «Роем!»), но никаких выдающихся результатов пока не добились. Я думаю, что во многом это — вопрос времени, но, с другой стороны, дух предпринимательства заставляет нас заниматься этим. Но афишировать что-то пока ещё очень рано.
В чём разница между Prisma, Artisto и Vinci — с технической точки зрения
Looksery из Украины, MSQRD из Беларуси, Prisma из России. Почему именно славяне делают популярные приложения для обработки картинок?
Во-первых, здесь нужно сказать, что у Prisma и MSQRD был общий ментор.
Когда что-то начинает хорошо расти, то информация распространяется по кругу общения. Я не был в Китае, но говорят, что у них есть области, которые занимаются только одним каким-то видом производства. Просто исторически так сложилось — у кого-то стало получаться, информация стала распространяться в этой области, и все стали заниматься этим. Возможно это просто близкий язык и география.
Хочешь сказать, что делать приложения для обработки фото — это наш особый славянский путь?
Ну это не то чтобы путь. Просто случился перенос знаний. Сейчас как раз есть такая модная концепция в нейронных сетях — когда ты её учишь чему-то одному, а потом она быстро принимает другие знания.
Ещё нужно понимать, что, не буду говорить за Россию, но в Беларуси, если ты молодой умный человек, ты хочешь остаться в стране и жить достойной жизнью, идти в IT — это единственное, что ты можешь сделать. В России есть ещё газ и нефть, а в Беларуси только IT. В Украине такая же ситуация, насколько я знаю.