С завидной регулярностью появляются приложения и алгоритмы, способные определить, что изображено на фотографии, и даже распознать, смешная картинка или нет. Для чего нужны все эти разработки, и как они повлияют на наше будущее?

Новые разработки и открытия в сфере науки и техники из разряда событий века превратились в ежедневную сводку новостей. Ученые уже научились восстанавливать зрение, лечить ВИЧ и даже делать бионические протезы. А инженеры доводят до совершенства технологию «умного дома», который организует пространство и потребление ресурсов так, чтобы минимизировать вредное воздействие на окружающую среду и освободить жильцов от необходимости следить за показателями приборов и, вообще, думать о доме.

На фоне таких научных прорывов, алгоритмы и приложения для распознавания фотографий, кажутся лишь детской забавой для тех, кому надоело просто фотографировать и хочется чего-то нового. Но это не так. За этими открытиями — будущее фототехники, рекламы, маркетинга и других сфер жизни человека.

Мы сделали обзор последних достижений в мире фототехнологий и попросили эксперта дать им оценку и рассказать, к чему это приведет.

 

Найти похожих людей

В прошлом году российский стартап N-techlab по распознаванию лиц на фотографии неожиданно для многих обошел конкурентов из Google и Пекинского университета и победил в конкурсе алгоритмов The MegaFace Benchmark.

А в феврале 2015 они же запустили первый в мире сайт знакомств FindFace с функцией поиска похожих лиц. Приложение работает на основе профилей «ВКонтакте». Точность определения и поиска человека по фото — 70%.

we will be able to read people's minds by photo in ten years - 1

Популярность сервиса растет с каждым днем, и по состоянию на конец февраля 2016 число зарегистрированных пользователей достигло 100 тысяч.

 

Определить, где сделана фотография

Последняя новинка от Google — нейронная сеть PlaNet, которая способна определить, где был сделан снимок. На данном этапе разработки система может вычислить место по геотегам, но в будущем планируется работа без дополнительных «подсказок» — на основе доступных деталей фотографии (пейзаж, цвет, особенности архитектуры, характерные животные и растения).

we will be able to read people's minds by photo in ten years - 3

Чтобы обучить нейронную сеть распознавать места, специалисты использовали коллекцию из 90 миллионов изображений.

 

Пол, возраст и эмоции

how-old.net — сервис Microsoft, который определяет пол и возраст людей, изображенных на фотографии. Пол в большинстве случаев распознается верно, чего не скажешь о возрасте.

we will be able to read people's minds by photo in ten years - 4

Кроме этого, в Microsoft разработали алгоритм по распознаванию эмоций. Они классифицируются по восьми категориям: злость, удовлетворение, отвращение, страх, счастье, нейтральное выражение, грусть и удивление.

we will be able to read people's minds by photo in ten years - 8

По мнению пользователей и самих разработчиков, результаты определения эмоции также не идеальны, но более точны, чем пол и возраст.

Кстати, нейронные сети Microsoft оказались в пять раз эффективнее нейронных сетей конкурентов (Google, Intel, Qualcomm и Tencent).

 

Узнать породу собаки

Компания Microsoft в рамках экспериментальных проектов разработала сервис What Dog, определяющий породу собак. Можно загружать как свои изображения, так и находить их с помощью поисковика Bing.

Система узнает только популярные породы собак и не распознает редкие виды или помеси. И не пытайтесь загружать котов, сервис все равно запишет их в собаки.

1 / 2

we-will-be-able-to-read-peoples-minds-by-photo-in-ten-years-6-2we will be able to read people’s minds by photo in ten years – 6

we-will-be-able-to-read-peoples-minds-by-photo-in-ten-years-13we will be able to read people’s minds by photo in ten years – 13

По словам Митч Голдберг, главы британского исследовательского отдела Microsoft Research, им хотелось разработать такой алгоритм, который бы распознавал изображения по какому-то одному заданному критерию, например, породе собак.

 

Смешно/несмешно

Благодаря усилиям исследователей из Политехнического университета Вирджинии, Технологического института Toyota и подразделения Microsoft Research нейронные сети способны определять — смешная картинка или нет.

Ученые сделали подборку клипартов на различные темы и попросили добровольцев составить из них коллажи. Главное условие — чтобы они были смешные. Другая группа желающих оценивала получившиеся изображения, выставляя им оценки от 1 до 5.

На основе полученных данных исследователи обучили нейронную сеть, которая теперь способна определить комичность иллюстрации. Если же, по мнению программы, картинка недостаточно смешная, она автоматически заменит некоторые элементы таким образом, чтобы они добавили юмора к конкретному изображению.

we will be able to read people's minds by photo in ten years - 9

 

Поменяться лицами

Недавно в Appstore появилось приложение Face Swap Live, которое способно заменять лица героев на фото или видео в реальном времени. Программа может поменять местами лица двух людей или совместить лицо с любым изображением из интернета.

we will be able to read people's minds by photo in ten years - 15

 

Определить степень запоминаемости снимков

Ученные исследовали, сколько изображений человек запомнит за четыре с половиной минуты, обработали результаты, обучили нейронную сеть и создали программу LaMem, которая определяет запоминаемость изображений.

Чтобы проверить, как работает сервис, загрузите файл, программа построит «тепловую карту» самых примечательных мест на изображении и рассчитает индекс запоминаемости.

we will be able to read people's minds by photo in ten years - 14

По мнению ученых, точность, с которой инструмент запоминает фотографии, сходна с аналогичной деятельностью человеческого мозга.

 

Зачем все это нужно, и что нас ждет в будущем? Мнение эксперта

 

we will be able to read people's minds by photo in ten years - 12

Владимир Горшенин, руководитель научно-исследовательской группы PressFoto. 

— Для чего крупные мировые компании занимаются созданием подобных алгоритмов?

Потенциал у этих алгоритмов огромен. Глобальная цель исследователей — научить машину мыслить и воспринимать мир так же, как человек, и понять, как он думает.

Все эти алгоритмы можно использовать в рекламе, маркетинге и самой фотографии. Сейчас создается огромное количество контента, и люди просто не успевают быстро его обрабатывать. Идеально решение — научить роботов выполнять эту работу. Кроме этого, встроенные алгоритмы могут определить по выражению лица человека — понравился ему рекламный ролик или нет.

Также в будущем эти сервисы могут быть встроены в камеры и мобильные телефоны, чтобы автоматически снимать только тогда, когда человек улыбается, к примеру.

— Распространено ли это в России?

Не исключено, что разработками нейронных сетей занимается Яндекс. Но в целом, к сожалению, в России подобная деятельность не поддерживается. Поэтому такими проектами занимаются небольшие группы энтузиастов. Конечно, чтобы добиться действительно больших успехов, нужны серьезные вложения, ресурсы.

— Что ждет нас через десять лет?

Можно будет даже читать мысли человека по выражению его лица! С большой долей вероятности это будет. Если уже сейчас по отпечаткам пальцев можно определять склонности и предпочтения человека, а по рисунку ладоней — хронические заболевания детей.

Конечно, если вы боитесь тотальной слежки, эти технические новинки и прогнозы на будущее вряд ли вас обрадуют. Но поверьте, переживать не стоит, если только вы не суперпопулярная знаменитость, о личной жизни которой хотят знать миллионы людей по всему миру, или не собираетесь ограбить банк.

Оставить комментарий