Трансляция главного события марта на MacDigger уже началась!

Самое интересно, самое важное из того, что сегодня происходит в театре имени Стива Джобса — прямая трансляция весенней презентации Apple!

Apple впервые поделилась своими успехами в области искусственного интеллекта

В начале декабря Apple заявила о своем намерении опубликовать результаты исследований искусственного интеллекта (ИИ). На этой неделе компания анонсировала метод улучшения синтетических изображений, предназначенных для тренировки нейросети. Это первая официально опубликованная в общем доступе работа, касающаяся разработок компании.

gaxze-recognition-1

Apple вплоть до недавнего времени придерживалась закрытой политики и информации о различных исследовательских работах, в том числе в сфере машинного обучения. Однако в декабре Руслан Салахутдинов, недавно возглавивший в Apple исследовательское подразделение по разработкам в области искусственного интеллекта, заявил, что компания меняет свою политику и теперь работы будут публиковаться, а сотрудники смогут открыто взаимодействовать с научным сообществом.

В первой опубликованной Apple работе описывается метод улучшения синтетических размеченных изображений, которые используются для быстрого обучения нейросетей, сообщает Nplus1. При обучении крайне важен объем и качество данных, на примере которых обучается программа, однако в некоторых случаях подходящей информации может попросту не оказаться в нужном объеме — например, для тренировки нейросети, которая поможет управлять различными устройствами взглядом, необходимо большое количество размеченных фотографий глаз. Разметка больших баз вручную — трудоемкий процесс, поэтому исследователи, решающие подобные задачи, нередко используют вместо реальных фотографий рендеры изображения глаз.

gaxze-recognition-2

У нейросетей, натренированных на синтетических изображениях, проявляется новая слабость — они хуже распознают реальные фотографии, поскольку они не использовались в обучении или использовались в значительно меньшем количестве, чем синтетические. Одно из возможных решений — использовать бóльшие вычислительные мощности при создании изображений для повышения их реалистичности, однако такой метод ведет к ощутимому удорожанию работы.

Чтобы решить существующие проблемы с генерируемыми изображениями, разработчики из Apple решили использовать промежуточную нейронную сеть, которая помогает создавать набор данных для обучения. Программа использует размеченное синтетическое изображение и неразмеченную реальную фотографию для создания на выходе нового улучшенного изображения, которое сохраняет в себе направление взгляда и разметку от синтетического. Фактически, стиль фотографии переносится на сгенерированное изображение глаза.

gaxze-recognition-3

Для проверки эффективности и правдоподобности улучшенных таким образом изображений авторы показывали десяти испытуемым 50 реальных фотографий и 50 улучшенных сгенерированных изображений. Одновременно каждый доброволец видел 20 картинок из обеих категорий и должен был отметить реальные и сгенерированные изображения. В результате из 1000 изображений испытуемые правильно отметили 517 (p = 0,148), что практически не отличается от случайного угадывания. В то же время, при демонстрации синтетических изображений без улучшения и реальных фотографий добровольцы отнесли к верной категории 162 картинки из 200 (p ≤ 10-8), что существенно отличается от случайного угадывания.

Кроме проверки с помощью добровольцев авторы также проверили эффективность новых изображений с помощью нейросети, которую натренировали на улучшенных картинках. Алгоритм, обучавшийся на улучшенных изображениях, показал результат распознавания направления взгляда на 22,3% выше, чем такая же нейросеть, натренированная на обычных синтетических изображениях.

Правильное определение направления взгляда может быть использовано для управления устройствами в самых разных сферах — например, для перемещения в VR-играх, предсказывания маневров водителей до их совершения или управления военными беспилотниками.

Источник: MacDigger.ru

Следите за новостями Apple в нашем Telegram-канале, а также в приложении MacDigger на iOS.

Присоединяйтесь к нам в Twitter, ВКонтакте, Facebook, или через RSS, чтобы быть в курсе последних новостей из мира Apple, Microsoft и Google.


8 комментариев

  • А это та же технология на которой нашумевшее приложение Призма построено)))
  • Достаточно интересно)
    • Объясните, тем, кто ничего не понял по-проще?
      • Объясняю, ИИ у IBM гораздо круче чем от еппол. и может куда больше. А еппол пытается привлечь к себе внимание такое ошушение, из-за новостей, что они устарели лет так 5 посравнению с конкурентами.
  • ничего не понял но это круто
  • Александр 2 года назад
    0
    не понял нифига
  • Голосуем:
  • ИИ - Скайнет. Apple - сайбердайн системс Terminator - новый робот помощник, которого эппл выпустит в массовое производство.