Дизайн пользовательского опыта

Глава 19

Как усовершенствовать человека?

В юности я смотрел повторные показы телевизионного шоу 1970-х годов о пилоте NASA, пережившем ужасную катастрофу. По сценарию ученые заявляли: «Мы сумеем восстановить его! У нас есть для этого необходимая технология!» И действительно, пилот возвратился к жизни для того, чтобы стать «Человеком, стоившим шесть миллионов долларов» (по нынешнему курсу уже около сорока). Один его глаз мог масштабировать изображение, одна рука и обе ноги были бионическими, он бегал со скоростью более 90 километров в час и совершал невероятные подвиги. В шоу он использовал свои сверхчеловеческие способности, чтобы служить человечеству.

Это было одно из первых популярных шоу, показавших, чего можно достичь на основе симбиоза технологий и человеческого организма. Я не уверен, что шоу стало бы настолько коммерчески успешным, если бы авторы назвали его «Киборгом, стоившим шесть миллионов долларов», но, по сути, герой был именно им, то есть гибридом человека и машины.

В нынешних условиях подъема и невероятного распространения искусственного интеллекта и машинного обучения у нас появляются новые возможности. Я уверен: если вы работаете в области продуктового менеджмента, продуктового дизайна или инноваций, то наверняка слышали множество разных прогнозов о том, что нас ждет в будущем. Здесь я хотел бы упомянуть только об одной наиболее перспективной возможности — анализе человеческого подхода к расчетам и его поддержке системами машинного обучения. Цель в этом случае состоит не в том, чтобы достичь безграничных физических возможностей, а в том, чтобы расширить возможности интеллектуальные — до пределов, не виданных ни в одном телевизионном шоу.

Зима символического искусственного интеллекта

Не уверен, что вы это понимаете, но сейчас, когда я пишу эту книгу, нас захлестывает по меньшей мере вторая волна ажиотажа вокруг искусственного интеллекта. В 1950-х и 1960-х годах Алан Тьюринг утверждал, что с помощью 0 и 1 можно записать любое математическое выражение, если предположить, что компьютер способен действовать в соответствии с правилами формальной логики. После этого нейробиологи и специалисты по обработке информации начали задаваться вопросом, можно ли создать искусственный мозг, мыслящий в рамках формальной логики, если учесть способность нейронов мозга генерировать или не генерировать потенциал действия (то есть выдавать значение 1 или 0). Тьюринг предложил тест, который получил его имя и заключался в следующем: если вы ставите вопросы некой сущности, а сущность отвечает на них так, что человек не способен отличить ее ответы от ответов человека, то тест пройден и такую сущность можно считать искусственным интеллектом.

С тех пор многие исследователи, например Герберт Саймон, Аллен Ньюэлл, Марвин Мински, считают, что разумное поведение можно формально представить как поведение неких «экспертных систем», способных понимать окружающую действительность. Их машины с искусственным интеллектом освоили некоторые базовые задачи — такие игры, как шашки, и некоторые суждения по аналогии. Высказывались уверенные предположения о том, что в течение жизни одного поколения проблема искусственного интеллекта будет в основном решена.

К сожалению, этот подход обеспечил колоссальный прогресс в одних областях и одновременно продемонстрировал свою ограниченность в других — отчасти потому, что сфокусировался на обработке символов, высших когнитивных процессах, логике и решении проблем. Этот символьный подход к мышлению оказался успешным лишь в некоторых сферах — в частности, в семантике, изучении языков и когнитивистике, однако большинство ученых уделяло основное внимание не столько созданию универсального искусственного интеллекта, сколько исследованию человеческого мышления.

К 1970-м годам финансирование академических исследований искусственного интеллекта существенно сократилось, и наступил период, впоследствии названный «зимой искусственного интеллекта», — переход от великолепных перспектив, открывавшихся в 1950-х годах, к выявлению существенных ограничений технологии в 1970-х.

Искусственные нейронные сети и статистическое обучение

Весьма различные подходы к созданию искусственного интеллекта и сообщения о создании «искусственного мозга» начали появляться в 1970-1980-х годах. Ученые из самых разных областей науки, относящихся к когнитивистике (таких как психология, лингвистика, компьютерные науки), выдвигали принципиально различные подходы к созданию искусственного интеллекта на «подсимвольном» уровне. Следует упомянуть, в частности, о Дэвиде Румельхарте и Джеймсе Макклелланде. Вместо того чтобы воспроизводить механизмы человеческого мышления, они предположили, что возможно создать системы, напоминающие мозг и способные обрабатывать (подобно нейронным сетям) одновременно несколько процессов, воздействовать (подобно нейронам) друг на друга путем подавления или возбуждения, а также обладающие механизмом «обратного распространения ошибки», перестраивающим связи между искусственными нейронами в зависимости от правильности или неправильности полученного результата.

Этот подход принципиально отличался от предыдущих по следующим причинам:

  • он гораздо больше напоминал механизм функционирования мозга с его распределенной параллельной обработкой (РПО) информации по сравнению с серией компьютерных команд;
  • он фокусировался преимущественно на статистическом обучении;
  • от программистов не требовалось предоставлять исчерпывающую информацию: вместо этого система РПО обучалась методом проб и ошибок, самостоятельно распределяя нагрузку между искусственными нейронными цепями.

Эти модели РПО продемонстрировали интересные результаты в распознавании и обработке естественного языка. В отличие от символьного распознавания на первом этапе, они не строили никаких предположений относительно того, как системы машинного обучения будут представлять информацию.

Они стали прямыми предшественниками таких программ, как Google Tensor Flow и Facebook Torch. Именно такой тип параллельных процессов используется в нынешних беспилотных такси и голосовых интерфейсах.

Получив колоссальные ресурсы благодаря смартфонам и облачным технологиям, современные системы искусственного интеллекта располагают такой вычислительной мощью, которая и не снилась Ньюэллу и Саймону. Но хотя в обработке естественных языков и изображений были совершены настоящие прорывы, эти системы все равно далеки от совершенства (рис. 19.1).

РИС. 19.1.

Несовершенство алгоритмов машинного обучения для распознавания объектов

Существует огромное количество пророчеств относительно мощи искусственного интеллекта и его беспредельных возможностей. Эти системы и правда совершенствуются, однако сильно зависят от доступа к обучающей информации и по-прежнему имеют достаточно жесткие ограничения.

Я этого не говорил, Сири!

Возможно, у вас есть собственный опыт общения с голосовыми помощниками и вы понимаете, с одной стороны, их невероятные преимущества, а с другой — существенные ограничения. Их способность понимать любой язык очень впечатляет. Проблема распознавания речи очень серьезна, и голосовые помощники продемонстрировали значительный прогресс в ее решении. Мы протестировали эти системы, в том числе Apple Siri, Google Assistant, Amazon Alexa, Microsoft Cortana и Hound. Для этого мы устроили своего рода викторину, напоминающую популярную игру Jeopardy! Участники должны были задавать команды или вопросы с использованием предложенных слов, специально подобранных так, чтобы они складывались во что-то осмысленное (например, «Цинциннати, завтра, погода», из чего участники могут составить вопрос «Эй, Сири, какая погода будет завтра в Цинциннати?»).

Короче говоря, мы обнаружили, что эти системы хорошо себя проявили там, где надо было отвечать на какие-то элементарные вопросы, например о погоде или столице той или иной страны, но проваливались там, где нужно было проявить два простых человеческих свойства. Во-первых, люди легко находят связь между двумя понятиями (например, население и страна, в которой находится Эйфелева башня, — как мы знаем, это Франция). Когда мы задавали голосовым помощникам вопрос вроде «Какова численность населения страны, в которой находится Эйфелева башня?», то они либо называли численность населения Парижа, либо выдавали ошибку. Во-вторых, люди способны понимать контекст. Если мы задаем вопрос «Какая погода в Цинциннати?», а вслед за ним вопрос «А завтра?», то голосовые помощники, как правило, не улавливают между ними связи.

Кроме того, мы обнаружили, что люди, имевшие опыт взаимодействия с голосовыми помощниками, явно отдавали предпочтение тем из них, которые имели наиболее близкий к человеческому стиль общения, даже если они иногда ошибались или не могли ответить на вопрос (например, «Я пока не знаю, как ответить на ваш вопрос!»). Если голосовой помощник обращался к участникам эксперимента так же, как они обращались к нему, то это приносило им наибольшее удовлетворение.

Но можно ли считать Сири действительно умной? Интеллекту­альной? Она может напомнить о чем-либо или включить музыку, но ей нельзя задать вопрос, стоит ли покупать машину определенной модели или как выбраться из запертой комнаты. Она отвечает на ограниченное количество вопросов, усвоенных в результате машинного обучения. Ее нельзя считать достаточно умной для того, чтобы пройти тест Тьюринга.

Шесть составляющих пользовательского опыта и искусственный интеллект

Интересно отметить, что на первом этапе развития искусственного интеллекта наибольшую известность получила его способность к аналоговому мышлению и суждениям (память, решение проблем и принятие решений). В настоящее же время он наиболее известен своей способностью распознавать изображения и голос (визуальное восприятие, внимание, язык). Системы, способные вести себя почти по-человечески, пользуются наибольшей популярностью (эмоции).

Думаю, вы уже поняли, к чему я клоню. Современные системы начинают сталкиваться с ограничениями «лобовых», преимущественно статистических решений на субсимвольном уровне. Хотя современные интеллектуальные системы, несомненно, обладают впечатляющими возможностями в решении определенных проблем, никакие супермощные чипы или новые обучающие процедуры не помогут им реализовать ожидания, которые возлагались на них в 1950-х годах.

Если более мощные чипы не решение, то в чем же оно? Некоторые наиболее известные специалисты в области машинного обучения и искусственного интеллекта предлагают посмотреть на человеческий мозг с новой стороны.

Исследования на уровне групп нейронов продемонстрировали успехи, достигнутые в восприятии окружающей реальности, и возможно, анализ других уровней представления обеспечит еще больший успех на символьном уровне в области визуального восприятия и внимания, навигации, а также представления пространства, языка и семантики, памяти и принятия решений.

Как и в случае разработки дизайна традиционных продуктов и услуг, вы наверняка ожидаете, что я буду ратовать за то, чтобы разработчики систем искусственного интеллекта принимали во внимание утверждения, которые вы используете в качестве входной и выходной информации, а также тестировали утверждения на разном символьном уровне (то есть на уровне слов или семантики) вместо того, чтобы тестировать утверждения, воспринимаемые органами чувств (например, в виде пикселей, фонем или звуков).

С небольшой помощью моих друзей (с искусственным интеллектом)

Хотя исследователи упорно стремятся создать независимые интеллектуальные системы, кажется, что наибольший успех в краткосрочной перспективе будет достигнут в области использования искусственного и машинного обучения в качестве инструментов поддержки познания. Очень многие из них уже присутствуют в наших смартфонах и прочих мобильных устройствах. Мы помним о текущих делах благодаря электронным «напоминалкам», переводим надписи на дорожных знаках с помощью смартфонов, ориентируемся на местности, используя электронные карты, и достигаем наших целей с помощью электронных будильников, программ, подсчитывающих калории, помогающих экономить деньги и делать зарядку.

Однако наши исследования современных голосовых помощников показали, что наибольшие проблемы связаны с тем, что пользователи и электронные системы говорят на разных языках, а также с тем, что момент возникновения потребности в помощи и момент ее предоставления не совпадают во времени. Помогая в создании продуктов, позволяющих потребителям или работникам действовать быстрее и эффективнее за счет расширения их когнитивных способностей, шесть составляющих пользовательского опыта представляют собой прекрасный пример того, как искусственный интеллект и машинное обучение способны поддержать человека в достижении его целей.

Визуальное восприятие и внимание

Устройства с искусственным интеллектом (особенно оборудованные камерами) полезны для привлечения внимания к важным частям общей картины. Они помогают поместить наиболее важную информацию в центр внимания (например, недоработанные элементы), а если известно, что именно вы ищете, то они выделяют ключевые слова на странице или детали изображения. На ум приходит огромное количество возможностей. Впервые входя в гостиничный номер, люди хотят знать, где расположены выключатели, как изменить температуру в комнате и где расположены розетки для зарядки их электронных устройств. Представьте, что вы осматриваете комнату через очки, на стеклах которых подсвечивается расположение всех этих предметов.

Навигация

Если вспомнить об успехе системы LIDAR и беспилотных такси, то кажется вполне вероятным, что упомянутые выше «умные очки» могли бы подсвечивать для вас съезд с шоссе или вход в метро, который надо выбрать, а также бутик в супермаркете, который вы хотели бы посетить. Как во многих играх, индикатор может показывать два вида: что находится непосредственно перед вами в режиме реального времени и карту района с высоты птичьего полета с обозначением вашего местонахождения.

Память и язык

Мы работали с некоторыми крупнейшими розничными сетями и финансовыми организациями, стремящимися персонализировать свои коммерческие предложения. Собрав информацию о поисковых терминах, маршрутах перемещения по сайтам, коммуникациях и опросах, легко представить себе организацию и терминологию в системе, ориентированной на индивидуального пользователя. Видеотехника — это хороший пример: кто-то из пользователей ищет простое устройство, чтобы снимать клипы для YouTube, а другим требуется новейшая камера с цветовой субдискретизацией 4:2:2 и прочими наворотами. Каждая из этих групп пользователей хочет видеть в результатах поиска только то, что необходимо ей, поэтому язык и степень детализации информации для каждой из этих групп существенно отличаются.

Принятие решений

Я уже писал о том, что, по сути, решение проблемы представляет собой ее разбивку на этапы и их последовательное выполнение. На каждом шаге вы должны определиться со следующим действием. Хороший пример — покупка принтера. Дизайнерской студии требуется крупноформатный принтер с самым высоким качеством печати. Юридической фирме нужен принтер, способный печатать на бумаге формата Legal, имеющий многопользовательский режим и опцию автоматической двусторонней печати. Родитель детей школьного возраста хотел бы приобрести быстрый и надежный принтер для всех членов семьи. Расспрашивая потребителей об их нуждах и помогая им принимать решения в процессе покупки (например, отвечая на вопросы «Сколько он стоит?», «Каким количеством тонера он заправлен?», «Может ли он печатать на бумаге разного формата?», «Нужна ли мне двусторонняя печать?» или «Какие отзывы о нем дают члены семьи?»), системы искусственного интеллекта и машинного обучения могли бы выявлять виды целей, которые ставят перед собой пользователи. Местонахождение пользователя в проблемном поле позволяет с высокой степенью точности предположить, что следует и что не следует предлагать ему в данный момент.

Эмоции

В наши дни появляются все более точные системы распознавания мимики, движения и речи. Все это открывает перед нами интереснейшие возможности для определения эмоционального состояния пользователей. А значит, мы могли бы адаптировать под их настроение информацию, показываемую на экране, а также используемые термины (например, если становится ясно, что пользователь ошеломлен и хотел бы получить более доступное объяснение).

Существует бесчисленное множество возможностей, но все они возникают вокруг тех целей, которые стремится реализовать человек, а также способов это сделать, которые видит он сам, его нужд в каждый конкретный момент, слов, которые ему понятны, способов взаимодействия, которые ему привычны, и вещей, которые привлекают его внимание. Надеюсь, что формулировка вашей задачи в терминах шести составляющих пользовательского опыта позволит вам и вашей команде превзойти все свои предыдущие попытки удовлетворить потребности пользователей. Надеюсь, что вам удастся усовершенствовать каждую составляющую когнитивного процесса, примерно так же, как ученым из старого телешоу удалось усовершенствовать физические возможности «Человека, стоившего шесть миллионов долларов».

Практические рекомендации

  • Предлагайте различные способы тестирования систем искусственного интеллекта непосредственно в области семантики (вместо того чтобы обходить ее стороной).
  • Рассмотрите возможность обучения систем искусственного интеллекта специфическим синтаксическим конструкциям, реже встречающимся в находках ваших респондентов.
  • Задумайтесь, каким образом вы можете углубить обучение (фокусирование внимания, стимулирование определенных типов взаимодействия, убедительное представление информации и т. п.).
Показать оглавление

Комментариев: 1

Оставить комментарий

  1. Inga
    кубани фото и описание