8 историй,
повлиявших на развитие
искусственного интеллекта
Сегодня ни один анонс о выпуске нового смартфона или приложения не обходится без упоминания искусственного интеллекта. ИИ в тренде, и можно подумать, что он с нами совсем недавно, но это не так. Вернее, не совсем так: да широкое применение ИИ-инструменты получили как раз сегодня, но сама разработка началась более полувека назад. И в истории ИИ было немало интересных эпизодов, не известных широкой публике, о которых мы решили рассказать читателям Хабра.
У истоков ИИ
Об искусственном интеллекте написано столько статей, что кажется парадоксальным отсутствие единого определения этой области. Одни эксперты считают, что до познания природы человеческого интеллекта говорить о создании его искусственного аналога нельзя. Другие утверждают, что способность машины выполнять задачи, требующие от человека проявления интеллекта, – это уже искусственный интеллект. Также это явление можно понимать, как способность компьютера оперировать не только четкими понятиями «да» и «нет», но и «может быть», а также задаваться вопросом «а что, если?». То есть обучаться, делать выводы и, опираясь на полученный опыт, принимать решения.
Если не брать в расчет античные сказания об искусственных созданиях, первое литературное упоминание думающего механизма можно встретить у чешского писателя Карела Чапека в его пьесе «R.U.R.» (Россумские универсальные роботы) от 1920 года. В произведении рассказывается о фабрике, производящей «искусственных людей» — они называются роботами. Если вы не планируете читать пьесу (тем более на чешском), сразу представим спойлер: сначала роботы работали на людей, а потом решили подготовить бунт, который якобы привел к исчезновению человеческого рода. Эта идея сейчас не кажется новой, т.к. получила широкое распространение в современной литературе и кинематографе.
Официально сам термин «искусственный интеллект» впервые использовал в 1956 году на Дартмутской конференции молодой учёный Джон Маккарти. Маккарти объяснил ИИ как науку и технологию создания интеллектуальных компьютерных программ. Несмотря на различия в интерпретации терминов итоговым суждением, вынесенным по итогам собрания участниками, стало следующее: «любой аспект человеческой разумной деятельности может быть точно описан таким образом, что машина может его сымитировать».
Уже в 20-х годах XX века от искусственного интеллекта не ждали ничего хорошего. Кадры из постановки пьесы Карела Чапека Р.У.Р.
Источник: Wikimedia
Эпизод 1: механические черепахи Уолтера
Реализовать концепцию робота с зачатками интеллекта удалось американскому кибернетику Грею Уолтеру. Его механические «черепахи», построенные в 1948–49 гг., ехали к источнику света и, упираясь в препятствия, сдавали назад и объезжали их. Это было первое полноценное проявление интеллекта машиной: вместо того, чтобы беспомощно упереться в ножку стола, робот делал вывод о невозможности проезда и сам принимал решение о маневре объезда. При этом робот был создан исключительно из аналоговых компонентов.
Светолюбивый робот-черепаха Грея Уолтера на аналоговых компонентах. Источник: extremenxt.com
Эпизод 2: первая машина-переводчик
В 1954 году IBM продемонстрировала незаконченный автоматический переводчик с русского на английский, который оперировал всего шестью правилами и обладал словарным запасом в 250 слов из области органической химии. Такая машина требовалась военным для перевода советских документов.
Демонстрация произвела фурор в прессе, что только подхлестнуло дальнейшее финансирование в области ИИ. Польза от потенциальных автоматических переводчиков была очевидна: согласно подсчетам, из 4000 штатных переводчиков с разных языков, числившихся в штате правительственной службы Joint Publication Research Service, загружены работой были всего 300 человек в месяц. Улучшение качества распознавания и автоматического перевода дало бы огромную экономию за счет сокращения раздутого штата.
Переводчик IBM с русского на английский, будущий президент США Рональд Рейган и один из отцов computer science Герберт Грош, 1954 год. Источник: Columbia.edu
Эпизод 3: первый компьютер-шахматист
11 мая 1997 года в Нью-Йорке компьютер впервые в истории победил в ходе матча, проводимого по всем «человеческим» правилам, действующего чемпиона мира по шахматам. Речь, понятно, о втором сражении Гарри Каспарова и DeepBlue. Это было спустя 40 лет после того, как программист Service Bureau Corporation (подразделение IBM) и по совместительству шахматист Алекс Берстейн с коллегами написал The Bernstein Chess Program – первую программу для игры в шахматы, работающую по алгоритму минимакс на мейнфрейме IBM 704. Компьютер играл неспешно: на каждый ход у него уходило 8 минут, за такой отрезок времени он успевал просчитать 2800 возможных позиций. Сам Берстейн ни разу не проиграл собственной программе, хотя признавал: «Теоретически, 704 не способен меня удивить, но временами ему это удаётся – пару раз он играл так хорошо, что даже сбивал меня с толку».
Мейнфрейм IBM 704, играющий в шахматы на уровне любителя
Источник: NASA
А вот кого IBM 704 (не именно этот, из Service Bureau Corporation, а другой такой же, установленный в компании Bell Labs) удивил по-настоящему, так это писателя Артура Кларка, который оказался в Bell Labs как раз тогда, когда местные умельцы, подключив к мейнфрейму вокодер, научили 704 исполнять песню Daisy Bell – ради демонстрации возможности компьютерного синтеза речи. Писатель Кларк впечатлился и вставил сцену с роботом HAL 9000, исполняющем эту же песню, в «Космическую одиссею 2001 года».
Но это уже совсем другая история. А в 1957-м патриархи искусственного интеллекта Херберт Саймон и Аллен Ньювелл предсказывали, что компьютер будет способен обыграть человека в пределах 10 лет. И действительно: в 1967-м программа Mac Hack начала успешно выступать в турнирах наряду с людьми.
Эпизод 4: задумчивый робот Shakey и приход «ИИ-зимы»
Развитие компьютерной техники и в частности ИИ-решений стартовали в 1950-60-е, как показано выше, весьма уверенно, и первоначально привели к впечатляющим результатам. Больше того, учёные принялись делать громкие заявления о блестящих перспективах развития технологий. Так, в 1970-м один из отцов учения об ИИ Марвин Минский прогнозировал появление компьютерного интеллекта, соответствующего человеческому, «в течение 3-8 лет». Своими громкими заявлениями о ближайшем будущем ИИ ученые завысили планку ожиданий.
Однако в следующие годы ученым не удалось совершить обещанных прорывов – разрабатывались основные положения и алгоритмы искусственного интеллекта, до реальных же продуктов было далеко, прогресс шел крайне медленно, неосвоенная область искусственного интеллекта рассеивала усилия исследователей. Одним из примеров неоправдавшихся ожиданий был робот Shakey, имевший огромное значение для науки, но бессмысленный с точки зрения инвесторов. Работы по его созданию и совершенствованию велись в 1966–77 гг., это был мобильный робот с камерой, который самостоятельно искал решение для поставленных задач. К сожалению, Shakey остался испытательным образцом для технологий и алгоритмов, не имея никакой утилитарной пользы: он мог нормально работать только в искусственно построенном испытательном пространстве, а на полное решение элементарной задачи «обнаружить в помещении блок на возвышении и столкнуть его» уходило более часа.
Легендарный робот Shakey с очень задумчивым искусственным интеллектом.
Источник: SRI International
Нарастающий скептицизм инвесторов (а ими в большой степени были военные) в отношении искусственного интеллекта достиг пика на фоне доклада математика сэра Джеймса Лайтхилла, заявившего в 1973 году, что машины всегда будут играть в шахматы на уровне опытного любителя, а сложные задачи, вроде распознавания лиц, никогда не будут им под силу. Помимо эмоциональных рассуждений, доклад содержал разумные аргументы против ИИ. Среди них упоминалась недостаточная вычислительная мощность компьютеров того времени и отсутствие полноценного машинного обучения, из-за чего для эффективной работы ИИ каждый раз приходилось наполнять огромным объемом данных.
Последовавшее за докладом резкое сокращение финансирования исследований в области искусственного интеллекта ознаменовало начало «ИИ-зимы».
Эпизод 6: ИИ от Toshiba на почтовой службе (и не только)
Несмотря на охлаждение интереса инвесторов к теме искусственного интеллекта, инженеры продолжали работы над узкопрофильными машинами с элементами ИИ. Они были не столь амбициозны, чтобы пытаться создать «искусственный разум», и придумывали решения конкретных задач. Но, в отличие от роботостроителей, создатели таких машин добились реальных успехов.
Добрую половину XX века всю почту в отделениях сортировали вручную – операторы читали индексы и адреса, перекладывая конверты и открытки в нужные ячейки. Попытки создать автоматический сортировщик начались еще в 1920-х годах, но первые серийные полуавтоматические машины появились только в 1950-х.
В шестидесятые на почте применялись сортировщики, читающие на конвертах индексы, написанные строго по всем известному шаблону. Отклонение от этого шаблона делало индекс нечитаемым для автоматики. Тем более если индекс был написан обычным письменным почерком, который и человек не всегда может разобрать с первого раза.
Именно такие неказистые цифры распознают даже простейшие сортировочные почтовые машины
В 1965 году под началом японского Министерства почты и телекоммуникаций был запущен проект по созданию автоматической сортировочной машины нового поколения. Уже через год в Toshiba (тогда еще Tokyo Shibaura Electric Co.) был готов прототип механизма, распознающего печатные цифры, написанные от руки. А в 1967 году Toshiba представила сортировщик с технологией оптического распознавания символов (OCR). Машина сканировала конверт цифровой камерой Visicon и направляла получившийся слепок в блок распознавания, где отбрасывалась вся ненужная информация, кроме сгруппированных в индекс цифр. После распознавания рукописных цифр письмо уходило в нужный сортировочный лоток.
Почтовая сортировочная машина Toshiba с продвинутым для 1967 года ИИ.
Источник: Toshiba Science Museum
В процессе работы этих первых образцов инженеры собрали базу из 300 тысяч образцов почерка, значительно улучшив эффективность ИИ, – что называется, собрали Big data, так как машина не имела способности к самообучению. А 1 июля 1968 года обновленный сортировщик, получивший название Toshiba TR-4, начал работу в центральном почтовом отделении Токио.
Впоследствии наработки пригодились инженерам при создании компьютера ASPET/71, который представлял собой целый комплекс для распознавания текста с печатных носителей с производительностью 2000 символов в секунду. Если сейчас OCR-сканер или OCR-приложение для смартфона не кажутся чем-то удивительным, то в 1971 году ASPET/71 выглядел колоссальным прорывом.
Компьютер ASPET/71, распознающий печатный текст.
Источник: 電子情報通信学会
Во время второго ИИ-бума середины 80-х Toshiba представила усовершенствованную версию программы-переводчика AS-TRANSAC, ИИ в которой помогал переводить целые тексты с японского на английский и обратно, сохраняя их смысл. Без использования ИИ, который подбирал нужные значения, автоматический перевод представлял бы собой бессвязный набор слов.
В 1998 году ИИ пригодился Toshiba для фреймворка EUROPA, позволяющего создавать голосовые системы, понимающие ключевые слова в голосовых запросах и отвечающие синтезированной речью. Вместе с EUROPA компания представила MINOS – платформу для автомобильной навигации с распознаванием голосовых команд и адресов.
Эпизод 7: ИИ в XXI веке
По-настоящему громко искусственный интеллект заявил о себе в 1997 году, когда шахматный компьютер IBM Deep Blue обыграл Гарри Каспарова, хотя за год до этого машина уступила шахматисту. Сам по себе факт проигрыша человека компьютеру не являлся чем-то удивительным, но значимости событию добавила шумиха в СМИ.
Выход в 1999 году домашней робособаки Sony Aibo внушил ложную надежду, что эпоха говорящих роботов и всемогущего искусственного интеллекта вот-вот наступит, но революция опять не случилась – уже через семь лет Sony закрыла проект, перезапустив его лишь в 2017 году.
Прототипы Aibo. Кстати, помимо собак роботов,
Sony выпускала под этим брендов львят и космонавтов, правда в значительно меньших количествах.
Источник: Alex / Flickr: DSC00193
Новый бум искусственного интеллекта пришелся на 2010-е годы, когда мощность компьютеров и мобильных устройств позволила использовать ИИ в потребительских устройствах и приложениях. Для ИИ наконец сошлись все звезды: тотальная цифровизация помогла создать огромные базы данных, необходимые для анализа и обучения ИИ, а вместо устаревших алгоритмов обучения нейросетей были разработаны значительно более эффективные и производительные.
Система IBM Watson Explorer AI в 2017 году успешно заменила 34-х сотрудников японской страховой компании Fukoku Mutual Insurance, которые занимались анализом здоровья клиентов для составления индивидуальных страховых планов — ИИ без труда оперирует тысячами записей, вычисляя наиболее выгодную для обеих сторон страховую программу.
Алгоритм Google Brain, работающий на YouTube, наполняет боковую панель рекомендуемых видео, находя для каждого пользователя наиболее интересные ему ролики. Вспомните, как много интересных видео вы открыли для себя именно благодаря рекомендациям YouTube.
Появление ИИ на торговых площадках дало мощный толчок электронной коммерции – рекомендательный ИИ на Amazon обеспечивает 35% от общих продаж, оценивая просмотренные товары и подбирая посетителям продукты, которые они купят с наибольшей вероятностью.
Искусственный интеллект уже используется во многих творческих мобильных приложениях, от генерирования картинки (Prisma) до накладывания маски на лицо (Snapchat), во всех рекомендательных системах, в системах распознавания голоса, в большинстве систем мониторинга, умных домах, бытовой технике, роботах всех возможных типов, и так далее, и так далее.
А в ближайшее десятилетие мир увидит доступные серийные беспилотные автомобили, функционирование которых построено на ИИ и машинном обучении. В прошлом году Toshiba представила новый процессор распознавания изображений Visconti 4, первая версия которого появилась в начале 90-х. ИИ в этом чипе способен обрабатывать огромный объем графических данных на лету, безошибочно определяя на видео с камер разметку, светофоры, людей, другие автомобили и препятствия.
Эпизод 8: Машины учатся разговаривать
Заметим: не произносить записанные слова, как IBM 704 на глазах изумлённого Артура Кларка, а именно поддерживать разговор с человеком, адекватно реагируя на его реплики. Эмпирический тест, предложенный английским математиком Аланом Тьюрингом в 1950 году, предназначался для ответа на волновавший его в тот момент вопрос: может ли машина мыслить подобно человеку? Напомним, что суть теста заключается в слепом общении судьи с двумя испытуемыми – человеком и машиной. В ходе диалога мыслящий, по мнению Тьюринга, компьютер должен ввести судью в заблуждение, мастерски выдав себя за человека.
Тест нашел практическое применение в конкурсе за премию Лёбнера, проводимом с 1990 года. Участники конкурса представляют своих чатботов, выдающих себя за живых собеседников. Кстати, премия Лёбнера, помимо текстового общения, предусматривает номинацию в аудиовизуальной программе, победа ИИ в которой автоматически отменяет проведение конкурса в будущем, знаменуя наступление эры сложного ИИ. Но пока что в этой номинации никаких подвижек не происходит и едва ли они предвидятся в ближайшее время.
Вот наглядный пример, который показывает разницу между человеческим интеллектом и тем, что в рамках премии Лёбнера называют ИИ (это переведенная выдержка из конкурсной программы 2005 года):
Диалог судьи и человека
Судья: Пжшчеввич паржишшч крвахоч, верно?
Участник: Это польский?
Судья: Что?
Участник: То, что вы сейчас написали.
Судья: Это сцвмрзыа, не так ли?
Участник: Меня немного беспокоят ваши навыки печати.
А теперь диалог судьи и победившего в тот год чатбота Jabberwacky
Судья: ОК, пока достаточно. Я пообщаюсь с другой сущностью.
Участник: Ок, было приятно воспользоваться вашей расческой.
Судья: Ты о чём? Как ты пользовался моей расческой?
Участник: Хорошо.
Судья: Хорошо?
Участник: Да
Судья: Очень медитативный разговор.
Участник: Более того, я пожертвовал его на благотворительность.
Судья: Чего? Что ты пожертвовал на благотворительность? Этот разговор?
Участник: Эм… 1 миллион долларов?
Судья: На какую благотворительность?
Участник: Мы говорим о симпсонах или нереальном?
Судья: Честно говоря, я вообще ни черта не понимаю, что мы тут обсуждаем.
С 2005 года чатботы сделали большой шаг вперед. В 2014 впервые в истории премии Лёбнера питерский бот Eugene (Женя Густман), созданный Владимиром Веселовым, успешно обманул судей в 33% случаев – по условиям конкурса преодоление 30-процентного рубежа означает успешное прохождение теста. То есть с 1990 по 2014 год, несмотря на ежегодное награждение наиболее эффективных чатботов, тест на «человечность» искусственным интеллектом формально оставался непройденным.
Но до сих пор чатботы далеки от того самого искусственного интеллекта, о котором мечтают фантасты, – машина не может поддержать разговор репликами, в точности соответствующими контексту. Человеческая речь невероятно сложна и разнообразна и потому до сих пор плохо поддается комплексному компьютерному анализу: понимая отдельные слова и простые фразы, ИИ до сих пор не понимает глубоких смыслов, и в их репликах даже при правильной расстановке слов фразы компьютера кажутся абсурдными. А самые популярные голосовые ассистенты Siri, Cortana и Алиса от «Яндекса» хоть и выдают порой очень остроумные ответы, но в любой непонятной ситуации прекращают диалог переходом в поисковую систему.
Искусственный интеллект силен, но до сих пор далёк от совершенства. Системы прогнозирования и распознавания допускают ошибки, хотя и значительно реже, чем человек. Пока в обществе идут разговоры об этичности решений искусственного интеллекта, ИИ удалось взять новую, еще пару лет назад казавшуюся недостижимой, высоту: программа AlphaGo обыграла человека в Го, последнюю логическую игру, где первенство человеческого интеллекта с его абстрактным мышлением считалось непоколебимым.
Объёмный комментарий Автора оставлен под кнопкой «МНЕНИЕ Теории-N».
А Вас мы попросим высказать своё мнение!