Что такое тест Тьюринга

  • 29 декабря 2020

1. Расшифровка первоначального понятия теста Тьюринга

2. Вариации поздних тестов математика и их расшифровка в современной трактовке
3. Глава 3. Понимание теста Тьюринга в 21 веке

3.1. Евгений Густман – чат-бот или победитель теста Тьюринга?

3.2. Опыт Дэвид Робсона, или минимальный тест Тьюринга

4. Прошли ли современные программы тест Тьюринга?


Введение

Многие в Европе знают о существовании так называемого закона Тьюринга. Он действует в Великобритании с 31 декабря 2017 года и предполагает посмертное помилование для всех гомосексуалистов. Да, доказано, что Тьюринг был из «меньшинства», которое тогда преследовалось властями. Это – общепризнанный факт. Однако лишь некоторые умные представители человечества помнят о научных достижениях Алана.
Алан Мэтисон Тьюринг (1912-1954) – английский математик, логик, специалист в сфере криптографии, разработчик программ для первых ЭВМ. Еще в середине 20 века он легко взламывал коды, создавал алгоритмы. Он же придумал портативный шифратор Delilah. Но война закончилась, прибор не пустили в массовое производство.
Тем не менее, при участии математика были созданы:
1) Первый ПК с оперативной памятью под названием Манчестерский Марк I.
2) Шахматная программа, которая пока проигрывала человеку.
3) Метод LU-разложения для решения уравнений.
4) Машина, генерирующая музыку в компьютер.
Итак, имя Алана Тьюринга известно многим сотрудникам и ученым, работающим в сфере информационных технологий. Этот британский математик в 1950 году предложил тест, который без труда позволит или не позволит найти отличия между человеческим общением и компьютерной программой. По его версии, искусственный интеллект без труда может заменить любую речь и измышления собеседника с высшим образованием. Однако эти гипотезы с течением времени все чаще находят опытное опровержение.
Гипотезы Алана в разное время то находили опытное подтверждение, то подвергались критике. По мнению ученого, ЭВМ способно мыслить на высоком уровне. В ходе его эксперимента доказывается тот факт, что человек, находящийся далеко, за пределами видимости, но в контакте с другим собеседником, не осознает, что это – искусственный интеллект. Наоборот, первый будет с уверенностью осознавать, что общается с собой подобным существом.

Целью данной работы является понять, можно ли согласиться с умозаключением ученого. Все-таки остается под вопросом то измышление, может ли компьютер быть использован как альтернативный и адекватный собеседник. Да, он может заменить человека в некоторых сферах быта. Но реально ли дождаться наступления «день икс», когда везде будут роботы? Как нам, кажется, сейчас данное время еще не наступило и ЭВМ не может конкурировать с гибким и изворотливым человеческим разумом.
Задачи, которые необходимо поставить перед собой, - не обычны. Нам предстоит понять:
• Произошел ли такой эксперимент, который подтвердил или опроверг тест Тьюринга?
• Если такое событие еще не состоялось, то возможно ли его наступление в недалеком будущем времени и чем это может грозить человечеству?

Глава 1. Расшифровка первоначального понятия теста Тьюринга
Вопрос об искусственном интеллекте, его влиянии на судьбы человечества пытался решить логик, исходя из математических моделей еще в 1950 году. В своем исследовательском докладе «Вычислительные машины и разум», опубликованном в философском журнале Mind 1950 году, Алан Тьюринг предлагает следующий эмпирический тест. В эксперименте участвуют три персоны: судья, женщина, мужчина. Задача мужчины - запутать судью в определении пола собеседника. Задача женщины – помочь судье в понимании. Все эмоциональные окраски голоса, тональность видоизменяются.
Испытуемые лица играют в имитацию. Этот опыт основан на примерах салонных игр, когда 2 игрока пытаются запутать судью. По первоначальной версии Алана они передают записки для ведущего. Он должен угадать, представитель какого пола прячется от него.
По итогу судья может дать неправильное толкование сложившейся ситуации. По версии Алана, если место мужчины предложить «роботу» или «боту», то тут сам компьютер легко «обманет» опытного судью. В данном случае разница между искусственным и человеческим интеллектом кажется размытой.
По мнению логика, который писал научные труды в середине 20 века, ученые в перспективе без труда создадут программу, которая имитирует поведенческие аспекты гомосапиенса. Речь идет не о способности мыслить, а о навыке поддержать беседу на высоком уровне. Причем, свою теорию он не мог проверить опытным путем. Он предоставил это почетное право последователям его учений.
Стандартная интерпретация модели Тьюринга дается в электронной версии журнала «Аргументы и факты». Эксперимент является эмпирическим, то есть он построен на наблюдениях. На схеме модель теста выглядит следующим образом:

Условия «раннего теста» Тьюринга, датированного еще 1950 годом:
1) общение происходит в тестовом режиме;
2) время на общение ограничено пятью минутами;
3) все участники беседы находятся в разных комнатах и не видят друг друга.
4) задача искусственного интеллекта – ввести в заблуждение человека, по итогам исполнения тест считается пройденным.
Итак, опыт считается успешным при условии, что экспериментатор не сможет точно определить, кто или что располагается в дислокации А или В. Он признает ЭВМ за человеческого собеседника. Искусственный интеллект признается равным человеческим измышлениям. По мнению гениального математика, данный тест будет пройден к 2000 году.


Глава 2. Вариации поздних тестов математика и их расшифровка в современной трактовке
Позже английский математик добавил в опыт большее количество респондентов. Чтобы снизить риск простого угадывания, он предложил добавить количество судей. Определенное количество ведущих, а не один, общались с большим количеством испытуемых ПК и носителей человеческого разума. В данном случае безусловным фактом равенства искусственного и человеческого интеллекта станет показания большинства судей. Сколько процентов нужно для признания неоспоримого лидерства ЭВМ в современной трактовке эксперимента?
Чтобы понять суть теста Алана, можно сравнить эксперимент с шахматной программой. В принципе, чтобы создать шахматного гения из ПК, можно просчитать все комбинации и поведенческие аспекты. В данном случае шахматная программа всегда ВЫИГРАЕТ человека.
А вот в тесте Тьюринга машина легко может проиграть человеческому разуму. Человек в бытовой жизни абсолютно непредсказуем. В данном смысле всегда будет процент проигрыша ЭВМ. По актуальным данным, в современной трактовке теста Тьюринга выигрыш будет засчитан в пользу искусственного интеллекта при наличии данных, когда всего лишь 30 процентов судей посчитают компьютер за человека.*



Глава 3. Понимание теста Тьюринга в 21 веке
Раньше машины думали намного дольше, чем человек. На сегодняшний день время на размышление потребуется гомосапиенсу. Современный искусственный интеллект может дать «фору» нашему разуму.
Тем не менее, споры насчет эксперимента Алана не утихают. Продюсеры кино включают свои умозаключения по этому поводу в сценарий (фильм Ex Machina, 2014).Программисты пытаются создать совершенную программу, которая имитирует мысли и поведенческие реакции человека.
Сейчас понятие «ЭВМ, ПК» легко взаимозаменяется понятием «робот-бот, чат-бот». Конкурсы, чтобы пройти тест, устраиваются повсеместно, во всех развитых странах. Сложность их проведения обусловлена социальными факторами. Человек – не столь идеален, как машина. Его поведение в ряде случаев непредсказуемо. И , чтобы пройти эксперимент, нужно взять часть неразумного (эмоций) и соединить с логикой, адекватным мышлением. По мнению ученых диаграмма схематически выглядит следующим образом:

Вот тут и начинается критика казалось бы безупречных идей Тьюринга. Оказывается, чтобы показаться естественным нужно уметь пользоваться чисто «человеческими» уловками, то есть уметь:
1) умолчать;
2) сослаться на незнание;
3) говорить медленно;
4) дать неверный ответ на поставленный вопрос;
5) ответить вопросом на вопрос;
6) испытывать в ходе разговора эмоции, например, стать внезапно неадекватным;
7) использовать неадекватную лексику и т.д.
Тут и обнаружился очевидный недостаток теста – персональный компьютер «слишком умный», чтобы соперничать с человеком. Теперь программистам вынуждены включать в коды программ ботов естественные поведенческие реакции. Прошел ли кто-то этот эксперимент успешно?


Глава 3.1. Евгений Густман – обычный чат-бот или победитель теста Тьюринга?
В 2014 году появились публикации, что тест Тьюринга был пройден спустя 60 лет после смерти логика и математика. Тем респондентом, человечность которого признали более 33 процентов судей, стал бот 13-летний мальчик Евгений:
Имя персонажа Евгений Густман, Юджин Густман, Eugene Goostman
Место рождения Одесса, Украина
Уровень знаний В соответствии с возрастом: вроде не знает важных вещей, но утверждает, что знает все.
Первая версия Создана в 2001 году.
Знание английского языка На уровне А1-А2
Разработчик Владимир Веселов (Россия), Евгений Демченко (Украина)
Виртуальный собеседник Женя выиграл в испытаниях, организованных университетом Рединга (Великобритания). Это соревнования произошли 7 июня 2014 года. Густману удалось собрать 33 процента одобрений судей в пользу его человеческого происхождения. В 2012 году результат был менее впечатляющим: только 29 процента.


Чат-бот может удивить примитивными ответами. Персонаж правдоподобен, общается в режиме диалога. Он любит гамбургеры и конфеты. Его папа – стоматолог.
Появление чат-бота Жени вызвало большой общественный резонанс. Кажется, что компьютер может соответствовать мышлению ребенка. Связи с этим появились точки зрения о бихевирестичности теста Тьюринга. Критики говорили, что на самом деле эксперимент не доказывает мыслительно-человеческие способности ЭВМ. Разве сложно сымитировать интеллект 13-летнего подростка?
Создателей компьютерных программ до сих пор волнуют вопрос о том, какой лексикон включить в словарный запас бота. Цель разработчиков – обмануть пользователей. Юзеры должны узнать в роботе чисто человеческие манеры поведения


Глава 3.2. Опыт Дэвид Робсона, или минимальный тест Тьюринга
Для того чтобы пройти тест Тьюринга, нужно включить в лексикон робота определённые выражения. Какие слова являются наиболее частыми для человека и редкие для умного виртуального собеседника, попытался определить обозреватель BBC-future, психолог Дэвид Робсон.* В его мини-испытании у испытуемых лиц спрашивали только одно «самое важное» слово. Как оказалось, самыми популярными выражениями стали четыре группы слов: «любовь», «сострадание», «человеческий» и «пожалуйста».
Чисто «человеческие» слова прекрасно знает и ЭВМ. В этом нет ничего удивительного. Поэтому автор статьи предложил второй этап эксперимента. На этом уровне участники определяют, какие из всех чаще и реже произнесённых слов предложены человеком, а какие – машиной. И вот удивительно – многие сошлись, что чисто «человеческий» акцент имеет слово «какашка». Да, экскременты, видимо, – истинное достояние человечества.
Вывод один. Чтобы вас не спутали с ЭВМ, нужно употреблять так называемые неприличные слова. Это – так «по-человечески». Вообще вычислительным машинам не свойственен ни юмор, ни сарказм. Они не способны учесть культурных традиций, пошлить и крыть матом. Боты общаются, как в приличном обществе. Но истинное состояние вещей угрожает человечеству.


Глава 4.Прошли ли современные программы тест Тьюринга?
Оказывается, эксперименты проводятся до сегодняшнего дня. И пока ни один из искусственных интеллектов не получил всеобщего одобрения судей. И это длится уже 30 лет.
Так, в конце 19 века и в новом 21 веке на ежегодном конкурсе Лёбнера (по фамилии создателя Хью Лёбнера) * инженеры пытаются представить новые разработки. Золотую медаль и премию в 100000$ обещают только тому, кто пройдет полноценный тест Тьюринга. Судьи рассматривают следующие варианты программ:
1) Для первого места те программы, которые могут пройти тест, общаясь с людьми в аудио режиме с визуальным контактом, то есть при обычном разговоре.
2) Для серебряной медали рассматриваются текстовые разработки, то есть коммуникация происходит с помощью переписки
3) Для бронзовой медали подходят те авторы, которые написали программы, которые только «сродни» человеческому поведению.
Когда на суд зрителей будет представлена программа, то конкурс будет закрыт. Пока этого не произошла.

Заключение
Итак, суть теста Тьюринга заключается в том, что компьютер способен доказать свою человечность даже опытному судье. Вопросы могут быть разными, искусственный интеллект должен уметь разграничивать общее от частного, вести беседу естественно. С этой задачей, к сожалению, или, к счастью, не может справиться ни одна компьютерная программа.
Вроде бы человека не трудно обмануть. Если раньше машины «туго соображали», то на сегодняшнюю дату скорость ответной рекции у ПК быстрее, чем у взрослого ученого. Однако отметим некоторые явные недостатки эксперимента Алана, или те моменты, в котором робот уступает человеческому разуму.
Оказывается победителями конкурса становится «робот-манипулятор». Чат-бот должен показать главные минусы человеческой сущности – умение обманывать и манипулировать. Кроме того, искусственный интеллект нужно научить «умалчивать». Компьютер может себя выдать своей грамотностью, быстротой, знаниями, скоростью вычислений, точными прогнозами. Поэтому ИТ-специалисты интегрируют в словарь бота функцию сомнений, раздумываний, неверного ответа. Ведь «опечатки» - это чисто человеческий фактор. То ли еще будет?
Чат-боту, чтобы одержать победную схватку над человеком, недостаточно владеть энциклопедическими познаниями. Главное для ЭВМ научиться вести «странно», иногда неадекватно, иногда пошло, часто с эмоциональным подтекстом, что свойственно современному человеку. Основные навыки, которые должны быть включены в код программы виртуального собеседника: 1) умение ошибаться, говорить «я не знаю», «я не владею информацией»; 2) умение манипулировать чувствами собеседника; 3) употребление в критических ситуациях нецензурных выражений и неприличных слов; 4) четкое знание культурных традиций той страны, которую представляет чат-бот.
Если человек начнет обучать ЭВМ некоторым манипуляциям, то это событие приведет к полному хаосу и беспорядку. Зачем делать так, чтобы деградировал «интеллектуальный разум»? Да, и сущность человека разумного не так примитивна, как ее имитируют некоторые чат-боты.
Бесспорно, что ПК должен быть точен, безупречен, копировать поведенческие аспекты идеального и адекватного человека, независимо от обстоятельств. Тест Тьюринга не может быть пройден, так как для этого нужен чат-бот типа 13летнего подростка, правильный образ мышления которого еще не сформирован. Итак, пусть все останется на своих местах, а виртуальные собеседники станут примером для гомосапиенса, образцом того, как нужно выходить из сложных ситуаций, учиться, жить и работать. По мнению автора этой работы, актуальность проведения теста Тьюринга на сегодняшний день считается неуместным мероприятием.

Основные источники
1. Гарри Гаррисон, Марвин Мински. Выбор по Тьюрингу. The Turing Option. Роман, 1992 год. Язык написания: английский. Перевод на русский: А. Иорданский (Выбор по Тьюрингу), 1995 — 6 изд.
2. Алан Тьюринг. Вычислительные машины и разум. Язык написания: английский. Перевод на русский: К. Королев (Выбор по Тьюрингу), АСТ, 2018г.
3. Мередит Бруссард. Искусственный интеллект
4. Джон Серл, публикация в журнале «The New York Review of Books», 1989
5. Елена Слободян. Что такое тест Тьюринга и почему его так сложено пройти? Журнал «Аргументы и факты», интернет-версия за 09.06.2014г.