Надежды и риски взаимодействия с будущими эволюциями системы, подобной ChatGPT, через один из первых фильмов, который отражает все это.

Hamelin 77 — один из первых фильмов, в котором повествование о быстром проектировании и генеративном искусственном интеллекте сочетается с использованием соответствующих техник в процессе производства. Давайте воспользуемся некоторыми концепциями из фильма, чтобы поразмышлять о настоящем и будущем нашего взаимодействия с ChatGPT и связанными с ним системами.

Волынщик из Гамельна

Фильм на метафорическом уровне связан со знаменитой сказкой Гамленский крысолов. С той скоростью, с которой все развивается, необходимо срочно задуматься над вопросом контроля.

Будет ли наша жизнь в конечном итоге полностью или частично контролироваться системами ИИ? (аналогично тому, что происходит с персонажами, которыми управляет Крысолов в известной сказке?)

Останемся ли мы всегда у руля или будет достигнут тонкий взаимовыгодный баланс?

В каком-то смысле мы находимся в центре деликатного и решающего шахматного матча на искривленной доске, правила которой постоянно меняются по мере развития матча.

Каждые несколько дней системы ИИ делают ход (через действия исследователей и компаний), а общество в свою очередь отвечает.

Что большинство людей думают о передаче некоторого контроля AI Piper в отношении вопросов, которые влияют на нашу повседневную жизнь, таких как транспорт, медицина и т. д., при сохранении человеческого контроля?

И что произойдет, когда, в конце концов, этот надзор сможет осуществляться самими системами ИИ высокоэффективным способом? Новое движение конституционный ИИ начинает этот путь. В соответствующем научном документе говорится:
Поскольку системы ИИ становятся более способными, мы хотели бы заручиться их помощью для наблюдения за другими ИИ. Мы экспериментируем с методами обучения безобидного ИИ-помощника путем самосовершенствования, без каких-либо человеческих ярлыков, идентифицирующих вредные результаты. Единственный человеческий надзор обеспечивается через список правил или принципов.

Мы изучаем, как достичь подходящего баланса на этой сложной шахматной доске. И это ключевой момент в фильме: баланс одновременно выжидательный и напряженный, обнадеживающий, но осторожный. Мы все постепенно входим в эту динамическую шахматную доску, и отныне такие головоломки будут становиться только более сложными и сложными.

Пайпер - это зеркало

Мы привыкли думать о машинах как о холодных и детерминированных существах, а о людях как об эмоциональных и спонтанных. И все же по мере развития ИИ эти различия быстро стираются.

К удивлению многих, эта последняя революция ИИ началась с генеративной и творческой стороны (которая еще недавно казалась неприкосновенной).

С точки зрения создания и создания текста большие языковые модели несколько ненадежны, но они могут выражать себя эмоционально, быть остроумными и использовать юмор (и даже пытаться объяснить свои шутки).

Итак, в фильме мы наблюдаем оба полюса, людей и ИИ, способных выражать диапазон от непредсказуемого и эмоционального до расчетливого и точного.

Мы все чаще видим, что ИИ во многих отношениях является зеркалом нашей собственной природы. Чем больше он растет и чем больше мы его исследуем, тем больше мы узнаем о себе.

Человеческий язык, как и части творческого процесса, долгое время казались почти магическими по своей природе, безнадежно сложными.

Но по мере развития систем ИИ они продолжают снимать пелену, закрывающую наш взгляд. ИИ помогает нам раскрыть мифы о многих из этих процессов, поскольку мы обнаруживаем, что, комбинируя мощные масштабные архитектуры с нужными данными, мы можем автоматизировать многие из этих возможностей, хотя и неэффективно (подробнее об этом позже).

В то же время наше растущее взаимодействие с системами ИИ также будет трансформировать и модулировать наше поведение. И, как намекается в фильме, мы потенциально можем столкнуться с конфликтами, возникающими из-за разных целей, которые могут преследовать ИИ и люди.

Это так называемая задача выравнивания. Как говорится в Википедии: Исследования выравнивания ИИ направлены на то, чтобы направить системы ИИ в соответствии с намеченными целями и интересами их разработчикови Системы ИИ могут быть сложными для согласования, а несогласованные системы могут работать со сбоями или причинять вред. .

Как эти два полюса, люди и ИИ, будут влиять друг на друга, и что получится из этого растущего взаимодействия, люди 2.0?

В отношении сегодняшних молодых поколений уже проводится эксперимент. Дети начинают интенсивно использовать ChatGPT и связанные с ними системы, и их образ мышления может претерпеть глубокую трансформацию.

Риски: при неисправности флейты

В фильме катастрофический сбой питания приводит к непредвиденным последствиям во взаимодействии человека и ИИ.

Если мы передаем все больше и больше контроля системам ИИ, поскольку они способны автоматизировать многие наши повседневные дела, как нам защитить себя от непредвиденных сбоев, саботажа, стихийных бедствий и других факторов, которые могут нарушить работу этих систем?

Такое ощущение, что сегодня не о чем беспокоиться. Но что насчет будущего, когда эти системы получат больше автономии и могут неожиданно переключать свою настройку, будь то из-за проблемы с несоосностью или из-за непредсказуемых технических событий?

Кроме того, существует так называемая проблема сингулярности, точка в истории, когда технологический рост становится невозможным контролировать. К тому времени, когда мы поймем, что ИИ перешагнул ключевой порог, может быть уже слишком поздно, чтобы управлять ситуацией и избегать контроля и/или манипулирования такими системами.

Подводя итог, как нам избежать того, чтобы закончить как крысы в ​​истории Крысолова из Гамельна?

Чтобы справиться с некоторыми из этих проблем, мы наблюдаем появление таких терминов, как:

  • Конституционный ИИ: ранее мы кратко рассматривали этот термин в связи с системами ИИ, контролирующими другие ИИ. В общем, конституционный ИИ включает в себя установление набора руководящих принципов (похожих на конституцию), которые можно использовать для контроля и управления поведением этих систем. Все дело в создании руководящих принципов для этих систем, чтобы мы могли убедиться, что они совпадают с соответствующими границами, ограничениями и целями.
  • Ответственный ИИ: практика планирования, проектирования, внедрения и развертывания систем ИИ, которые безопасны, заслуживают доверия и ведут себя этично.

Помогут ли нам некоторые из этих инициатив в конечном итоге управлять возможностями этих волынщиков из Гамельна? Мы увидим.

Работа: присмотр за волынщиком

В фильме учитель проходит собеседование на должность специалиста по быстрому инжинирингу.

Компания Anthropic, приобретенная Google, недавно объявила о первых вакансиях на должность инженера-оператора, предлагая выдающуюся зарплату.

По мере того, как искусственный интеллект берет на себя управление все большим количеством ролей на рынке труда, будут ли люди готовы к радикальному ментальному сдвигу, чтобы стать руководителями этих новых инструментов и возможностей, переходя в более руководящую роль?

Или, возможно, человеку всегда придется наносить последние штрихи, поскольку системы ИИ могут не справиться с так называемым Системой 2 способом обработки информации (согласно Нобелевской премии Дэниел Канеман). ) в течение достаточно долгого времени (если когда-либо).

Система 1 и Система 2 — это абстракции, отражающие два ключевых способа обработки информации в нашем мозгу: быстрый >и подсознательное (Система 1) и медленное, систематическое, логическое и осознанное (Система 2).

Люди используют мышление Системы 2, чтобы, например, медленно и сознательно находить новые алгоритмы, последовательности шагов, которые позволяют вам достичь цели (например, научиться играть на пианино, водить машину или выполнять математические вычисления). После того, как система 2 усвоила алгоритм, наша быстрая и бессознательная Система 1 автоматизирует его в различной степени.

Таким образом, в следующий раз, когда вы будете водить или играть эту мелодию, вы сможете делать это почти автоматически и без усилий, вместо того, чтобы медленно и сознательно анализировать каждый шаг.

Когда вы сталкиваетесь с новым сценарием, ваша Система 1 пытается найти для него соответствие или, наоборот, наилучшее возможное приближение (это то, что вы также называете интуицией, и иногда она ошибается, когда ее приближения далеки от идеальных).

Система 2 часто прислушивается к предложениям Системы 1, готовая при необходимости модулировать и подавлять такие впечатления и предложения (как часто это происходит, может зависеть от того, насколько человек реактивно-импульсивный).

В случае отсутствия подходящего совпадения Система 2 может вмешаться, чтобы медленно обдумать свой путь к новому алгоритму, который позже может быть снова автоматизирован Системой 1. Какой красивый танец!

Современные системы искусственного интеллекта превосходят возможности Системы 1 и способны как бы имитировать некоторые из Систем 2. Но чтобы иметь надлежащие возможности Системы 2, которые необходимы для планирования, контроля, рассуждения и открытия новых алгоритмов, нам нужно будет развивать и продвигать существующие парадигмы ИИ.

Несмотря на необходимость контролировать эти системы, ясно одно. Многие рабочие места исчезнут, и появятся новые виды ролей и должностей.

Как мы можем модулировать и управлять потенциальным уничтожением многих рабочих мест? И как профессионалы могут быть в курсе возможностей, предлагаемых революцией ИИ, чтобы они не остались позади?

Одна из причин, по которой быстрое проектирование будет продолжать расти и расширяться, заключается в том, что эти мощные системы искусственного интеллекта останутся несколько хрупкими и склонными совершать глупые ошибки, по крайней мере, в следующем году. несколько лет.

Это произойдет потому, что они все еще далеки от того, чтобы освоить те возможности Системы 2, о которых мы говорили, и еще дальше от того, чтобы иметь свободу действий, чтобы размышлять над своим выбором. (хотя обе эти возможности можно как-то сымитировать).

Нынешний метод грубой силы, основанный на масштабировании (путем добавления дополнительных данных и параметров), со временем, несомненно, уменьшит количество этих ошибок.

Однако необходимость перехода к системам ИИ, которые являются более эффективными с точки зрения энергопотребления, размера и производительности, а также необходимость сделать их более безопасными и точными, в конечном итоге повысит необходимость развития нынешних архитектур и парадигм ИИ в сторону новые возможности, которые будут более устойчивыми, точными и безопасными.

То, что мы наблюдаем сегодня, является своего рода фазой Франкенштейна, когда люди начинают сочетать магию Системы 1 этих сущностей ИИ (их способность выполнять чрезвычайно сложные сопоставления с образцом) с рядом внешние сторонние инструменты, способные находить и реализовывать алгоритмы Системы 2 (см., например, предложение по подключению Wolfram Alpha и ChatGPT).

Но, как я только что упомянул, чтобы эти системы стали по-настоящему безопасными, точными и стабильными, нам придется выйти за рамки нынешних парадигм ИИ, а до этого, возможно, еще далеко.

Тем временем мы исправляем эти системы, используя такие вещи, как:

  • RLHF:обучение с подкреплением на основе отзывов людей. Это способ тонкой настройки моделей ИИ с помощью отзывов людей. По сути, люди помогают настроить модель, предоставляя обратную связь о том, какой способ общения подходит для системы ИИ. Это способ приблизить ИИ к общению людей.
  • Подсказка по цепочке мыслей: использование ряда подсказок для объяснения шагов алгоритма Системы 2 ИИ, чтобы ИИ мог затем применить его к тому, что мы хотим. Это работает на удивление хорошо, но опять же это просто хак, который заставляет системы ИИ рассуждать так, как будто они обладают возможностями Системы 2.
  • Циклы обратной связи с другими сторонними инструментами, способными реализовать некоторые возможности System 2 (например, упомянутое выше предложение по соединению Wolfram Alpha и ChatGPT).

Вот пример подсказки по цепочке мыслей, как описано в соответствующей академической статье «Подсказка по цепочке мыслей вызывает рассуждения в больших языковых моделях»:

Вопрос. У Роджера 5 теннисных мячей. Он покупает еще 2 банки теннисных мячей. В каждой банке по 3 теннисных мячика. Сколько теннисных мячей у него сейчас?
Обоснование: Роджер начал с 5 мячей. 2 банки по 3 теннисных мяча — это 6 теннисных мячей. 5 + 6 = 11.
Ответ: 11

Вы даете все эти подсказки модели ИИ. Вы буквально объясняете, как рассуждать, чтобы получить правильный результат, указывая шаги, необходимые для реализации алгоритма, который даст правильный ответ. Затем вы просите его применить те же рассуждения к другому, но похожему вопросу. И это работает в целом довольно хорошо. Но опять же, это хак.

Пока наши парадигмы не выйдут за рамки этих хаков и исправлений:

  • Эти системы будут продолжать совершать глупые, а иногда и опасные ошибки, как иногда делает наша человеческая интуиция (Система 1).
  • Оперативное проектирование будет продолжать становиться чрезвычайно важной ролью и дисциплиной, потому что по соображениям безопасности и точности потребность в управлении и контроле этих систем будет только возрастать.

Итак, следующий вопрос: как можно практиковать оперативное проектирование? Как стать большим специалистом в этой области? Мы вот-вот станем свидетелями (это уже началось) запуском всевозможных пособий (курсы, подкасты, книги и т.д.), которые помогут людям тренировать этот навык.

Но, как видите, разработка подсказок — это искусство инаука. Да, хорошие инженеры подсказок должны знать все тонкости многих из этих ИИ. архитектуры, их сильные и слабые стороны, как их обучали и т. д. А в системах, которые работают в конкретных нишах, потребуются быстрые инженеры, являющиеся экспертами в предметной области.

Но помимо этого, отличному инженеру-оператору также нужно что-то менее осязаемое. Что делает кого-то отличным коммуникатором, способным направлять других и сильно влиять на наши мысли? Это люди с гибким и творческим умом. Они умеют решать проблемы, а также прошли через разнообразный жизненный опыт.

Вот почему в списке требований Anthropic к должности проворного инженера самая первая фраза гласит следующее: «Имейте творческий хакерский дух и любите решать головоломки». В основном, будьте экспансивным, творческим, любознательным, любознательным и опытным человеком.

Как объясняется в превосходной книге Дэвида Эпштейна Range, будущее вполне может принадлежать универсалам и междисциплинарным людям.

Мультимодальное образование: обучение с волынщиком

В основе фильма лежит повествование о взаимодействии между людьми и ИИ. Но вдобавок к этому и из-за этого использовались разнообразные методы генеративного ИИ, в том числе:

  • Изображения: создание изображений из текстовых подсказок.
  • Видео: создание видеороликов, созданных путем навигации по абстрактным скрытым пространствам, создаваемым архитектурами искусственного интеллекта.
  • Точная настройка модели ИИ: переобучение моделей ИИ для добавления новых подсказок, связанных с визуальными эффектами актрисы.
  • 3D: NeRF — объемная реконструкция трехмерных пространств и навигация по реконструированному пространству.
  • Голос: искусственное создание голосов на основе искусственного интеллекта.
  • Текст: некоторые конкретные фразы голосов ИИ были получены в результате исследований, проведенных с моделями GPT.
  • Визуальные эффекты. На этапе визуальной постобработки использовались различные техники искусственного интеллекта.

Вскоре технология искусственного интеллекта сможет генерировать любой тип и вариацию мультимодальных результатов, которые мы пожелаем, приближая эти системы к самой нашей природе как мультимодальных агентов, а затем выходя за их пределы, чтобы придумать новые способы выражения наших мыслей.

Это подводит нас к теме образования. Чтобы узнать, например, о битве при Ватерлоо или открытии Америки, люди изучали книги, фильмы и учения своих наставников. Вскоре учащиеся смогут изучать одни и те же темы с помощью реалистичных и индивидуальных реконструкций, созданных системами искусственного интеллекта в соответствии с предпочтениями учащегося.

Какова будет новая роль учителей перед лицом этого взрыва индивидуального мультимодального обучения? И как учащиеся могут максимально использовать эти новые технологии?

Мы можем себе представить, что довольно скоро системы ИИ смогут создавать настраиваемые игровые приложения, которые позволят любому из нас впитывать и изучать любую тему гораздо глубже (а также интереснее), чем когда-либо прежде. .

Язык: краеугольный камень этой революции

Центральное место в фильме занимает человеческий язык, который, возможно, и делает нас самыми уникальными как живые существа.

Способность абстрагировать сложность вселенной в набор элементов, которые мы можем комбинировать, чтобы рассуждать о любом предмете гибким способом, становится сегодня краеугольным камнем искусственного интеллекта.

Во многом именно благодаря LLM (большим языковым моделям) ИИ так сильно продвинулся за последние годы.

В фильме Лара — учительница, увлеченная языком, умением сочетать слова, чтобы выразить гобелен чувств и смыслов. Это отражено в ее чтении стихов Хосе де Эспронседа и Антонио Мачадо (известных испанских поэтов).

Многие удивлены тем, как «только» благодаря обработке большей части языка, присутствующего в Интернете, эти системы ИИ способны взаимодействовать с нами, демонстрируя такое очевидное мастерство во всем спектре человеческого общения, от эмоциональных аспектов до даже связанных с юмором. те.

Что делает это особенно эффективным, так это то, что язык неожиданно стал идеальным мостом между современными системами ИИ, которые представляют собой своего рода огромные подсознательные котлы для приготовления пищи (Система 1), и нашими человеческими процессами рассуждения (Система 2). Мы эффективно используем человеческие абстракции (язык) для управления процессами приготовления этих крупномасштабных сущностей Системы 1.

Используя подсказку по цепочке мыслей, а также точное проектирование подсказок, мы подобны шеф-повару, который управляет комбинациями и рекомбинациями ингредиентов, которые присутствуют в этих обученных системах ИИ, постепенно подталкивая процесс приготовления в направлении, которое мы задумали. цель.

Hamelin 77: Будущее

Между надеждой и напряжением фильм заканчивается предложением, намекающим на то, что произойдет в будущем.

Это связано с вопросом, который все больше и больше людей задают себе. Поскольку ИИ развивается все быстрее, как будет выглядеть мир через десять или два десятилетия?

Ответ может во многом зависеть от тех абстракций, которые мы упоминали ранее, Системы 1 и Системы 2 (согласно Даниэлю Канеману), двух способов, которыми мы обрабатываем информацию в нашем мозгу: быстрый и подсознательный (Система 1) и медленный, систематический, логичный и сознательный (Система 2).

Суммируя некоторые из наших предыдущих исследований, системы ИИ должным образом реализуют только возможности Системы 1. Однако, задействуя язык таким неотъемлемым образом как на этапе их обучения, так и на этапе вывода в процессе подсказки (поскольку язык неразрывно связан со способностями Системы 2 у людей), он способен выполнять поведение, напоминающее Систему 2.

Подсказка по цепочке мыслей (или подсказка по программированию), как упоминалось ранее, — это способы взлома этих моделей, чтобы имитировать поведение Системы 2. Используя их, эти системы могут реализовывать алгоритмы, напоминающие рассуждения, потому что мы буквально шаг за шагом объясняем им, как должно происходить такое рассуждение. Это хитрый хак, потому что эти системы не имеют агентуры и не могут найти эти алгоритмы самостоятельно.

В то же время нетрудно заставить эти системы делать очень очевидные и глупые ошибки, которые могут выдать их истинную природу и напомнить нам, что, несмотря на видимость, эти системы все еще довольно далеко от реализации истинных возможностей Системы 2.

Все это является частью захватывающих дебатов об ОИИ (искусственном общем интеллекте) и о том, как далеко могут зайти системы ИИ в следующем десятилетии и далее, масштабируя существующие парадигмы или ища новые.

Чтобы поразмыслить о том, как мы можем этого достичь, стоит прочитать статью Яна Лекуна Путь к автономному машинному интеллекту.

Pipers of Hamelin полностью вниз

Наконец, если мы сделаем шаг назад и посмотрим на жизнь издалека, мы можем понять, что являемся частью цепи многих волынщиков Гамельна.

По мере того, как мы идем по жизни, мы управляем различными сущностями и процессами, и нас также контролируют другие.

Наши собственные тела представляют собой цепочки гамелинских волынщиков разного масштаба. А хорошая жизнь бывает, когда есть достойный баланс с точки зрения нашего положения в этой цепочке.

Профессор Майкл Левин и его команда опубликовали обширное исследование о том, как ведут себя наши клетки. Каждая из наших клеток имеет свою локальную повестку дня и определенный контроль над своим ближайшим окружением.

В то же время группы клеток ведут себя в соответствии с разными нисходящими целями и эффективно контролируются этими целями. Когда эти два полюса уравновешивают друг друга, организм функционирует правильно.

Однако, когда одна из этих клеток нарушает этот баланс и отдает приоритет своим непосредственным целям и локальному контролю, а не другим вопросам, возникает рак.

Точно так же для успешного сосуществования ИИ и людей мы должны достичь хорошего баланса между предоставлением им достаточной автономии и сохранением нашего собственного наблюдения и контроля над их системами.

Самый важный шахматный матч в истории

Вернемся к аналогии с искривленной шахматной доской, правила которой постоянно меняются по ходу игры.

Последние несколько ходов в этом неопределенном матче вызвали ряд инициатив и терминов, таких как: ответственный ИИ, этика ИИ, конституционный ИИ и другие.

Это матч, который мы не можем позволить себе проиграть. Матч, в котором лучший результат, который мы можем ожидать и к которому мы должны стремиться, — это ничья.

Матч, в котором сотрудничество и кооперация должны быть постоянной и всегда существующей целью.

И матч, который может закончиться только тогда, когда, возможно, через несколько десятилетий люди и ИИ как бы сольются друг с другом. Такие компании, как Neuralink, изучают первые этапы достижения этой цели.

Между тем, несомненно, что системы ИИ станут мощными волынщиками Гамельна. Наша ответственность и ключевая миссия — поддерживать связь таких волынщиков со здоровой цепью механизмов контроля, чтобы грядущий ИИ-человеческий организм мог функционировать здоровым образом.

Hamelin 77 выйдет в ближайшие недели. Для получения дополнительной информации следите за обновлениями на страницах youtube и vimeo, а также на его IMDB.

Этот проект стал возможен благодаря помощи следующих спонсоров и партнеров:Мобильная мировая столица Барселона в рамках инициативы Общества цифрового будущего, Programamos.es, Aerovisuales (joanlesan.com), Tejera Studio, Ideami Studios.