КомментарийОбщество

«Если без хайпа, то ИИ повышает производительность труда»

15 тезисов о машинном обучении профессора МФТИ Константина Воронцова

Фото: Reuters

1. Исторически в исследованиях искусственного интеллекта было два самых крупных направления: экспертные системы и машинное обучение.

Первое направление основывалось на идее, что можно взять какую-то сложную задачу — например игру в шахматы — и заложить в компьютерную программу опыт лучших шахматистов в виде стратегий, способов оценивания ситуации, правил принятия решений. Экспертные знания в принципе формализуемы, хотя это трудная математическая и программистская задача. Но довольно быстро выяснилось, что чем сложнее задача, тем труднее все учесть и предусмотреть в системе экспертных правил. Поэтому стало развиваться второе направление, основанное на машинном обучении. Забудем про знания экспертов и будем просто собирать данные о том, какое решение было правильным, а какое неправильным в той или иной ситуации. Накапливается выборка данных, по которой мы строим предсказательную модель, способную принимать решения в аналогичных ситуациях. Обучение предсказательной модели — это математическая технология, основанная на классической задаче проведения функции через заданные точки. Многие из этих методов известны еще со времен Лагранжа и Гаусса. Конечно, современное машинное обучение оперирует гораздо более сложными функциями, да и под «точкой» теперь может пониматься весьма сложно устроенный объект. По мере того как компьютерный сбор и накопление данных стали более дешевыми, второе направление потихоньку стало вытеснять первое. Например, компьютерное зрение до 2012 года практически топталось на месте, несмотря на огромный объем исследований во всем мире. А как только появилась база данных ImageNet из миллиона размеченных изображений и глубокая нейросеть, вместе они дали революционный эффект, которого никто не ожидал.

2. Нейросети — это часть машинного обучения, продолжение матрешки ИИ.

Сейчас стало принято приравнивать нейронные сети и машинное обучение и говорить, что традиционные методы постепенно вытесняются нейронными сетями. История искусственных нейронных сетей очень драматична. Первая линейная математическая модель нервной клетки — нейрона — появилась в 1943 году в работах МакКаллока и Питтса. Уже в 1950-е годы искусственные нейронные сети начинают отходить от принципов нейрофизиологии и оформляются в отдельные, чисто математические, конструкции. Если говорить о нейросетях языком программистов, то это просто компьютерный код. Если говорить языком математиков — это сложная композиция функций, в которой есть числовые параметры, настраиваемые по обучающей выборке. Например, выборкой может быть большое количество сыгранных партий, в которых машина играла сама с собой. Алгоритм обучения нейронной сети подбирает параметры так, чтобы на этой выборке ошибаться как можно реже. В ходе обучения алгоритм фактически вырабатывает свои правила принятия решений. Искусственные нейронные сети пережили несколько волн энтузиазма, сменявшихся разочарованием от перегретых ожиданий. Сейчас мы снова на волне энтузиазма благодаря последней революции глубокого машинного обучения. Похоже, что на этот раз все всерьез и надолго. В 2016 году глубокие нейронные сети опередили человека по уровню качества классификаций изображений. Люди в ходе тестов допускают 3–5 % ошибок, у нейросетей эта доля меньше. То есть работу людей уже можно автоматизировать везде, где речь идет о распознавании, скажем, номеров автомобилей, лиц в толпе, брака на конвейере или военной техники с воздуха. Но надо понимать, что глубокие нейросети пока работают лишь для ограниченного круга задач. Это те задачи, которые не поддавались старым методам из-за сложной структуры самих исходных данных, таких как изображения, видео, звук, речь, текст, игры.

3. Студентам я всегда объясняю, что машинное обучение — это не повторение естественного интеллекта.

Машинное обучение строится на математическом анализе, теории вероятностей, оптимизации и статистике. Волна хайпа вокруг искусственного интеллекта добавила ему магической ауры. При этом у глубоких нейронный сетей есть реальный прорыв — они автоматизируют процесс извлечения признаков из сырых данных. Раньше этим занимались целые отделы математиков и инженеров. Например, придумывали кучу изощренных формул, как перевести изображение в числовой вектор, чтобы распознавать иероглифы, автомобили или лица людей. Все это довольно медленно развивалось, потому что требовало многих лет исследований и высококвалифицированного труда. Теперь произошел переход от инженерии признаков к инженерии нейросетевых архитектур,когда специалист придумывает, сколько в нейросети будет слоев и как он их расположит. Это намного проще, быстрее и дешевле. Но это совершенно не означает, что глубокие нейросети настолько универсальны, что способны решать все задачи на свете. Многие задачи моделирования еще долго будут решаться людьми на основе глубоких знаний предметной области. Главное, чего искусственный интеллект пока не может даже близко, — это заниматься целеполаганием и ставить задачи.

Фото: Reuters

4. Поначалу люди пытались строить нейросети на принципах нейрофизиологии, но потом это направление все более и более отрывалось от исходных позиций бихевиоризма.

Искусственные нейросети идут своим путем. Они развиваются исходя из принципов математического и технологического удобства, и не обязаны быть устроены так же, как устроен наш мозг. Моя любимая аналогия: самолеты, вертолеты и ракеты устроены совсем не так, как птицы, хотя изначально люди пытались копировать механику птичьего полета. Но потом оказалось, что проще построить реактивный двигатель, чем махать крыльями. То же самое происходит с искусственным интеллектом: необязательно воспроизводить сложную работу мозга. Можно создать гораздо более простые механизмы, усовершенствовав давно известные вычислительные методы оптимизации и статистики.

5. Сейчас проводится много исследований по подбору архитектуры нейросети, чтобы решать более сложные задачи.

Под архитектурой сети мы обычно понимаем число слоев, число нейронов в каждом слое и способы связывания нейронов. Примитивный способ связывания — когда все нейроны одного слоя связаны со всеми нейронами следующего слоя. Эта техника постепенно уходит в прошлое — слишком много параметров, много времени на их обучение, много памяти для их хранения. Знаменитые сверточные нейросети имеют более специфичную архитектуру — в них гораздо меньше связей, и они нацелены на обработку каждого небольшого участка изображения или сигнала вместе с его окрестностью. Рекуррентные сети для анализа текстов или сигналов имеют еще более сложную архитектуру. Сейчас значительная часть исследований направлена на открытие новых удачных архитектур. Причем исследования в значительной степени эмпирические и феноменологические. Пока у нас нет общей теории архитектуры искусственных нейронных сетей. Мы находимся в той стадии развития этой науки, когда исследователи накапливают сведения о том, какие подходы в каких задачах работают лучше.

6. За каждой строчкой обычной поисковой выдачи стоит какой-то интеллектуальный сервис.

Поисковые системы Яндекс или Google — это, по сути, тоже роботы. Нейросети в поисковиках решают очень много задач. Начнем с фильтрации поискового спама — если бы не эта функция, то вы бы вообще ничего полезного не увидели в списках поисковой выдачи. Вторая задача — это ранжирование результатов запроса по релевантности. Третья — показ рекламы, на которую вы с большей вероятностью кликните. Даже такая мелочь, как выпадающий список вариантов продолжения запроса. Таких умных сервисов только на стартовой странице «Яндекса» десятки. Поиск информации на сегодняшний день уже очень эффективен, и это огромный прорыв, по сравнению с тем, что было 30 лет назад, когда за информацией надо было ходить в библиотеки. Однако процессы систематизации и понимания информации остались на прежнем уровне. Мы научились экономить время на поиске, но как теперь сэкономить его на чтении? Моя команда в компании Aithea сейчас разрабатывает новую технологию «умного поиска». Мы переходим от поиска по коротким фразам к поиску по текстам любой длины, по их тематике и смыслу. Это новый уровень информационного поиска. Пользователь может не знать дословно, что именно он ищет, и система должна подсказать ему, что читать и в каком порядке, чтобы разобраться в данной теме. Мы разработали модель тематического поиска, которая решает эту задачу точнее людей. Это будет специализированный поисковый сервис, и первыми его пользователями станут профессиональные сообщества со своими специфическими поисковыми потребностями.

7. Если отбросить весь хайп, то искусственный интеллект — это в первую очередь способ повышения производительности труда в разных сферах.

Информационные технологии позволяют централизировать сбор данных. Это, между прочим, огромный объем организационно-технической работы, труд инженеров и менеджеров, которых никакой искусственный интеллект не заменит даже в отдаленной перспективе. Затем мы строим по этим данным предсказательные модели, которые автоматизируют принятие решений, дают прогнозы и рекомендации. Рост вычислительных мощностей и снижение их стоимости потихоньку ведет к тому, что в памяти компьютеров можно держать все более адекватную модель все большего куска реальности. Например, внутри промышленной информационной системы мы можем знать все, что происходит с каждой деталью, которая идет по конвейеру. В некотором смысле это и есть виртуальная реальность. Если эти модели адекватны по всем узлам производства, то оно может быть роботизировано почти полностью. Это реально приближает нас к тому, чтобы многие процессы происходили почти без людей. Но автоматизация всегда требует предельно четкой постановки задачи. Экскаватор может только копать. Банковская скоринговая система может только принимать решения по кредитам, причем только на том рынке, на данных которого она была обучена. Скоринговая модель — это тоже «искусственный интеллект», но, чтобы перенастроить ее в новых условиях, необходимо проделать кучу ручной работы по подготовке данных, исправлению модели и ее валидации. Искусственный интеллект — не чудо, а инженерная дисциплина.

Войны разума

Сможет ли Россия бросить вызов США и Китаю в новой технологической гонке

8. Я считаю, что к массовой безработице это не приведет, потому что люди всегда найдут, чем им заняться.

Где-то это приведет к локальным изменениям, возможно, исчезнут отдельные специальности, но такие вещи уже не раз бывали в истории. После каждой индустриальной революции общество трансфморировалось, хотя порой этот процесс бывал болезненным. Многие были вынуждены менять работу, переучиваться, но новые профессии, как правило, оказывались более творческими. Думаю, что искусственный интеллект приведет нас не к безработице, а к сокращению рабочего дня — люди будут работать по 4 часа, а остальное время заниматься саморазвитием. Творческими профессиями — наукой, разработками, дизайном — будет заниматься чуть больше людей, чем сейчас. Но не все хотят быть творцами. Появится много новых профессий для людей с низкой квалификацией. Например, нужно много людей, чтобы обучать машины. Наверное, у многих сразу возникнет образ учебного класса с антропомофорными роботами, с головой в виде ведра. Это совсем не так. Робот — это любая компьютерная система, способная обучаться по данным. Уже сегодня у нас есть прототип профессии «учителя роботов». Это армия асессоров и краудсорсеров, которые оценивают релевантность поисковой выдачи, размещают фотографии объектов, размечают изображения для обучения нейросетей. Плюс останется сфера обслуживания: люди, которые что-то делают для других людей. И социальные проекты. Есть масса профессий, где ценно именно человеческое общение: воспитатели, учителя, врачи, психологи. Жить в машинном мире без общения было бы очень неприятно.

Фото: Александр Рюмин/фотохост-агентство ТАСС

Поддержите
нашу работу!

Нажимая кнопку «Стать соучастником»,
я принимаю условия и подтверждаю свое гражданство РФ

Если у вас есть вопросы, пишите [email protected] или звоните:
+7 (929) 612-03-68

9. В России ИИ оказался очень востребованным в очень короткие сроки, и мы оказались к этому не готовы.

Первая проблема — наш рынок интеллектуальных технологий пока очень маленький. Бизнес и потребитель не готовы массово покупать продукцию ИИ, а значит, нет и производства, оно мало востребовано. Это могло бы быть по-другому: у китайцев несколько лет назад рынок интеллектуального софта тоже был маленький, но они смогли его развить с таких же стартовых позиций. При этом Россия, как и Китай, тяготеет к централизации, и это скорее плохо, чем хорошо. Есть «Яндекс», «Сбербанк», еще пара десятков компаний чуть поменьше, которые пытаются производить свои решения, и сотни не очень крупных компаний. То ли следствием, то ли причиной слаборазвитого рынка является отсутствие регулярного образования в этой сфере. Рынок труда испытывает жесточайший голод — специалистов по ИИ отрывают с руками.

С чего начинаются роботы: пять главных российских проектов в сфере ИИ

10. Многие управленцы ждут от ИИ чуда, не понимая, что эти технологии сильно зависимы от качества данных.

У нас был анекдотический случай, когда один индустриальный заказчик сказал: «Вы же специалисты по большим данным, так дайте нам больше данных!» Не понимая фундаментальную вещь, что данные всегда генерирует бизнес — источник данных должен быть у него, а мы строим модели по этим данным. Если данные собраны правильно, они достоверные, и их достаточно много, то все получится хорошо. Самая большая беда для машинного обучения — это грязные данные. Например, если в ритейле вы неаккуратно собираете данные об остатках и пересортице, неправильно считаете потери, то алгоритмы для планирования поставок будут работать неверно. Надо очень дисциплинированно отстроить бизнес-процессы, потратить на это деньги и время, чтобы затем строить интеллектуальные решения на чистых данных. Бизнес, работающий по старинке, этого часто не понимает. В результате оказывается, что данные неполные, неточные или содержат намеренно искажаемую информацию. Цифровизация экономики — это в первую очередь про выстраивание прозрачных бизнес-процессов сбора и обработки данных с учетом того, какие задачи предсказательного моделирования на этих данных должны решаться, с каким качеством и по каким бизнес-метрикам. Для этого приходится начинать с капитального ремонта бизнес-процессов. Труднее приходится тем, кто уже внедрил технологии сбора данных бессистемно, по принципу «будем хранить хоть что-то, авось пригодится».

11. Машины — это высокотехнологичные «костыли», они позволяют человеку делать ту работу, которую раньше он делать не умел.

Я не считаю, что это аналог или заменитель человеческого интеллекта. Тест Тьюринга можно пройти формально: нетрудно написать алгоритм, который притворяется не вполне адекватным мальчиком лет 10. Это всего лишь функция, обученная на огромной выборке текста, написанного все же живыми людьми. С ней можно перекинуться парой слов, но рано или поздно вам станет очевидно, что это машина. Как и программы, которые победили чемпиона мира по игре в го, — это дорогие рекламные примеры с минимальной практической пользой. Конечно, это важные технологии, но, извините, кроме этой узкой задачи, они не умеют больше ничего. Это пока что очень далеко от общего ИИ. В мозге человека 80 млрд нейронов. В искусственных нейронных сетях пока что на пару порядков меньше. Хотя мы очень быстро приближаемся к этой отметке. Когда говорят про сингулярность, это как раз попытка предсказать, что произойдет, когда мощность искусственной нейросети станет сравнимой с естественной человеческой. Возможно, они смогут принимать очень сложные решения — вплоть до автономной жизни в нашем трехмерном мире и в человеческом обществе. Как именно произойдет этот переход количества в качество — зависит только от нас. Позволим ли мы машинам быть полностью самостоятельными или оставим сильными, но послушными искусственными рабами, — решать нам и нашим детям. Человечество не в первый раз играет со смертельно опасными игрушками.

Фото: Reuters

Кто кого отключит?

Чем на самом деле грозит человечеству развитие умных машин

12. Тем не менее я считаю, что страхи о похожих на людей машинах плохо обоснованы.

Машины уже давно превосходят людей по многим параметрам — летают, плавают, роют землю, вычисляют намного лучше человека. Но никакого коллапса не происходит. Человек — результат миллиардов лет эволюции, а компьютер спроектирован и произведен, причем в масштабе истории, совсем недавно. Принцип выживания был заложен в эволюционных механизмах и отработан миллионами лет. Конечно, ученые — люди любознательные, им дико интересно посмотреть, что будет, если позволить машинам тоже эволюционировать, появятся ли у них инстинкты самосохранения, размножения, самоосознания, стремления неограниченно улучшать качество собственной жизни… Это проект, чудовищно опасный для человечества. Но, к счастью, столь же чудовищно дорогой. Мне кажется, что это фантастика, это никогда не будет сделано. Нет экономической целесообразности. Я не против нейросети, которая будет превышать вычислительные возможности совокупного мозга всего человечества. Это прекрасная штука. Но нет никакой нужды давать ей автономность и ресурсы для самовоспроизведения.

13. Отрицательные примеры, когда нейросеть научилась чему-нибудь плохому, всегда искусственные и проплаченные.

Они легко отбиваются на профессиональном уровне, но когда тема ИИ выносится на уровень широкой публики, она, как правило, сильно искажается. Вы взяли информацию из Интернета и выдали роботу, который научился обзывать собеседника фашистом. Ну да, люди так делают, и что из этого? Когда поисковик находит в Интернете что-то плохое, то к кому претензии? Очевидно, к производителю контента, поисковик к этому не имеет отношения. Однако многие люди относятся к этим новым явлениям нашей жизни по-дилетантски и чисто эмоционально — «это ведь поисковик мне выдал!» Да, а многие пользователи все еще не видят разницы между Интернетом и «Яндексом», установленным в браузере стартовой страницей. Многие люди возмущались от того, как в видеоролике «Бостон Дайнэмикс» инженер пинал ногой четырехногого робота. Робот был похож на животное и вызывал жалость. Однако человек не может обижаться на робота — это нонсенс. Инженер имеет право тестировать свою машину, а также разобрать ее или даже уничтожить. Удивительно, что здесь здравый смысл дает сбой и уступает место эмоциям. Видимо, нужно время, чтобы общество сформировало адекватное отношение к тому, что делают роботы, кто их этому научил, а также к тому, что люди делают с роботами. Конечно, мы не хотим учить роботов плохому, как и наших детей. Большинство современных методов машинного обучения, включая нейронные сети, обучаются по выборкам данных, которые формируют люди. К процессу формирования выборок могут быть обоснованные претензии, и эти вопросы должны решаться как чисто технологические — спокойно, в рабочем порядке. Раздувать из этого громкие медийные истории скорее вредно, чем полезно. Разве что привлечь внимание общественности к проблеме. На мой взгляд, проблема того не стоит.

Фото: Reuters

14. Когда людям хочется понимать, почему решения нейросети именно такие, а не какие-то еще, встает дополнительная задача интерпретации.

Можно попытаться по шагам объяснить логику работы алгоритма. Это не всегда удается, потому что многие алгоритмы устроены очень сложно и интерпретировать изнутри их невозможно. Можно пойти другим путем и сказать: решение по вашему случаю принято потому, что до этого в выборке были похожие случаи, и вы попали в эту же когорту. Это прецедентная логика, которая хорошо работает у врачей, геологов, юристов. Отдельная задача — научить нейросеть понимать, на чем именно основано сходство между разными случаями. Она нетрудная, просто, когда разрабатывались технологии ИИ, об этом мало кто задумывался. Проблема казалась маргинальной, поэтому сейчас в методах интерпретации мы слегка отстаем. Однако сегодня объяснение решений ИИ в понятных терминах не менее важно, чем сама модель. Думаю, что уже в ближайшие годы это отставание будет наверстано.

15. Бывает, что коммерческая деятельность с использованием ИИ вступает в противоречие с требованиями политкорректности.

Например, цвет кожи человека является информативным фактором при прогнозировании дефолта в банковском скоринге, в частности в США. Банкам было бы очень выгодно использовать такие факторы, так как они повышают точность прогнозирования. Однако использование гендерных или расовых признаков, даже косвенных, запрещено законодательно, так как ведет к дискриминации. В каждой стране эта проблема решается по-своему. Этот вопрос лежит в сфере культурологии, политики и юриспруденции. Нет никаких технических сложностей с введением такого рода ограничений в предсказательные модели.

Поддержите
нашу работу!

Нажимая кнопку «Стать соучастником»,
я принимаю условия и подтверждаю свое гражданство РФ

Если у вас есть вопросы, пишите [email protected] или звоните:
+7 (929) 612-03-68