Вадим Филиппов: Не хотелось бы жить с мыслью, что нашу работу используют для убийства

Автор: Павел Захаров

Генеральный директор компании «ОКАС» рассказал «Вслух.ру» о том, как научить машину думать и почему россиянам не стоит бояться искусственного интеллекта на дорогах.

Grey

Искусственный интеллект – бездонная тема для научной фантастики, но, похоже, нашему поколению все-таки предстоит познакомиться с разумными компьютерами. На дорогах уже встречаются автономные автомобили Tesla, автоответчики научились распознавать вопросы и переадресовывать клиентов в соответствии с их нуждами. Тюменская компания «ОКАС» (Объединение когнитивных ассоциативных систем) – один из немногих венчурных проектов, занимающихся разработкой нейросетей, обязательной составляющей искусственного интеллекта. О том, как научить машину думать, «Вслух.ру» рассказал генеральный директор предприятия Вадим Филиппов.

– В июле 2017 «ОКАС» стала первой тюменской компанией, которая получила грант федерального Фонда содействия инновациям по программе «Развитие-НТИ». За разработки в какой области вы получили эту поддержку?

– В 2014 году президент России предложил Федеральному Собранию реализовать «Национальную технологическую инициативу». Речь идет о прорывных технологиях, которые будут востребованы в 2035 году. Всего спрогнозировано развитие по 9 отраслевым направлениям, одно из них – NeuroNet, то есть развитие нейротехнологий.

Нейронет объединяет несколько поднаправлений. С одной стороны – это система искусственного интеллекта, нейронные сети, а с другой – все, что касается исследований мозга и интерфейсов прямого соединения мозга с компьютером. Мы стали победителями с проектом по созданию нейросетевой вопросно-ответной системы на русском языке. Размер гранта сравнительно небольшой – 5 миллионов рублей.

– На каком этапе сейчас находится проект?

– В следующем году мы постараемся выпустить его на рынок.

– Какие разработки «ОКАС» уже доступны на рынке?

– Мы закончили разработку очень интересной программной среды, где можно создавать нейросети, она работает на базе мощных параллельных суперкомпьютеров. Можно прямо визуально рисовать на экране нейросети, которые не только работают, но и меняют свою конфигурацию, могут расти и деградировать. Мы называем эту технологию «кибергеномика». Программный код, который управляет развитием нейросети, дает ей просто беспрецедентную свободу.

В этой среде можно создавать нейросети для различных задач, от управления автотранспортом и газопроводами, до вопросно-ответных систем. Мы начинаем ее продавать нейробиологам и кванториумам (детским технопаркам). Еще одна система – распознавания образов. Я уверен, что вопросно-ответная система должна узнавать, с кем общается, и также узнавать людей в материалах, которые она читает на сайтах, в Facebook, где угодно. Поэтому мы сейчас сделали систему на основе сверточных нейронных сетей (CNN), которая точна на 97%.

Третий продукт – непосредственно вопросно-ответная система. Потребность в ней есть практически у каждой организации, она способна в значительной степени заменить работу операторов кол-центра. Мы уже много лет развиваем эту технологию и сейчас завершили работу над большим блоком поисковых нейросетей, которые находят ответ в тексте. Но русский язык – система сумасшедшей сложности. Мало того, что в нем около 300 млн слов, они могут быть как угодно переставлены местами или же вообще отсутствовать в предложении. В нем существует более 80 видов семантических преобразований (симонимы, оппозиции, метафоры, конверсивы, катахрезы, аннуляты, синекдохи, невыводимые композиции), когда одно и то же говорится совершенно разными словами. Кроме того, существуют преобразования позиционные, дискурсивные и логико-вычислительные. Поэтому приходится использовать сразу несколько технологий. Пока вроде все идет нормально.

– В каком состоянии находится разработка искусственного интеллекта? Вы следите за тем, что происходит в этой отрасли в мире?

– Недавно на Западе вышел обзор по индексу цитирования в области AI (искусственный интеллект). Россия занимает 10-е место, уступая большинству развитых стран, например Корее. По практическим разработкам дела хуже. В отрасли информационных технологий сейчас происходит парадигмальный переход к нейротехнологиям. В первую очередь он заметен в аппаратуре. Крупнейшие компании уже начали выпускать экспериментальные продукты. Movidius, дочерняя компания корпорации Intel, недавно выпустила на рынок устройство Neural Compute Stick размером с флешку, обеспечивающее аппаратную поддержку и ускорение работы искусственных нейронных сетей.

Компания IBM подчинила задаче создания нейроморфной электроники большинство своих научных центров. После 20 лет инвестирования в изучение мозга они моделирует кортикальную колонку в процессоре. Дхармендра Модха, руководитель проекта, недавно представил прототип нейроморфного процессора IBM «TrueNorth». Насколько я понимаю, сейчас они находятся на стадии предсерийной разработки.

Hewlett Packard реализует проект The Machine – создание нейроморфной архитектуры компьютера, который умеет ассоциировать. Он создается на основе твердотельных мемристоров, тонких полупроводниковых пленок из оксидов металлов. В них после подачи напряжения в определенной точке меняется сопротивление и появляется память.

Почему компьютер не умеет думать? Потому что есть отдельно процессор, есть память, а между ними – шина. И вы должны написать программу, как все это будет обмениваться, или замкнуть контакты на клавиатуре. Он выполняет вашу программу. А в нейроморфных системах появляется ассоциативность, потому что память и процессинг объединены в сети мемристоров.

Кроме того, в ближайшие годы мы увидим и органические мемристоры. Есть некоторые виды материалов, органические полимеры, тонкие пленки, куда можно поместить наночастицы металлов. Если подать ток, то прямо в толще полимеров изменяется молекулярная структура и появляется проводимость. Вы можете выращивать нейронную сеть в органической пленке. Но до появления этой технологии на рынке еще пройдет какое-то время.

Еще одна технология, которую развивают южнокорейские исследовательские группы, – это очень точное воспроизведение нейрона живого мозга из неживых материалов. Исследователями из Pohang University of Science and Technology (POSTECH) созданы органические нанопроводники для искусственных синапсов, обеспечивающие подобный мембранам живых нервных клеток ионный обмен и потребляющие в 8 раз меньше энергии, чем синапсы мозга. В большинство названных проектов большой вклад вносят наши бывшие соотечественники.

Я не сомневаюсь, что элементная база если и не появилась, то уже появляется в наши дни. Проблема в том, что часто изобретатели плохо представляют архитектуру нейросетей в силу их большой сложности. Архитектура нейросетей – это своеобразный Грааль. Что толку, что у вас будет отдельный синапс, межнейронный контакт, если вы не сможете создать сеть с полезной работой?

– То есть на существующем оборудовании создание искусственного интеллекта пока невозможно?

– Есть мощное направление, которое видно даже невооруженным глазом, – это программные решения. Еще в 1982 году в Японии машину научили различать цифры. В 1990-х годах появились конволюционные (сверточные) нейросети, но технология не выстрелила, потому что не на чем было считать такие объемы данных. Требовались просто огромные вычислительные мощности. Сейчас вместе с развитием графических процессоров появились возможности для их быстрой работы.

На Западе распространены два типа нейросетей: конволюционные «распознавалки» и рекурентные. Это, к слову, тоже интересная технология: они анализируют последовательности, что за чем идет. Скармливаете им гигабайты книг, и они выхватывают наиболее употребляемые последовательности слов, диалогов. На этом строятся чат-боты, которые выдают вам наиболее вероятный ответ. Правда, не понимая сути диалога, смысла слов и высказываний. Чем больше вы скормили этой сетке информации, тем лучше работает чат-бот, так что практически все зависит от обучения.

Одна российская команда из Питера даже прошла тест Алана Тьюринга. Они сделали образ еврейского мальчика из Одессы Жени Густмана, который, удаленно разговаривая с людьми, производил впечатление живого человека за счет воспроизведенного типажа характера и некоторых счастливых совпадений.

– Возможно ли, на ваш взгляд, научить компьютер иметь свое мнение?

– Это проблема машинной субъективности. У нее должна быть своя точка зрения, свои желания, свои цели. В нейроморфных системах ничего не программируется, разве что сама система. Она перестраивается под влиянием опыта.

Представьте, какой-то человек, которого вы уважаете и цените, приводит к вам парня, и говорит, что он хороший. Вы подумаете, что, скорее всего, так и есть. А если человек, которого вы считаете непорядочным, представит вам хорошего парня? Вы, скорее всего, подумаете, что этот парень не так уж и хорош. Если к одному человеку вы относитесь хорошо, к другому – тоже, то, скорее всего, вы моделируете между ними хорошие отношения, даже если они незнакомы. Это не распространяется на мнение о близких родственниках и друзьях, но в 60% случаев это правило работает.

Даже сейчас можно создать простенькие модели машинной субъективности. Когда в наших сетях срабатывает нейрон новизны, и она запоминает какой-то объект, она может тут же формировать к нему свое субъективное отношение на основе детского воспитания. Детский опыт машины можно закрепить мягко, как у человека, или жестко, как у уток (детские воспоминания господствуют всю жизнь). Его можно защитить, закрыть, сделать более ярким, определяющим. Но затем машина начнет сама накапливать свое отношение к каждому новому объекту, исходя из детских представлений. И теоретически получается, можно создать субъективную машину.

Этим пока серьезно никто не занимается, хотя мы и представляем, как это можно попробовать сделать. Мы же заняты выживанием, созданием продукта, более понятного потребителям. Если мы успеем, то сделаем это. Если нет – сделают в другом регионе или государстве.

– До простых людей в последнее время то и дело доходят веселые новости, вроде того, что чат-боты Facebook создали собственный язык, после чего их пришлось отключить. Есть ли в этом какой-то признак зарождения искусственного интеллекта?

– Нет. Это даже не новость. Профессор Кевин Уорвик в Лондоне проводил эксперименты по общению между роботами еще в начале 1990-х годов. Он делал два загона: робот выходил из одного в другой, где находились роботы. У них была возможность сообщать друг другу траектории перемещения, ориентируясь по сонарам, при этом постоянно модифицируя сигнальную систему. Старый робот мог обучать нового. В результате появился совершенно непонятный язык общения между ними. Мы и сами с вами можем прямо сейчас обозвать привычные вещи новыми несуществующими словами, создать новый язык. Просто нужно, чтобы появилось достаточное количество людей, которые будут им пользоваться.

– Голосовые помощники в телефонах по-прежнему работают довольно плохо, хотя технологии уже не один год. В чем дело, неужели прогресса в технологиях распознавания речи не будет, и журналистам суждено и дальше вручную расшифровывать диктофонные записи?

– Технология действительно отстает. На английском языке точность распознавания речи составляет всего 70%, это очень мало. На русском языке дела обстоят еще хуже. Но в то же время определенный прогресс наблюдается от года к году. Я думаю, довольно скоро распознавание станет приемлемым. Даже сейчас, куда бы вы ни позвонили в Европе, вы попадаете на интеллектуальный автоответчик. 50% ваших проблем он в состоянии решить, а если чего-то не понимает, переадресовывает на оператора. Так что, я думаю, скоро проблема распознавания речи будет решена.

Буквально на днях Microsoft объявила, что свела ошибку при распознавании устной речи до 5 процентов на основе нейросетевой технологии. Другое дело, что у журналистов скоро возникнут другие проблемы. Роботы скоро эволюционируют от аннотации новостей до более сложных систем.

– Искусственный интеллект на дорогах – еще одна волнующая тема. Насколько безопасен он может быть?

– Смертность в ДТП во всем мире стоит на третьем месте после сердечно-сосудистых заболеваний и онкологии (я убежден, что сложные проблемы болезней сердца и онкологии без искусственного интеллекта тоже не решить). Первые простенькие образцы автомобилей, выпущенные под названием Tesla, показывают значительное снижение аварийности по сравнению с водителями-людьми. Да, зафиксированы несколько смертельных случаев, но в целом это на порядок менее аварийно, чем ручное управление.

В России же о чем беспокоиться? В России этих технологий не будет. У нас наиболее продвинутая по автопилотам компания Ольги Усковой («Когнитивные технологии») вынуждена была искать заказы за рубежом. Она потратила 5 лет на внедрение этих технологий в России, на «КамАЗе», перекатала всех вице-премьеров на этих беспилотных автомобилях, а в итоге не получила необходимой поддержки. Сейчас она сосредоточилась на работах с зарубежными партнерами.

– Как насчет опасений о состоянии мировой экономики, если роботы лишат какую-то часть населения рабочих мест?

– Многие лишатся работы. Известный бизнесмен Илон Маск любит рассказывать страшилки про искусственный интеллект. Возможно, что все, что он рассказывает, это не страшилки, а добрые и ласковые сказки.

– Насколько эффективной оказывается помощь со стороны правительства на разработку новых технологий?

– В нашей стране практически не занимаются развитием собственных прорывных технологий в гражданской сфере. Та же «Национальная технологическая инициатива» просто буксует. Исполнительные органы власти в России не в полной мере понимают важности науки и гражданских технологий.

Надо различать декларации об инновационном развитии (они есть) и грамотную политику в области развития технологий (ее практически нет). Вот мы  являемся резидентами инновационного центра «Сколково». Плюс от этого есть – мы платим не 30% налогов по зарплате, а 14%. Это хорошо, но это заслуга федерального закона, а не инновационного центра «Сколково». Большой пользы мы в наших проектах от этой организации не получили.

Деятельность многих институтов развития, к сожалению, абсолютно бесполезна для общества. И в центре, и в регионах. Подавляющий объем денег, выделяемых на инновации, уходит на зарплаты инновационным чиновникам и на ненужные мероприятия для галочки. Выделяемые на проекты гранты так малы, что скорее создают видимость активности в сфере инноваций, чем приносят пользу. Огромные проблемы даже с компетентной экспертизой проектов.

Иногда мне кажется, что надо сократить все инновационные структуры в госорганах, чтобы не переводили деньги в пустое и не отвлекали технологические стартапы от работы. Одно из немногих приятных исключений – федеральный Фонд содействия инновациям (Фонд Бортника).

А ведь нейротехнологии могли бы стать перспективным направлением в экономике Тюменской области. В «Национальной технологической инициативе» одно из направлений посвящено как раз нейротехнологиям. В Тюмени создан Федеральный центр нейрохирургии, в котором работают выдающиеся, уникальные специалисты мирового уровня в этой сфере. Есть редчайший материал для исследований по мозгу человека. В каких еще технологиях будущего у Тюмени есть подобные сильные стороны?

– Кто финансирует развитие вашего проекта?

– Наш стартап создавался при поддержке российской компании «Т-Платформы» (она занимается производством суперкомпьютеров) и ее дочки – нанотехнологического центра «Т-Нано». Помимо выпуска подавляющего большинства российских суперкомпьютеров (к примеру, крупнейшего российского суперкомпьютера «Ломоносов»), недавно они запустили производство микропроцессора «Байкал». Появились и частные инвесторы. Некоторые лидеры бизнеса понимают, что надо развивать технологии.

Каждый день включаю компьютер и читаю про выступление Германа Грефа о том, что нужно развивать технологии. Будем надеяться, что его тезисы будут услышаны и реализованы.

– Сколько у вас сотрудников, кто они?

– Двенадцать человек. Большая часть со мной уже давно. Некоторые пришли еще школьниками, учась в 10 классе. Есть программа «Умник», конкурс в рамках которой каждый год проводит уже упомянутый Фонд содействия инновациям. Победители конкурса считаются самой умной молодежью. Я не знаю, сколько их сейчас в Тюмени, но у меня работает три «умника». И все они начинали еще в школе, а сейчас учатся в университетах.

С кадрами огромная проблема. В Тюмени всего 3–4 специалиста за пределами ОКАС, которых я мог бы взять на работу. Недавно один специалист сказал мне, что уезжает работать в Лондон, в крупную компанию, чтобы заниматься компьютерной графикой. Чем я его удержу? Даже зарплаты сопоставимы. А вот города и среды – нет. А другой в тот же день собрался в Питер.

Если мы не научимся любой ценой создавать и сохранять в Тюмени хотя бы небольшие дееспособные команды высококлассных специалистов – региону крышка. И Дмитрий Песков из АСИ окажется прав в том смысле, что шансов у российских регионов в новом дивном мире технологий практически нет. Что только Москва, Питер и, может быть, Томск имеют шансы в России стать технологическими центрами новой экономики. Но комитеты по инновациям для этого не нужны.

– Над решением какой проблемы ваши эксперты работают прямо сейчас?

– Мы должны в ближайшие недели закончить систему, выделяющую морфемы в языке. Это очень сложная задача, с которой не могут справиться с 1968 года, когда была осуществлена первая попытка создания такой программы. Морфемы – это то, что мы знаем из школы: корни, суффиксы, окончания. Но это очень важно. Слов в русском языке уже около 300 миллионов, что довольно много, чтобы быстро запомнить. Кроме того, глупо считать «стол», «столы», «столами» разными словами и давать каждому определение.

Распространенных морфем же всего около 6000. Ребенок может довольно быстро освоить их смысл и сам составлять слова. Но морфемы пересекаются и «налазят» друг на друга в словах как угодно. И вот с 1968 года разные команды мучились, пытаясь научиться их разделять, но ни у кого так и не получилось.

Кроме того, мы сейчас исследуем возможность применения новых архитектур рекуррентных нейросетей к обработке русского языка. Делаем датасеты, развиваем архитектуру наших собственных кортикоморфных (подобных мозгу. – Прим. ред.) нейросетей для решения задач, связанных с пониманием семантики языка.

Мы думаем над объединением технологий семантических и нейронных сетей, совершенствуем систему распознавания образов. Планируем написать интерфейсы между нейросетями и некоторыми робототехническими платформами для нашего программного комплекса OCAS Cortiphica, созданного в прошлом году.

– К вам обращаются с предложениями военные? Им могли бы пригодиться ваши технологии распознавания лиц, к примеру.

– Я думаю, что лучше делать успехи в гражданской сфере. Советский Союз делал большие успехи в военной отрасли, мы и сейчас вторая по силе армия мира. ВПК был развит, но толку с этого? Потребительских товаров было мало, «Кока-Кола» победила КПСС, страна развалилась. Но главное: мне бы не хотелось жить с мыслью, что нашу работу используют для убийства. В то же время страна не должна быть слабой, ибо слабость порождает агрессию извне. Поэтому консультировать, считаю, можно.

– Ранее вы работали в Тюменском государственном университете. Почему расстались с ТюмГУ, что теперь?

– Это произошло в декабре 2016 года. Несколько лет я работал проректором ТюмГУ, занимался информационными технологиями, программой по развитию вузов «5–100», но решил, что пришла пора заняться стартапом. Я понял, что если буду сидеть в университете, то потрачу время на не самые важные вещи. Поэтому решил пойти на этот рискованный шаг. Ведь ОКАС – это чистый венчур, никаких гарантий нет. Но мы стараемся.

искусственный интеллект, нейросети, ОКАС, IBM, HP, Intel, AI, ИИ, интервью, Тюмень

Просмотры: 1037

Комментарии