«Кибертакси» Tesla: первый крупный провал Илона Маска — и первый шаг к схлопыванию пузыря ИИ
Что произошло?
Десятого октября 2024 года Илон Маск представил Robotaxi или Сybecab — во время презентации машину называли и так, и так — роботизированное такси без руля и педалей. И даже дал возможность посетителям презентации проехаться пассажирами в этом такси будущего. Таких выпущено уже 20 штук, и несмотря на привычную для Tesla критику хейтеров, с «железной» точки зрения с ними все хорошо.
Да, они всего лишь двухместные, но это не проблема: 95 процентов поездок в такси и поездок на автомобилях вообще происходит с одним-двумя людьми в машине. Учитывая, что «Кибертакси» (мы позволим себе скрестить оба его имени) должен проводить на парковке не 95 процентов своего времени, как обычная машина, а менее 50 процентов, получается, что оно за сутки все равно перевезет в десяток раз больше людей, чем такси обычное, четырех- или пятиместное.
И вообще машина выглядит довольно хорошо продуманной в смысле конструкции. Двери открываются вбок-вверх не просто так: с такими проще посадка на людных улицах, меньше шанс на проблемы с пассажирами, не слишко аккуратно обращающимися с дверями и так далее. Зарядка беспроводная (индуктивная) тоже не без причины: если у такси нет водителя, то кто будет вставлять зарядный пистолет на суперчарджере, где заправляются «Теслы» с водителями?
Наконец, автомобиль явно сделан под влиянием прошлых хитов компании: салон и общая компоновка сходна с Model 3 и Model Y (самая продаваемая машина в мире), а эстетика — с Cybertruck (самый продающийся электропикап в США). Казалось бы, налицо все предпосылки очередного успеха.
Есть только одна проблема: «Кибертакси» Tesla — очень похоже, что это не такси будущего, а такси с очень трудным будущим. И сходная судьба ждет любой проект полностью беспилотного автомобиля как минимум в ближайший десяток лет. Более того: ожидания по революции ИИ, о которой было принято так много говорить еще в 2023 году, кивая на ChatGPT и ему подобные, тоже не взлетит. Поэтому не состоится и замена им программистов, журналистов, художников и множества других профессий. Почему?
Проблемы под капотом
Все дело в том, что в основе «Кибертакси», под капотом его концепции, лежит совершенно то же самое, что и под капотом ChatGPT и так называемого современного ИИ в целом. Почему так называемого? Потому что, как здраво отмечают специалисты по искусственному интеллекту, слово «интеллект» в описании этого явления — совершенно лишнее. Причин множество, но ключевая из них в том, что природа единственного известного нам интеллекта (человеческого) не изучена от слова совершенно.
Речь не о том, что мы не понимаем в нем какие-то детали: мы не понимаем, что это такое вообще, в целом, в принципе. Нет ни одного определения интеллекта, с которым было бы согласно большинство (или хотя бы половина) ученых, изучающих интеллект. Люди знают, что их интеллект может сделать (от ядерной бомбы до теории относительности), но как он это делает, из чего состоит и как устроен, неизвестно абсолютно. Точнее, некоторые ученые, его изучающие, утверждают, что хоть в целом-то они его представляют, но подавляющее большинство их коллег с этим не согласны и предлагают совсем другие идеи по тому же самому вопросу.
Многие энтузиасты революции ИИ говорят (эта позиция особенно популярна среди программистов): не все ли равно, понимаем ли мы интеллект или нет? В программировании часты ситуации, когда даже сами разработчики до конца не уверены, что у них получится задуманный ими продукт. Иной раз только за месяц до дедлайна какими-то совершенно неожиданными ухищрениями, втыкая костыли то туда, то сюда, им удается сделать так, чтобы продукт заработал. Может, тут получится так же?
Нет, так не получится. Но чтобы понять почему, нужно вникнуть в то, как устроен современный искусственный неинтеллект (чуть позже станет ясно, почему мы используем такую приставку).
В основе его всегда лежат нейросети — ПО, которое называют построенным по принципам биологических нейронных сетей. Но по сути это не так, причем сразу по многими причинам. Нейронка — это система так называемых искусственных нейронов, цифровых по своей природе.
Между тем реальный нейроны у вас в голове не цифровые, поскольку некоторые нейроны могут находиться в самых разных состояниях (давать импульсы разной силы), а не только в ограниченный набор сигналов типа «нуля» (нет сигнала) и «единицы» (есть сигнал). А еще они не аналоговые — наука установила и то, и другое совершенно точно. Какие они?
Одни исследователи уверенно говорят, что гибридные: в какой-то части своего функционала цифровые, в какой-то аналоговые. Другие ученые возражают: они не гибридные, они просто конвертируют цифровые сигналы в аналоговые (или наоборот, смотря какого ученого спросить). Правда, зачем им добавлять себе работу такой конвертацией, не очень понятно.
А отдельные ученые настаивают на том, что они вообще квантовые. Их оппоненты хватаются за голову и начинают объяснять, что относительно крупные объекты не могут быть квантовыми. На что им резонно указывают, что то, что невозможно с точки зрения современной науки, далеко не обязательно невозможно в природе.
Всего сто лет назад физики считали, что атомы не могут делиться, что не мешало им массово делиться в реальной природе каждую секунду. Если все так, если нейроны, несмотря на размеры, квантовые по механизмам работы, то это легко могло бы объяснить, почему мы не можем понять, как именно он работает, а равно и то, что такое интеллект, и тем более как воспроизвести его.
Различия между искусственными «нейросетями» и естественными не заканчиваются на том, что «нейрон» в нейросети совершенно точно цифровой, а у нас в голове — какой-то непонятный. На этом они только начинаются. Ключевой принцип обучения современной нейросети — алгоритм обратного распространения ошибки (backpropagation). Уже из названия ясно, что у нас в голове он происходить не может: там, собственно, нет алгоритмов. Это не помешало отдельным исследователям поискать его следы. Но, ожидаемо, никто ничего не нашел.
Перечислять отличия можно долго, но суть читатель уже уловил: «нейроны» и «нейросети» и их «обучения» в ПО Tesla или в ChatGPT имеют не так много общего с нейросетями у нас в голове. Де-факто все существующие искусственные «нейросети» — просто китайская комната. То есть эффективное ПО, умеющее обрабатывать слова так же, как «донейросетевое» ПО умеет обрабатывать числа.
Калькулятор в вашем смартфоне понятия не имеет о том, что складывает или вычитает: он просто обрабатывает то, что вы в него вводите так, как определяют заложенные его программистами алгоритмы. Он не считает: он обрабатывает. Искусственные нейронки не пишут, не генерируют картинки и не управляют вашей «Теслой»: они просто обрабатывают оперируемые ими слова (картинки, прочее) так, как вы им сказали. Во всем этом нет ничего от интеллекта, это просто программа, действующая только тогда, когда человек надавит на кнопку. Даже самый плохой иллюстратор или журналист-новостник может начать работу без команд или программирования, а нейронка нет.
Все, кто ожидает полноценного ИИ, или того, что он начнет, как Скайнет, захватывать мир, это люди, которые не знают, как работает мозг. Специалисты по мозгу тоже не знают. Но они уже обладают достаточными знаниями, чтобы осознавать свое незнание. Поэтому у них даже не возникает мысли опасаться появления разумных компьютеров: нельзя создать Большой адронный коллайдер случайным образом. Создать искусственный мозг человеческого уровня намного сложнее, чем БАК.
Проведем аналогию. Представим, что всех ученых и инженеров 1824 года собрали в одном месте и показали им действующую АЭС из 2024 года в разрезе. Могли бы они понять, как она устроена, а затем воспроизвести ее?
Добавить в заметки чтобы посмотреть позже?Сто процентов — нет. Человек из 1824 года смог бы опознать только одно из цепочки ключевых устройств АЭС, паровой котел (парогенератор). Стоящую за ним паровую турбину он видел бы первый раз. Если ученые той эпохи сильно напрягутся, то поймут, что пар из котла толкает лопатки вот этой странной штуки и вращает ее. Если они ее просто воспроизведут, то она не будет толком работать: для этого нужно, чтобы сопло, подающее пар из котла на турбину, было особой формы. Если им хватит ума скопировать форму сопла, то у них будет паровая турбина. Важный и крупный прорыв для того времени.
Но они никакими силами не смогут скопировать ядерный реактор. Даже если им дать проанализировать его содержимое, даже если они откроют уран, то концепция атомных изотопов им неизвестна. Поэтому они не смогут понять, чем уран-235 отличается от урана-238 — для лучших их приборов это будет один и тот же уран. Значит, они не смогут смешать их в нужной для пуска реактора пропорции.
Глядя на мозг и интеллект человека, мы находимся в сходной ситуации. Перед нами что-то очень продвинутое, примерно как межзвездный корабль или ядерный реактор для человека из 1824 года. Самые простые детали, например тот факт, что нейроны как-то работают в сетях, мы скопировать еще можем. Понять, как именно эти сети работают или обучаются (без backpropagation, зато лучше, чем с ним), уже нет. Как именно работает нейрон? Как все это сопрягается в мозгу? Ответы неизвестны.
Между уровнем нашей науки и уровнем сложности устройства нашего мозга пропасть. Даже если мы выстрелим собой из пушки, чтобы перелететь эту пропасть максимально быстро, нам потребуются век(а), чтобы перепрыгнуть ее даже при самом высоком темпе исследований. Просто потому, что уровень базы очень низкий: нейробиологи сейчас знают о мозге меньше, чем биологи знали о биологии до Дарвина или физики знали о физике до Ньютона.
Что это значит для практического применения «ИИ» (а точнее, «нейросетей»)
Технооптимисты возражают: если бы все было так, если бы, не зная, как устроено что-то очень сложное, мы не могли бы воспроизвести это что-то, разве могли бы нейросети добиваться тех же результатов, что и люди? Ведь нейросети генерят иллюстрации, тексты, пишут программный код, раздают диагнозы, по которым лечат людей, и даже открывают новые соединения. Скажем, только на этой неделе за такие открытия дали нобелевку по химии. Успех нейросетей глупо отрицать, говорят они: иначе за их разработку не дали бы нобелевку по физике (лишив ее собственно физиков), на той же самой неделе.
И потом, говорят сторонники такой идеи, скопировать птицу или стрекозу мы не можем до сих пор, хотя военным очень пригодились бы БПЛА с такой огромной автономностью, или беспилотник-разведчик размером со стрекозу и способный, как и она, к перелетам через океан.
Но это же не помешало людям создать самолеты. Да, у них неподвижное крыло, но в перевозке людей и грузов это не мешает. Не получается ли так и с нейросетями? Пусть они явно устроены совсем не так, как носители интеллекта, это не мешает им добиваться серьезных успехов.
На вид все так. Но попробуем обратиться к конкретным примерам использования нейросетей — и сразу всплывет немало нюансов.
Как работнику СМИ и редактору мне приходится сталкиваться с нейросетями крайне часто. Это эффективное средство оценки качества потенциальных сотрудников. Ведь на сколько-нибудь сложных задачах нейросети стабильно делают характерные ошибки и в переводах, и в написании текстов. Каждый опытный редактор за последний год давно научился быстро отличать текст, автор которого использует ChatGPT любой версии. Подобное экономит время: раньше на понимание того, что продукт работы очередного кандидата может не вызывать у вас восторг, нужно было несколько больше трудозатрат.
Это не значит, что нейросети не используются для генерации контента: используются, и массово. Многие Telegram-каналы и СМИ не очень гонятся за качеством, поэтому часто применяют подобное. Есть и редакторы, поручающие нейронке отредактировать текст в том или ином стиле. Конечно, среди таких редакторов нет людей, блещущих стилем (отчего у них и нет претензий к конечному продукту). Но надо понимать. что медиарынок в нашу эпоху не всегда взыскателен, поэтому находится место и им.
Сходная картина с картинками: качество того, что они генерят, невысокое. Иногда их можно использовать, чаще проще найти нормальное обычное фото. Там, где требования пониже, такие картинки используют действительно часто.
Если мы спросим программистов, пытавшихся использовать нейронки для написания кода, ответ будет очень похожим. Обобщенно он звучит так: если вы кодите на Python простые игрушки для мобилок, то почему бы и нет. Говоришь, что хочешь получить, копируешь выдачу и вставляешь. Что-то оригинальное, принципиально новый продукт — уже нет. На Java примерно так же.
На С++ уже будут существенные сложности: ошибок станет так много, что на их редактирование уйдет как минимум столько же времени, сколько вы сэкономили на написании кода. Такое может иметь смысл разве что для джуниора. Уже у миддла, не говоря о более продвинутом уровне, меньше времени уйдет на написание кода на С++ самому.
Может быть, опрошенные нами программисты, просто олдфаги (самому младшему, кстати, 23 года), у которых трава раньше всегда зеленее, и поэтому принижают возможности нейронок-кодеров? Обратимся к научным работам и отраслевым отчетам по этому вопросу: там все то же самое.
А что же с роботакси?
Хорошо, быть может, с текстами, картинками и кодом нейросети действительно работают так себе. Но ведь беспилотные машины-то уже давно ездят по дорогам. Waymo (читай Google) уже развозит людей в нескольких городах США. «Яндекс» годами рассказывает о том, что его беспилотники отлично ездят по дорогам, в том числе Москвы. Ну и вот Маск наконец-то подтянулся. Очевидно, что нейросети в этой уж области всяко справляются.
Что ж, картинка, которую скармливают нам СМИ, действительно такая. Но стоит задать всего несколько вопросов, как она рушится.
Начнем с самого простого. Смысл роботакси в снижении цены за счет экономии на издержках. В сегодняшних США вы платите таксисту 150 центов за километр пробега. Илон Маск во время презентации «Кибертакси» назвал цену 25 центов на километр пробега как ориентир стоимости его услуг. Даже если удвоить эту цифру (продукт новый, неотлаженный) беспилотные такси в Штатах будут в шесть раз дешевле обычных. Что там с ценами у Waymo?
На деле его цены мало отличимы от Uber в США. Но как это может быть? Напомним: американские цены по 150 центов за километр пробега многократно выше московских именно потому, что в Штатах дороже труд водителя. На оплату труда таксиста там уходят десятки тысяч долларов в год. Возникает нехорошее подозрение, что Google / Waymo просто наживается, пользуясь своими беспилотниками на нейронках. Какая у них прибыль, не 300 ли процентов?
К сожалению, точный размер прибыли Waymo нам узнать не удалось. Основная причина: она несет убытки. За первую половину этого года там потеряли два миллиарда долларов. Как минимум по 800 долларов убытка на одну поездку роботакси.
Как у них это получается? Все просто: никаких беспилотных такси у Waymo нет. Как нет их и у кого-либо другого. То, что так называют, это машина, которой управляет нейронка, и за группой которых присматривает удаленный инженер. Автомобиль попал в непонятную ситуацию, затупил и остановился на пустой дороге (обычная история с беспилотником)? Инженер нехотя отложил в сторону смартфон и подсказал, что делать. Ну или вручную вырулил из сложной ситуации.
Инженер слегка подзавис в телефончике и отвлекся? Беспилотник Waymo, как это уже случалось в 2024 году, въехал в пешехода, велосипед, троллейбус (да, даже в США есть троллейбусы). Компания-разработчик хорошо понимает, что реальной беспилотности у ее нейронок нет. Поэтому на трассы выезжать им особо не дает (чтобы они не поубивали кого-то на загородных скоростях), а услуги старается оказывать в городах с теплым и сухим климатом. Потому что лидары, на которые опирается зрение ее нейронок, плохо работают при тумане и даже мелком дожде: водяные пары поглощают излучение на волнах работы лидаров.
Абсолютно такой же подход к вождению у остальных западных беспилотных такси или аналогов от «Яндекса»: камеры, лидары и нейронки справляются не всегда, поэтому удаленный оператор всегда остается готовым к вмешательству. Но такой подход неизбежно стоит дорого.
Вместо таксиста Хуана Гомеса, вчерашнего уголовника из Мексики и сегодняшнего нелегального мигранта в США, вам приходится сажать на вопрос человека с высшим образованием, хорошего знакомого со сложным ПО, да еще и легального. Вдобавок на таких как бы беспилотниках еще и лидары стоят, а их набор один может стоить как бюджетный автомобиль. Будущее у такой схемы ограниченное: даже если Waymo не разорится, цен ниже, чем у таксистов-людей, так не получить.
Естественно, Маск не хочет четыре миллиарда убытков в год: он на такие деньги ракеты в космос сотню раз запустит. Поэтому в его проекте «Кибертакси» нет никаких удаленных инженеров, мониторящих, что там делает нейронка. И нет никаких лидаров: это дорого и ненадежно.
Маск действительно приложил огромные усилия к тому, чтобы оснастить «Теслы» самыми высокопроизводительными изо всех серийных компьютеров для беспилотников. Его компания разработала для этого специализированные устройства, у которых уникальное соотношение терафлопс и энергопотребления. Только в смысле ПО это все та же нейронка, просто очень быстрая.
А нейронки не в состоянии управлять автомобилями без вмешательства человека долго. Возьмем последнюю широко тестированную версию автопилота (тут тоже нужны кавычки) Tesla — FSD 12.5. Примерно раз в 500 километров люди были вынуждены браться за руль, чтобы избежать опасной ситуации, отключая тем самым автопилот (так называемое критическое вмешательство) и решая проблему вручную. А раз в 70 километров людям начинало казаться, что автопилот подтупливает. Например, едет недостаточно быстро, или не в оптимальной полосе и так далее. Опять они вмешивались и ехали сами до перестроения в другую полосу или подъема скорости до нужного уровня.
На первый взгляд цифры отличные. Средний пробег в сутки у обычной машины полсотни километров: получается, за день вы вмешаетесь в работу нейронки всего один раз. А если забить на оптимальную езду, в какой вы полосе, и на достаточно ли высокой скорости, то можно вмешиваться и раз в неделю. И для владельца «Теслы» с ее штатным автопилотом все так и есть.
Но с «Кибертакси» это не сработает. Нет руля, нет педалей: в опасной ситуации вы не сможете вмешаться. Первая же авария подпортит ему репутацию. Сотая добьет. А ведь Tesla нацелилась на массовую машину: «Кибертакси» будет не дороже 30 тысяч долларов. Собственно, это одна из причин, по которой машина двухместная: так дешевле. Значит, число потенциальных аварий тоже велико.
О каких авариях речь? Вот как это описывает один из владельцев «Теслы» с последней версией автопилота журналист Фред Ламберт: он подъехал к перекрестку, чтобы повернуть налево. Автопилот вроде поехал, но посреди поворота вдруг сильно замедлился. Чтобы в него не врезались слева, Ламберт перехватил управление и завершил поворот. Такое случается регулярно: нейронкам свойственны так называемые галлюцинации. Это ситуации, когда они видят препятствие на пустой дороге и начинают тормозить, чтобы не столкнуться с ним.
Легко видеть, что речь о весьма опасной ситуации. Пока они есть, «Кибертакси» может не быть вообще. Эта компания не выпускает продукт, совсем не протестировав его. Любые тесты покажут, что критическое вмешательство требуется, а средств для него нет. Как тут выпустить продукт?
Может, посадить надзирать за флотом «Кибертакси» инженеров на удаленке, как у Waymo или «Яндекса»? Ведь вмешательство-то нужно будет раз в неделю. Увы, и это тупик: никто не знает, когда оно потребуется. Если вы поставите по одному инженеру на сто машин, он сможет вмешаться только тогда, когда машина уже не справится.
Waymo заявляет, что ее машины самостоятельны настолько, что вмешательство удаленного инженера требуется только раз на 150 тысяч километров пробега. Правда это или нет, мы не знаем. Зато точно знаем, что и эта компания не может себе позволить держать достаточно мало персонала, чтобы не нести убытков на миллиарды долларов в год.
Почему Илон Маск решился на шаг, который станет его первым крупным провалом?
Все это вызывает вопросы. Зачем Waymo вкладывается в проект, который несет ей миллиарды долларов убытков в год, понять можно. Корпоративная среда в Google и его дочках работает так же, как и в любой крупной корпорации. Подчиненный хочет продвижений и бонусов, поэтому представляет начальству картинку «у нас все отлично, убытки временные, надо поднажать, и все исправится». А через пять лет он перейдет работать в другую компанию, и ему вообще по барабану, что там будет с беспилотным направлением в его бывшей компании.
Но Маск-то никуда не перейдет. Зачем ему запускать проект «Кибертакси»? Кстати, ради него он отложил запуск модели электромобиля за 25 тысяч долларов, куда более реальной перспективы.
Все дело в том, что Маск по бэкграунду программист и инженер, а никак не нейробиолог. Поэтому он не знает, что никто не знает, что такое естественный интеллект, что нейроны в нейросетях и в наших головах из общего имеют только название, что в мозге человека совсем другие методы обучения (нет backpropagation, а что есть — вообще непонятно, но как-то работает).
С его точки зрения, прогресс в нейронках Tesla налицо: несколько лет назад критическое вмешательство требовалось раз в десятки километров, а в самой последней конфигурации речь уже о сотнях километров. Маск считает, что надо еще поднажать: на «Кибертакси» версия оборудования для нейронки будет уже не четвертая, а пятая. Больше вычислительных возможностей — и критических вмешательств вообще не будет.
Физики частиц хорошо знают эту логику. Перед пуском Большого адронного коллайдера часто говорили: поднимем мощность — найдем новую физику. И частицы темной материи. И много чего еще. Первые пуски не показали ничего, кроме бозона Хиггса, предсказанного еще в 1960-х. Тогда оптимисты сказали: поднимем мощность, и откроем темную материю. С тех пор мощность там подняли уже не раз, но новой физики не нашли. И не найдут: ведь темная материя состоит совсем не из частиц.
Сходная ситуация будет и с «Кибертакси». Мощность компьютера Маск поднимет, его компания в таком преуспевает. Но нельзя найти то, чего нет. Нельзя найти частицы темной материи на БАК, потому что таких частиц не существует. Нельзя найти уровень мощности бортового компа, при котором нейронки смогут то, что могут настоящие нейроны в нашем мозгу.
Для этого надо понять, как работает мозг, и научиться делать что-то подобное. Делать что-то лишь внешне похожее на птицу, и ставить на него мотор помощнее в надежде, что это взлетит, можно. Но успеха не будет: интеллект устроен намного сложнее летательных аппаратов.
Подчеркнем: это не значит, что Маска ждет банкротство. Да, убытки на проекте «Киберакси» будут большими, возможно настолько же громадными, как у Waymo. Но у Tesla прибыль 15 миллиардов долларов в год, она переварит даже такое. Совершенно очевидно, что в уже 2020-х его компания начнет выпускать машины миллионами, а в 2030-х превысит и объем в пять миллионов в год.
Не значит это и что нейросети за рулем бесполезны. Любой водитель понимает, что машина, которая требует критического вмешательства раз в сотни километров пробега, резко снижает нагрузку на него, особенно в дальней дороге. Отвлечься от дороги тоже не получится: бортовая нейронка через камеру следит за тем, смотрит ли человек-водитель за дорогой.
Самое же главное то, что машины с такой функцией, по опыту Tesla, попадают в ДТП намного реже, чем те же «Теслы», у которых этой функции нет. Да, у нейронок есть галлюцинации, но у людей-то их нет. Поэтому гибрид нейронки и живого водителя не делает типичных человеческих ошибок (ибо не устает), но и не делает ошибок нейронок (потому что у живого водителя нет программных галлюцинаций).
Следовательно, и в смысле комфорта пользователя, и в смысле его шансов на выживание, нейронка на борту «Теслы» более чем оправдана. То есть этот фактор будет привлекать к ней покупателей и далее. А через десять лет сходные по функционалу системы придут и на наш рынок, хотя и в самых дорогих его сегментах (китайских).
Найдется применение нейросетям и вне автомобилей. Есть множество типов документов, которые составлены настолько формализовано, что в них нет особо смысла. И даже если там кто-то и ошибется, то это, во-первых, мало кто заметит, а во-вторых, мало на что повлияет. Все эти бесконечные отчеты учителей, и иное валовое планово-бессмысленное делопроизводство уже делает ChatGPT и будет делать дальше. Просто подредактируют где надо и все.
Но вот надеяться на беспилотные машины, на универсального помощника ученого или конструктора в лице нейросети из 2020-х — значит, надеяться на то, что логарифмическая линейка сможет спроектировать за вас самолет, а калькулятор — доказать теорему Ферма. Наука существует именно для того, чтобы мы четко могли отделять реальное от нереального. И она сообщает нам: нельзя построить самолет, выложив на земле его макет из соломы и палок.
Примечание NS: мнение редакции может не совпадать с мнением автора.
Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
<!— .shesht-social-sharing-block { margin-top: -40px; }
—>