Современные алгоритмы машинного обучения недетерминированы. Если дать нейросети дважды один и тот же снимок винтика для анализа, получатся два разных результата. В мире складывания футболок или погрузки мешков с цементом на фуры это в целом простительно, а вот в мире сборки iPhone, где допуск измеряется микронами, это критический фактор. Фабрика требует абсолютной предсказуемости: одинаковый ввод должен давать одинаковый вывод. Дэрил называет это «драмой недетерминированности».
Спикеры рассказали, что меньше 3% производителей вообще используют робототехнику — не потому, что технологии нет, а потому, что она не масштабируется как SaaS. Четыре месяца уходит на MVP с восьмидесятипроцентной надёжностью, два года — на доведение до коммерческих 99,7%. При этом данные с фабрик почти невозможно достать из-за режима секретности, аппаратные платформы стоят как крыло самолёта, и нужно множество специалистов по компьютерному зрению, машинному обучению и механике.
Дэниел и Дэрил сходятся в том, что ближайшие годы останутся за специализированными системами — узкими, дорогими, настроенными под конкретную операцию. Любые попытки представить гуманоидного робота (как недавно это сделал Яндекс) — скорее дань моде и попытка показать собственные компетенции, чем создать реально работающий и полезный продукт. Спикеры уверены, что универсальный робот, способный собрать и iPhone, и автомобиль, может появиться разве что на исходе жизни текущего поколения (если вообще появится).
Правда, Дэниел сравнивает ситуацию со взрывом больших языковых моделей: ChatGPT появился на двадцать лет раньше прогнозов, и может быть, в робототехнике произойдёт похожий скачок. Только для этого нужно научить машины воспринимать мир не только глазами, но всеми доступными сенсорами сразу — создать полноценное представление пространства, как у человека. А ещё решить вопрос с энергией. Пока эти проблемы не решены, iPhone будут собирать люди за станками.
#tiaconference2025