Humanoide Roboter und ihre neuesten Entwicklungen

25 Sep 2024
Die in Simulationen erworbenen Fähigkeiten werden mit Sim2Real auf den humanoiden Roboter übertragen

LOGISTIKFORSCHUNG
Von Jay Huang, Ph.D, Dien Wang, Ph.D und Weibin Liang, Ph.D

Foto: Unitree

Die humanoiden Roboter, die ultimative Automatisierungslösung, von der die Menschheit seit langem träumt, werden langsam zur Realität. Die Präsentation von Optimus hat das Interesse der Öffentlichkeit und der Tech-Giganten geweckt, obwohl sich die Branche noch in der Prototypenphase befindet.

In Anlehnung an die menschliche Anatomie sind die drei Hauptelemente der humanoiden Roboter das „Gehirn“, das für die Planung von Aufgaben und Bewegungen zuständig ist, das „Kleinhirn“, mit dem sie das Gleichgewicht halten und sich flüssig bewegen, und der „Körper“, der ihnen die Wahrnehmung und die Fähigkeit zur Ausführung von Handlungen verleiht. Zu den größten Herausforderungen, denen sich diese Roboter stellen müssen, gehören die Vermeidung von Stürzen und die Verbesserung ihrer Intelligenz zur Erfüllung verschiedener Aufgaben.

Die künstliche Intelligenz (KI) hat die Spielregeln verändert. Neue Techniken wie das Verstärkungslernen, das Nachahmungslernen oder große Sprachmodelle (LLM) eröffnen einen vielversprechenden Weg für humanoide Roboter. Dank ihres „Kleinhirns“ können sie das Gleichgewicht halten, Unterbrechungen vermeiden, komplexe Bewegungen in virtuellen Welten ausführen und diese Fähigkeiten anschließend in die reale Welt übertragen. Die durch KI verstärkten „Kleinhirne“ zeigen bemerkenswerte Fortschritte in Bereichen wie der Stabilität und Anpassungsfähigkeit von Robotern, die in der Vergangenheit erhebliche Schwierigkeiten bereiteten. Wenn dieser Bereich des Gehirns lebenswichtig ist, dann ist das humanoide „Gehirn“ von noch größerer Bedeutung. Verstärkungs- und Nachahmungslernen sind sehr vielversprechend für kurzfristig trainierte Anwendungen. Die Nutzung großer Sprachmodelle ist attraktiv, aber ihre Umsetzung in der Praxis bleibt eine Herausforderung. Bei der Teleoperation, bei der ein ferngesteuerter Roboter von einem menschlichen Bediener gesteuert wird, lassen sich hervorragend Trainingsdaten sammeln. Zudem kann sie als Notlösung dienen, wenn die „Gehirne“ der Roboter mittelfristig nicht gut vorbereitet sind.

Vor der Einführung der KI in diesem Bereich fielen die Androiden leicht um

Unitree ist unter den Unternehmen, die humanoide Roboter entwickeln, und den neuesten Entwicklungen führend im Bereich „Körper“ und „Gehirn“. Das Unternehmen, das sich ursprünglich auf vierbeinige Roboter konzentrierte, ist inzwischen in den Bereich der Zweibeiner vorgedrungen, und sein Humanoid verfügt über außergewöhnliche Bewegungsfähigkeiten. Google DeepMind hingegen ist führend bei der Entwicklung der „Gehirne“ von Robotern. Das Unternehmen erforscht genAI und andere Techniken, die über die traditionellen großen Modelle hinausgehen, und seine Forschung basiert auf vereinfachten humanoiden Robotern.

Die drei entscheidenden Elemente für humanoide Roboter sind das „Gehirn“, das „Kleinhirn“ und der „Körper“, einschließlich ihrer „Augen“, „Ohren“, „Haut“, „Muskeln“ und „Knochen“. Die wichtigsten Verbesserungsmöglichkeiten in allen drei Bereichen sind jedoch relativ unabhängig und können parallel verbessert werden.

Die humanoiden Roboter müssen noch stabiler werdaen, bevor sie eingesetzt werden können (Foto: Unitree)
Foto: Unitree

Das „Kleinhirn“

Wie beim Menschen spielt das „Kleinhirn“ eines Humanoiden eine Schlüsselrolle bei der Koordination seiner Gelenke, um Gleichgewicht und reibungslose Bewegungen zu gewährleisten.

Es war eine Herausforderung, die Roboter so einzustellen, dass sie stabil laufen können. Vor der Einführung der künstlichen Intelligenz in diesem Bereich fielen Androiden leicht hin, und zum Schutz der empfindlicheren Maschinen mussten sogar Sicherheitskabel verwendet werden. Einige Unternehmen haben zwar relativ fortschrittliche Steuerungsmethoden wie Total Body Control und Model Predictive Control (MPC) mit beeindruckenden Ergebnissen eingeführt, aber die Humanoiden können sich in unvorhersehbaren Szenarien immer noch nicht wirksam behaupten. Sie müssen für die Fortbewegung oder für bestimmte Aufgaben noch effizienter optimiert werden, und das „Kleinhirn“ weist in diesem Bereich noch einige Hindernisse auf.

Dank der künstlichen Intelligenz, insbesondere des Verstärkungslernens, und der heute verfügbaren leistungsstarken Simulationstechniken können die Spielregeln jedoch geändert werden. Beim Verstärkungslernen handelt es sich um einen Prozess von Versuch und Irrtum, bei dem Roboter durch wiederholte Interaktionen mit ihrer Umgebung Verhaltensweisen erlernen. Ingenieure programmieren Humanoide mit Befehlen „was zu tun ist“, erklären ihnen aber nicht „wie es zu tun ist“, damit die Maschinen selbstständig eine Lösung finden können.

Künstliche oder 3D-Sicht mittels LiDAR-Scannern oder Tiefenkameras, bewegliche Hände sowie Tast- und Drucksensoren sind entscheidend für die Leistungsfähigkeit von Humanoiden

Zur Perfektionierung dieser Bewegungen sind Simulationen erforderlich, d. h. virtuelle Umgebungen, in denen die Roboter ihre Fortbewegung und die Ausführung von Aufgaben verbessern können. Anschließend können die in der virtuellen Simulation erworbenen Fähigkeiten und Kenntnisse in sogenannte Sim2Real-Infrastrukturen in die Realität übertragen werden. In der Anfangsphase sind Misserfolge unvermeidlich, aber irgendwann finden die Roboter doch einen Weg, diese Schwierigkeiten zu überwinden.

Die Zukunft sieht zwar vielversprechend aus, aber Simulationsumgebungen und Sim2Real stellen auch gewisse Hindernisse dar. Dabei handelt es sich um komplexe Plattformen, die physikalische Phänomene nachbilden. Zudem müssen Faktoren wie Starrkörperdynamik, Kollisionen, Reibungen und Verformungen berücksichtigt werden, damit virtuelle Welten so realistisch wie möglich sind.

Boston Dynamics hat die Häufigkeit des Hinfallens seines vierbeinigen Roboters auf einmal alle 50 Kilometer reduziert. Dieser Wert ist bei den Zweibeinern höher. Trotz großer Fortschritte brauchen Humanoide also noch mehr Stabilität, bevor sie in der Industrie auf breiter Front eingesetzt werden können.

Tesla Optimus Gen-2 humanoider Roboter von Tesla (veröffentlicht unter CC BY 3.0 Unported Lizenz)
Tesla Optimus Gen-2 humanoider Roboter von Tesla
Veröffentlicht unter CC BY 3.0 Unported Lizenz

Das „Gehirn“

Die Forscher arbeiten noch daran, Roboter so intelligent zu machen, dass sie verschiedene Aufgaben erfüllen können. Das Problem wird kurzfristig durch Verstärkungs- und Nachahmungslernen angegangen, und langfristig sollen große Sprachmodelle und End-to-End-Modelle implementiert werden.

Zusätzlich zur Verbesserung der Bewegung von Robotern ist das Verstärkungslernen für das Training von Robotern für bestimmte Aufgaben nützlich. Allerdings kann es zu lange dauern, bis die Autonomie bei allgemeineren Aufgaben erreicht ist. Eine praktischere Herangehensweise ist daher das Lernen durch Nachahmung, bei dem eine Person dem Humanoiden durch Teleoperationssysteme zeigt, wie er agieren soll.

Das Team von Google DeepMind schlägt die Übernahme mehrerer großer Modelle vor, um die Funktionen Wahrnehmung, Planung und Ausführung zu übernehmen. Hierzu wurde ein integriertes Modell für Vision-Language-Action (VLA) mit der Bezeichnung Robotic Transformer 2 (RT-2) eingeführt, das diese drei Hauptfunktionen erfüllt. Sie haben gezeigt, dass RT-2 Aufgaben erledigen kann, die menschliches Denken, Symbolverständnis und Erkennen erfordern. So erfordert beispielsweise der Befehl „Lege die Erdbeere in die richtige Schale“, dass der Roboter versteht, was eine Schale ist und was eine Schüssel – aber auch, dass er diese Frucht mit anderen ähnlichen Früchten gruppieren kann.

Der „Körper“

Wir sind der Meinung, dass neben Kernkomponenten wie Motoren und Getrieben auch Elemente wie künstliches Sehen oder 3D-Sehen durch LiDAR-Scanner oder Tiefenkameras, bewegliche Hände sowie Berührungs- und Drucksensoren für die Leistung von Humanoiden entscheidend sind. Wir glauben daher, dass sie für fortschrittliche Roboter mit optimaler Funktionalität unverzichtbar sein werden.

Aufkommende Trends und Herausforderungen bei humanoiden Robotern

Hauptmodule von humanoiden Robotern Technologische Trends Herausforderungen
„Gehirn“
Planung von Aufgaben und Bewegungen
  • Gegenwart: Verstärkungslernen + Nachahmungslernen
  • Zukunft: Große Sprachmodelle (LLM)
  • Langfristige Zukunft: Große End-to-End-Modelle
  • Mangel an Daten für das Training
  • Unfähigkeit, bestimmte Aufgaben zu übernehmen
  • Zuverlässigkeit muss nachgewiesen werden
„Kleinhirn“
Koordinierung der Gelenke
  • Vergangenheit: Total Body Control + Model Predictive Control (MPC)
  • Gegenwart: Verstärkungslernen + Sim2Real*
  • Qualität der Übertragung von der Simulation auf die reale Welt
  • Anpassungsfähigkeit an unterschiedliche Umgebungen
„Körper“
Wahrnehmung der Umwelt und Ausführung von Bewegungen
  • Motoren mit hoher Leistungsdichte
  • Flexible Roboterhände
  • Berührungs- und Drucksensoren
  • Kostensenkung
  • Verbesserte Hardwareleistung (hohe Leistungsdichte, Dynamik, geringeres Gewicht usw.)

 

Quellen: Chinesische Akademie der Wissenschaften, Innovationszentrum für humanoide Roboter in Peking, Tsinghua Universität und Bernstein Analyse.
*Sim2Real, die Abkürzung für „Simulation der Realität“, bezieht sich auf die Übertragung von Bewegungen, Fähigkeiten oder Wissen aus einer virtuellen Simulation in die reale Welt.

Auswirkungen auf die Industrie

In dieser Ära der „Roboter-Renaissance“ nutzt die KI häufig Ressourcen für die Lokalisierung, Identifizierung und Inspektion – allerdings fehlt es den Industrierobotern noch an fortgeschrittener Intelligenz. Die neuen Technologien wie das Verstärkungslernen, das Nachahmungslernen oder große Sprachmodelle können diesen Bereich grundlegend verändern.

Wissenschaftler haben bereits die Machbarkeit des gemeinsamen Einsatzes von Robotern und künstlicher Intelligenz unter Beweis gestellt. Dabei geht es beispielsweise um die Optimierung von Routen und Ausführungszeiten, die Erarbeitung von Strategien für den Umgang mit komplexen Szenarien und die Vereinfachung von Programmierprozessen. Angesichts des etablierten Ökosystems der Industrieroboter erwarten wir, dass die KI in naher Zukunft die Einführung vorantreiben wird.

 


 

AUTOREN DER STUDIE:

Jay Huang, Ph.D, Dien Wang, Ph.D und Weibin Liang, Ph.D, Research-Analysten bei Sanford C. Bernstein (Hong Kong) Limited, Teil der Société Générale Groupe.

 


 

Originalveröffentlichung:

Huang, Jay, Wang, Dien, Liang, Weibin. 12 June 2024. “Global Automation: The Humanoid Primer”. Bernstein Société Générale Group.

Dieser Artikel richtet sich ausschließlich an institutionelle und professionelle Anleger und ist nicht für Klein- oder Privatanleger bestimmt. Bitte besuchen Sie www.bernsteinresearch.com, um über wichtige Entwicklungen auf dem Laufenden zu bleiben.