Toyota vylepšuje učenie umelej inteligencie pre oveľa šikovnejšie roboty

Autor:: Roman Mališka
Zverejnené:: 25. 9. 2023
Hodnotenie:
Už ste hlasovali.

Aby sa schopnosti súčasných robotovo rozšírili, potrebujú potrebujú spôsob, ako sa rýchlo zdokonaliť na základe ľudských pokynov alebo strojového učenia. Spoločnosť Toyota pritom tvrdí, že urobila obrovský prielom s novým vzdelávacím prístupom založeným na takzvanej politike difúzie, ktorý podľa nej otvára dvere konceptu veľkých modelov správania.

Politika difúzie je koncept, ktorý spoločnosť Toyota vyvinula v spolupráci s výskumníkmi z Columbia Engineering a MIT, a zatiaľ čo detaily sú ukryté pod rúškom tajomstva, skupina opisuje všeobecnú myšlienku ako „nový spôsob generovania správania robotov reprezentáciou vizuomotorickej kontroly ako proces podmieneného rozširovania schopností“.

V podstate tam, kde veľké jazykové modely, ako je napríklad ChatGPT, dokážu spracovať miliardy slov napísaných ľuďmi, a naučiť sa písať a kódovať na úrovni veľmi blízkej ľuďom, politika difúzie umožňuje robotickým systémom umelých inteligencií sledovať, ako človek vykonáva danú fyzickú úlohu v reálnom svete, a potom sa v podstate naprogramujte, aby túto úlohu vykonala flexibilným spôsobom.

Zatiaľ čo niektorí vývojári učia svoje roboty prostredníctvom teleprezencie vo virtuálnej realite, čiže ľudský operátor vidí presne to, čo môžu vidieť oči robota a môže ovládať ruky a ramená robota na splnenie úlohy, prístup spoločnosti Toyota sa viac zameriava na haptiku. Operátori teda nenosia náhlavnú súpravu VR, ale prostredníctvom ručných ovládačov dostávajú hmatovú spätnú väzbu z mäkkých, flexibilných uchopovačov robota. To im v určitom zmysle umožňuje cítiť, čo cíti robot, keď jeho manipulátory prichádzajú do kontaktu s predmetmi.

Vzorka z viac ako 60 úloh, ktoré tím naučil roboty pomocou rýchleho nového vzdelávacieho systému.

Keď ľudský operátor ukáže robotom, ako urobiť úlohu niekoľkokrát za sebou, za mierne odlišných podmienok, umelá inteligencia robota si vytvorí svoj vlastný vnútorný model toho, ako vyzerá úspech a neúspech, a potom spustí tisíce a tisíce simulácií založených na jej interných modeloch úlohy, aby sa postup začlenil do súboru techník na vykonanie danej úlohy.

„Proces začína tým, že učiteľ demonštruje malý súbor zručností prostredníctvom teleoperácie,“ hovorí Ben Burchfiel, manažér obratnej manipulácie. „Naša politika difúzie založená na umelej inteligencii sa potom učí na pozadí v priebehu niekoľkých hodín. Je bežné, že robota naučíme popoludní, necháme ho, aby sa učil cez noc, a potom na druhý deň ráno príde s novým fungujúcim správaním“.

Tím použil tento prístup na rýchle zaškolenie robotov na viac ako 60 malých, väčšinou kuchynských úloh, z ktorých každá je relatívne jednoduchá pre priemerného dospelého človeka, ale každá vyžaduje, aby roboti sami prišli na to, ako uchopiť, držať a manipulovať s rôznymi typmi predmetov pomocou rôznych nástrojov.

Mäkké uchopovače s haptickou odozvou dávajú umelej inteligencii kriticky dôležitý pocit fyzického dotyku.

Ide napríklad o použitie noža na rovnomerné nanesenie nátierky na krajec chleba, alebo použitie špachtle na prevrátenie placky alebo použitie škrabky na zemiaky na ošúpanie zemiakov. Systém sa dokonca naučil vyvaľkať cesto na pizzový základ, potom naň naniesť omáčku a rozotrieť ju lyžičkou.

Spoločnosť Toyota tvrdí, že do konca roka bude mať pod kontrolou stovky úloh a do konca roka 2024 sa zameria na viac ako 1 000 úloh. Preto vyvíja to, o čom verí, že bude prvým modelom veľkého správania (Large Behavior Model - LBM). Je to štruktúra, ktorá sa nakoniec rozšíri, aby sa stala niečím ako stelesnený robotický ekvivalent chatbota ChatGPT. To znamená, že ide o úplne vygenerovaný model toho, ako môže robot interagovať s fyzickým svetom, aby dosiahol určité výsledky.

Tím efektívne zavádza postup, pomocou ktorého budú budúci majitelia a operátori robotov vo všetkých druhoch situácií schopní rýchlo naučiť svoje roboty novým úlohám podľa potreby a priebežne vylepšovať celé flotily robotov o nové zručnosti.

Nový vzdelávací systém zvláda celý rad zložitých obojručných úloh s nástrojmi, ako je tento šľahač vajec.

„Úlohy, ktoré tieto roboty vykonávajú, sú jednoducho úžasné. Ani pred rokom by som nepredpovedal, že sme blízko k tejto úrovni rôznorodej zručnosti,“ hovorí Russ Tedrake, viceprezident pre výskum robotiky vo Výskumnom inštitúte Toyota. „To, čo je na tomto novom prístupe také vzrušujúce, je rýchlosť a spoľahlivosť, s ktorými môžeme pridávať nové zručnosti. Pretože tieto zručnosti fungujú priamo z obrázkov kamery a hmatového snímania, využívajúc iba naučené reprezentácie, dokážu dobre fungovať aj pri úlohách, ktoré zahŕňajú deformovateľné predmety, látky a tekutiny. To všetko bolo pre roboty tradične mimoriadne náročné“.

Je pravdepodobné, že model LBM, ktorý spoločnosť Toyota v súčasnosti konštruuje, bude vyžadovať roboty rovnakého typu, aké používa teraz – jednotky vyrobené na mieru, navrhnuté pre „zručné manipulačné úlohy s dvoma ramenami so špeciálnym zameraním na umožnenie hmatovej spätnej väzby a hmatového snímania“.

Nový prístup k umelej intleligencii vo fyzickom svete výrazne zrýchľuje schopnosť robotov získavať a zdokonaľovať nové zručnosti.