Bygg känsliga känslomässiga interaktioner utifrån den stora AI-modellen som kan uppfattas av konsumenterna
Genom peksensorer, mikrofoner, kameror och infraröda sensorer som täcker huvudet och tillbaka kan den uppfatta den omgivande miljön och interagera med den omgivande miljön.
Sammanslagning av röstinmatning och visuell input (med fokus på statiska ramar), med hjälp av en "text-bild multimodal
stor modell" för att mata ut konversationer
Infraröda detekteringssensorer och mikrofoner känner av biologiska aktiviteter och interagerar aktivt med
användare
Multimodala känslomässiga uttryck genom kropps- och handstegmotorer, LCD-skärm (ögon) och högtalare
Skrivbord, sängbord, kram
Relativt fast läge, svaga mobilitetskrav, långvarig anslutning till laddaren
| ASR + LLM Visuell bildförståelse Tryck på händelser Infraröd timer Dialogminne Teckeninställningar |
| Nätverksansluten molnbaserad storskalig modellplattform (Multimodal perception, stor språkmodell, konversationsminne, nätverksfråga) |
| Multimodalt perception och kontrollsystemlager | |||
| ScenförståelseTriggerkontroll | Ljusstyrning | Motorstyrning | Displaykontroll |
| Hårdvaruinbäddningslager (robotkropp) | ||||
Scen
förstå triggerkontroll |
Belysning
Kontroll |
Fullt batteri |
Display
Kontroll |
Display
Kontroll |
| Anordning | Specifikationer/funktioner |
| Mikrofon | Stöder fjärrstyrd röstigenkänning (5-meters räckvidd) och riktad ljudupptagning för mottagning röstkommandon. |
| Kamera | Används för miljö- och objektigenkänning. |
| Infraröd sensor | Används för lågeffekts väckning utlöst av människokropp/husdjur. |
| Stegmotor | Distribuerade beröringsmoduler (huvud, rygg, mage) används för att upptäcka stryk och klappning (t.ex. "röra vid huvudet" och "kitla"). |
| Tyngdkraftssensor | Känna av kroppens rörelsetillstånd och utlösa en "nödsignal" (som ett röstmeddelande "Jag föll och det gör ont") när produkten faller. |
| Anordning | Specifikationer/funktioner |
| LCD uttrycksskärm | 4,28-tums LCD-skärm (ögon), stöder dynamisk uttrycksvisning och kikarevisning (som t.ex. visuell feedback när du "spelar död" eller "agerar sött"). |
| Högtalare | Mono/4Ω, 5W fullomfångshögtalare (som röstutgång när man "sjunger en sång" eller "berättar ett skämt"). |
| Fullfärgade LED-ljusremsor | Färgade ljusremsor som spelar relevanta "emotional state" ljuseffekter eller kan användas som indikatorlampor. |
| Anordning | Specifikationer/funktioner |
| Stegmotor | Dubbla motorer för att vifta och vrida på huvudet (midja) |
| Anordning | Specifikationer/funktioner |
| Huvudkontrollchip | V821: grundläggande funktionskontroll, röstbearbetning, binokulär asynkron display |
| Wi-Fi / Bluetooth | 2,4G Wi-Fi + Bluetooth |
| Förvaringsenhet | NAND FLASH 256 MB, 64 MB DRAM |
| Anordning | Specifikationer/funktioner |
| Litiumbatteri | 3000mAh kapacitet/7,2v, stöder snabbladdning, 2 timmars batteritid och 2 dagars omfattande standby; utrustad med ett kraftdetekteringschip. |
| Avgift | USB typ-C |
| Känslomässiga uttryck: | Olika stilar av kläder och accessoarer kan ändras |
| arg | himlar med ögonen | svag | agera coolt |
| entusiasm | ledsen | besvärlig | blyg |
| skrattar högt | leende | hjärta ögon | standby |
| sova | söt | kränkt | Sun Wukong |
| daze | nyfiken | tvärögon | ont |