3D到文本生成(3D to Text Gen […]
视频到文本生成(Video-to-Text […]
文本到3D生成(Text-to-3D Gen […]
具身LLM(Embodied Large L […]
多模态对话系统是一种能够同时处理和融合多种输 […]
机器人操作指令是指用于指导机器人执行特定动作 […]
跨模态检索增强是指在人工智能系统中,通过整合 […]
基于模型的强化学习(Model-based […]
模拟器中的LLM(大型语言模型)是指在计算机 […]
强化学习与大型语言模型(LLM)的结合,是指 […]