汉堡大学采用Case-base的思想研究RoboCup。其主要想法是利用定义各种典型的场景,根据当前场景和典型场景的匹配度来进行决策。可以设想,这种方法无法克服状态空间巨大的问题,而且很难跟得上环境对动态性的要求。
卡尔斯鲁厄大学以再励学习(reinforcement learning)为他们的主要研究方向。他们的梦想是能够做到仅仅告诉智能体去完成进球的任务,而智能体能够自主的通过和环境的交互,学习各种技能甚至是策略。再励学习在RoboCup中遇到的最大的两个挑战是:一、再励学习最初是以离散空间为求解空间设计的,而RoboCup环境是连续的;二、RoboCup中的再励信号延迟太长,因为只有进球是最本质的再励信号。从思维的层次上说,再励学习模仿的更多是人较为低级的智能行为,它很难表现如推理这类人类思维中较高级、较抽象的行为。关于再励学习的问题,本文第四章“脚法的实现”有所涉及。
葡萄牙的里兹本大学队是2000年RoboCup仿真组的冠军,他们的主要特点是充分利用人类足球的知识和建立准确的世界模型。由于环境具有噪声而且是部分可观的,如何充分利用得到的信息去推测当前的世界模型成了比赛的一个关键所在。

