摘要
这份报纸论述OCPA(发生作用之人或物调节概率的自动机)仿生的自治学习系统基于为解决一个二车轮的灵活机器人的平衡控制问题的Skinners发生作用之人或物调节理论。学习系统的OCPA由二个阶段组成:在第一个阶段,一个发生作用之人或物行动从一套发生作用之人或物行动随机地被选择然后用作控制系统的输入;在第二个阶段,学习系统收集系统的取向信息并且为优化使用它直到完成控制目标。同时,发生作用之人或物行动集合的尺寸能自动地为避免小概率事件在学习过程期间被减少。理论分析为在纸学习系统的设计OCPA被做,它理论上证明在学习系统的OCPA学习机制的发生作用之人或物调节的集中,也就是,发生作用之人或物行动熵将与学习进程收敛到最小。然后OCPA学习系统被用于姿势二车轮的灵活自我平衡的机器人的平衡控制。机器人不把posutre平衡处于起始的状态和在发生作用之人或物集合的每发生作用之人或物的选择概率的技巧是相等的。与学习继续,最佳的发生作用之人或物的选择可能性逐渐地逐渐地趋于到一个和发生作用之人或物行动熵趋于到最小,并且机器人逐渐地因此学习了姿势平衡技巧。
出版日期
2011年04月14日(中国期刊网平台首次上网日期,不代表论文的发表时间)