#三系统/个人知识管理/强化模型元素
在“三系统”个人知识管理模型中,对于碳核算专业知识学习,我们用到的是“强化模型”。
在强化学习模型中,分配给一个所选备选方案的权重,是根据该备选方案在何种程度上超过了预期,就是渴望水平来进行调整的。
强化模型,既考虑了效果律,也就是会采取那些能够更经常地产生更高回报的行动,也考虑了惊奇律,也就是对某个备选方案赋予的权重取决于它所带来的奖励超过了渴望水平的程度。
为了构建一个碳核算强化学习模型的公式,我们需要将碳核算知识领域的学习过程形式化。这个模型包括以下几个关键元素:知识领域、奖励(学习效果)、权重更新。
模型元素
知识领域集合:ABCD每个字母代表一个具体的知识领域
A: 碳排放活动数据收集与处理
B: 排放因子的理解与应用
C: 碳排放计算方法
D: 碳排放报告编写
初始权重集合: 初始时每个知识领域的权重设为相同的值,都是1。
奖励(学习效果): 每次学习一个知识领域后,给予一个奖励值(评分)
π(A): 学习碳排放活动数据收集与处理后的评分
π(B): 学习排放因子的理解与应用后的评分
渴望水平: 渴望水平 A是学习者期望的平均奖励值。
调整速率):用 Y来表示,用于控制权重更新的速率。
有了这些模型元素,碳核算强化模型的公式是什么呢?明天详细阐述!
网友评论