[笔趣ba] biquba.vip 天才一秒记住!
? 张三:3分
但是,这些分数只是相对的,我们需要转换成“概率”来反映这个村民的最终选择倾向。Softmax 规则的做法是:
1. 先用指数函数(e的指数)放大分数,避免负分影响决策:
2. 计算这些指数值的总和:
3. 再计算每个候选人的支持度占比:
这样,每个人最终的选择概率就会落在 到 之间,并且所有候选人的概率加起来是 (保证了最终一定会选出一位村长)。
比喻解释:冰淇淋店的选择
假设你走进了一家冰淇淋店,店里有四种口味:
? 巧克力(你最爱)
? 香草(你觉得还行)
? 草莓(一般般)
? 抹茶(你不太
𝘽𝐈 Qu 𝘽𝒜.v 𝐈 𝒫