模板汇总(更新中...) 这里收录的模板因为是自用的,所以基本只有代码,没有多少代码解释,敬请谅解。 1.IO流加速:链接 2.数据结构并查集:链接 树状数组:链接 线段树:链接 主席树:链接 3.图论传递闭包:链接 二分图匹配:链接 网络流:链接 最短路算法:链接 树链剖分:链接 4.数论逆元:链接 各种筛的模板:链接 5.字符串字符串哈希:链接 KMP算法:链接 字典树:链接 马拉车算法:链接 6.哈希重构unorde 2100-08-16 #模板 #formwork
强化学习入门-5(MAPPO) 多智能体强化学习项目-5-simple_spread-v3(MAPPO)环境本环境是 PettingZoo 库中 MPE (Multi-Agent Particle Environments) 系列的一个经典多智能体协作环境。 官网链接:https://pettingzoo.farama.org/environments/mpe/simple_spread/ 任务描述:这是一个 完全合作(Coop 2025-12-09 #AI #reinforcement learning #Multi-Agent
强化学习入门-4(PPO) 强化学习项目-4-LunarLander-v3(PPO)环境本环境是OpenAI Gym提供的一个经典控制环境。 官网链接:https://gymnasium.farama.org/environments/box2d/lunar_lander/ 操作: 0:什么都不做 1:左侧推进器:推动着陆器向右移动 2:右侧推进器:推动着陆器向左移动 3:主引擎:推动着陆器向上移动 对应状态向量$$s = 2025-10-25 #AI #reinforcement learning
强化学习入门-3(AC) 强化学习项目-3-CartPole-v1(AC)环境本环境是OpenAI Gym提供的一个经典控制环境。 官网链接:https://gymnasium.farama.org/environments/classic_control/cart_pole/ 观测空间(状态S)状态共包含$4$个参数: 车位置(Cart Position) 车速(Cart Velocity) 杆子的角度(Pole An 2025-10-16 #AI #reinforcement learning
强化学习入门-2(Dueling DQN) 强化学习项目-2-LunarLander-v3(Dueling DQN)环境本环境是OpenAI Gym提供的一个经典控制环境。 官网链接:https://gymnasium.farama.org/environments/box2d/lunar_lander/ 操作: 0:什么都不做 1:左侧推进器:推动着陆器向右移动 2:右侧推进器:推动着陆器向左移动 3:主引擎:推动着陆器向上移动 对应状 2025-10-11 #AI #reinforcement learning
强化学习入门-1(DDQN) 强化学习项目-1-CartPole-v1(DDQN)环境本环境是OpenAI Gym提供的一个经典控制环境。 官网链接:https://gymnasium.farama.org/environments/classic_control/cart_pole/ 观测空间(状态S)状态共包含$4$个参数: 车位置(Cart Position) 车速(Cart Velocity) 杆子的角度(Pole 2025-10-05 #AI #reinforcement learning
Hdu3038 How Mang Answers Wrong 题目链接: 点击跳转 题意:题目会先输入n,m,分别表示有n个节点,m个回答,每个回答会告诉你节点l到节点r之间权值的总和(包含l,r),当然,回答不一定是对的,需要我们根据输入顺序判断是否有错即可。 思路:使用sum数组记录子节点到父节点的总和(l需要减一,因为l的权值也是包含在内的),构建带权并查集,合并时注意因为两根节点合并会出现一条反边,即sum[find(l)] = - sum[a] + 2025-08-31 #forwork #模板
无监督学习,推荐系统以及强化学习 无监督学习,推荐系统以及强化学习无监督学习聚类K-means算法 随机猜测簇质心点位置 遍历所有的点,检查这些点距离哪个质心更近,并将点分配给最近的簇质心 分配好后,依次查看每个簇覆盖的点,并对这些点取平均值,并将簇质心移动到平均值的位置 再次查看所有点,检查这些点是否更接近另外的簇质心,而不是当前分配的簇质心,并重新将这些点分配给最近的簇质心 再次重新取均值移动簇质心 重复执行前两步直到簇质心不 2025-07-25 #AI #unsupervised learning #recommender system #reinforcement learning
深度学习 深度学习神经网络神经元一个接收若干信息,并产生若干结果的一个基本单位。 神经网络定义神经网络由若干层构成,每层可以包含若干节点,同时从上一层接收信息,并将结果传输给下一层 全连接神经网络对于朴素的神经网络,需要去考虑每一层怎么设计,每个神经元需要哪些信息,并产生什么样的结果,这样子从网络搭建上来说是很困难的。 因此,可以不用限制神经元接收的数据,让每一层的神经元均连接上一层的所有神经元(或输入层节 2025-07-08 #AI #deep learning
机器学习 机器学习监督学习核心特点带标签的训练集,主要训练特征与标签之间的对应关系 典型任务: 分类(Classification):预测类别标签(如垃圾邮件识别、图像分类) 回归(Regression):预测连续数值(如房价预测、温度预测) 非监督学习核心特点使用无标签的数据训练模型,模型需要自主发现数据中的规律 典型任务 聚类(Clustering):将相似数据分组(如用户分群、异常检测); 降 2025-06-25 #AI #machine learning