本项目使用MATLAB实现了一种基于强化学习的贪婪算法,旨在优化内容缓存策略。通过模拟网络环境,该算法有效提高了数据访问效率和用户满意度。
在无线移动终端网络环境中,即使文件数量和设备较少,“最佳数据分配问题”也属于NP-Hard难题之一。本存储库提供的代码基于《Distributed Caching based on Decentralized Learning Automata》的工作内容。
简单来说,“缓存问题”或“文件放置问题”,意指在H个位置中找到F个对象的最佳分布方式,每个位置最多容纳C个对象。这里的最优解是指能够最小化网络延迟的成本函数分配方案。然而,对于少量的对象而言,尝试所有可能的组合和排列(即蛮力或穷举搜索方法)很快变得不可行。
解决缓存问题的方法众多,我们提出了一种基于独立玩家游戏(学习自动机)启发式策略:每个玩家采取行动,并根据其他玩家的选择来调整自己的行为,以提高自身的策略效果。由于不需要一个中央实体对所有选择进行评分,这种方法具有高度的可扩展性。
在模拟的嘈杂环境中,我们的算法能够接近贪婪策略的表现水平,在这种情况下,每位参与者都试图最小化其个人的成本函数。我们还提出了离散广义追踪算法(DGPA),这是一种有助于优化性能的方法。