当前位置：首页 > 软件库 > 程序开发 > 缓存系统 >

ecache

轻量级本地内存缓存

授权协议 MIT

开发语言 Google Go

所属分类程序开发、缓存系统

软件类型开源软件

地区国产

投递者焦苏燕

操作系统跨平台

开源组织无

适用人群未知

软件概览

ecache 是一款极简设计、高性能、并发安全、支持分布式一致性的内存缓存。

特性

代码量<300行、30s完成接入
高性能、极简设计、并发安全
支持LRU 和 LRU-2两种模式
额外小组件支持分布式一致性

基准性能

如何使用

下载包（预计5秒）

非go modules模式：
sh> go get -u github.com/orca-zhang/ecache

go modules模式：
sh> go mod tidy && go mod download

引入包（预计5秒）

import (
    "time"

    "github.com/orca-zhang/ecache"
)

定义实例（预计5秒）

可以放置在任意位置（全局也可以），建议就近定义

var c = ecache.NewLRUCache(16, 200, 10 * time.Second)

设置缓存（预计5秒）

c.Put("uid1", o) // o可以是任意变量，一般是对象指针，存放固定的信息，比如*UserInfo

查询缓存（预计5秒）

if v, ok := c.Get("uid1"); ok {
    return v.(*UserInfo) // 不用类型断言，咱们自己控制类型
}
// 如果内存缓存没有查询到，下面再回源查redis/db

删除缓存（预计5秒）

在信息发生变化的地方

c.Del("uid1")

运行吧

�� 完美搞定 �� 性能直接提升X倍！
sh> go run <你的main.go文件>

参数说明

NewLRUCache
- 第一个参数是桶的个数，用来分散锁的粒度，每个桶都会使用独立的锁
  - 不用担心，随意设置一个就好，ecache会找一个等于或者略大于输入大小的2的幂次的数字，后面便于掩码计算
- 第二个参数是每个桶所能容纳的item个数上限
  - 意味着ecache全部写满的情况下，应该有第一个参数✖️第二个参数个item
- 第三个参数是每个item的过期时间
  - ecache使用内部定时器提升性能，默认100ms精度，每秒校准

最佳实践

复杂对象优先存放指针（注意⚠️一旦放进去不要再修改其字段，即使再拿出来也是，item有可能被其他人同时访问）
- 如果需要修改，解决方案：取出字段每个单独赋值，或者用copier做一次深拷贝后在副本上修改
也可以存放对象（相对于上一个性能差一些，因为拿出去有拷贝）
缓存的对象尽可能越往业务上层越大越好（节省内存拼装和组织时间）
如果不想因为类似遍历的请求把热数据刷掉，可以改用LRU-2模式，虽然可能有很少的损耗（�� 什么是LRU-2）
一个实例可以存储多种类型的对象，试试key格式化的时候加上前缀，用冒号分割
并发访问量大的场景，试试256、1024个桶，甚至更多

特别场景

LRU-2模式

�� 什么是LRU-2

直接在NewLRUCache()后面跟.LRU2(<num>)就好，参数<num>代表LRU-2热队列的item上限个数（每个桶）

var c = ecache.NewLRUCache(16, 200, 10 * time.Second).LRU2(1024)

空缓存哨兵（不存在的对象不用再回源）

// 设置的时候直接给`nil`就好
c.Put("uid1", nil)

// 读取的时候，也和正常差不多
if v, ok := c.Get("uid1"); ok {
  if v == nil { // 注意⚠️这里需要判断是不是空缓存哨兵
    return nil  // 是空缓存哨兵，那就返回没有信息或者也可以让`uid1`不出现在待回源列表里
  }
  return v.(*UserInfo)
}
// 如果内存缓存没有查询到，下面再回源查redis/db

需要修改部分数据，且用对象指针方式存储时

比如，我们从ecache中获取了*UserInfo类型的用户信息缓存v，需要修改其状态字段

import (
    "github.com/jinzhu/copier"
)

o := &UserInfo{}
copier.Copy(o, v) // 从v复制到o
o.Status = 1      // 修改副本的数据

统计缓存使用情况

实现超级简单，注入inspector后，每个操作只多了一次原子操作，具体看代码

引入stats包

import (
    "github.com/orca-zhang/ecache/stats"
)

绑定缓存实例（名称为自定义的池子名称，内部会按名称聚合）

var _ = stats.Bind("user", c)
var _ = stats.Bind("user", c, c1, c2)
var _ = stats.Bind("room", caches...)

打印统计信息

stats.Stats().Range(func(k, v interface{}) bool {
    fmt.Printf("stats: %s %+v\n", k, v)
    return true
})

分布式一致性组件

�� 原理说明

引入dist包

import (
    "github.com/orca-zhang/ecache/dist"
)

绑定缓存实例

名称为自定义的池子名称，内部会按名称聚合
注意⚠️绑定可以放在全局，不依赖初始化

var _ = dist.Bind("user", c)
var _ = dist.Bind("user", c, c1, c2)
var _ = dist.Bind("token", caches...)

绑定redis client

目前支持redigo和goredis，其他库可以自行实现dist.RedisCli接口，或者提issue给我

go-redis v7及以下版本

import (
    "github.com/orca-zhang/ecache/dist/goredis/v7"
)

dist.Init(goredis.Take(redisCli)) // redisCli是*redis.RedisClient类型
dist.Init(goredis.Take(redisCli, 100000)) // 第二个参数是channel缓冲区大小，不传默认100

go-redis v8及以上版本

import (
    "github.com/orca-zhang/ecache/dist/goredis"
)

dist.Init(goredis.Take(redisCli)) // redisCli是*redis.RedisClient类型
dist.Init(goredis.Take(redisCli, 100000)) // 第二个参数是channel缓冲区大小，不传默认100

redigo

注意⚠️github.com/gomodule/redigo 要求最低版本 go 1.14

import (
    "github.com/orca-zhang/ecache/dist/redigo"
)

dist.Init(redigo.Take(pool)) // pool是*redis.Pool类型

主动通知所有节点、所有实例删除（包括本机）

当db的数据发生变化或者删除时调用
发生错误时会降级成只处理本机所有实例（比如未初始化或者网络错误）

dist.OnDel("user", "uid1")

不希望你白来

客官，既然来了，学点东西再走吧！
我想尽力让你明白ecache做了啥，以及为什么要这么做

什么是本地内存缓存

L1 缓存引用 .................... 0.5 ns
分支错误预测 ...................... 5 ns
L2 缓存引用 ...................... 7 ns
互斥锁/解锁 ...................... 25 ns
主存储器引用 .................... 100 ns
使用 Zippy 压缩 1K 字节 ........3,000 ns =   3 µs
通过 1 Gbps 网络发送 2K 字节... 20,000 ns =  20 µs
从内存中顺序读取 1 MB ........ 250,000 ns = 250 µs
同一数据中心内的往返........... 500,000 ns = 0.5 ms
发送数据包 加州<->荷兰 .... 150,000,000 ns = 150 ms

从上表可以看出，内存访问和网络访问(同数据中心)差不多是一千到一万倍的差距！
曾经遇到不止一个工程师：“缓存？上redis”，但我想说，redis不是万金油，某些程度上讲，用它还是噩梦（当然我说的是缓存一致性问题...��）
因为内存操作非常快，相对于redis/db你基本可以忽略不计，比如现在有一个查询接口，我们把结果缓存1秒，也就是1秒内不会请求redis/db，如果接口的QPS是1000，那回源次数降低到了1/1000（理想情况），意味着访问redis/db部分的性能提升了1000倍，听上去是不是很棒？
继续看，你会爱上她的！（当然也可能是他，亦或者是牠，ahaha）

使用场景，解决什么问题

高并发大流量场景
- 缓存热点数据（比如人气比较高的直播间）
- 突发QPS削峰（比如信息流中突发新闻）
节省成本
- 单机场景（不部署redis、memcache也能快速提升QPS上限）
- redis和db实例降配（能拦截大部分请求）
不怎么会变化的数据（写少读多）
- 比如配置等（这类数据使用地方多，会有放大效应，很多时候可能会因为这些配置热key对redis实例的规格误判，需要单独为它们升配）
可以容忍短暂不一致的数据
- 信息查询（用户头像、昵称、商品库存(实际下单会在db再次检查)等）
- 配置延迟生效（过期时间10秒，那最多10秒生效）

设计思路

ecache是lrucache库的升级版本

最下层是用原生map和存双链表的node实现的最基础LRU（最久未访问）
- PS：我实现的其他版本（go / C++ / js）在leetcode都是超越100%的解法
第2层包了分桶策略、并发控制、过期控制（会自动适配等于或者略大于输入大小的2的幂次个桶，便于掩码计算）
第2.5层用很简单的方式实现了LRU-2能力，代码不超过20行，直接看源码（搜关键词LRU-2）

什么是LRU

最久未访问的优先驱逐
每次被访问，item会被刷新到队列的最前面
队列满后再次写入新item，优先驱逐队列最后面、也就是最久未访问的item

什么是LRU-2

LRU-K是少于K次访问的用单独的LRU队列存放，超过K次的另外存放
主要优化的场景是比如一些遍历类型的查询，批量刷缓存以后，很容易把一些本来较热的item给驱逐掉
为了实现简单，我们这里实现的是LRU-2，也就是第2次访问就放到热队列里，并不记录访问次数
主要优化的是热key的缓存命中率

分布式一致性组件原理

其实简单的利用了redis的pubsub功能
主动告知被缓存的信息有更新，广播到其他所有节点
某种意义上说，它只是缩小不一致时间窗口的一个方式（有网络延迟且不保证一定完成）
需要注意⚠️：
- 尽量减少使用，适合用在写少读多WORM(Write-Once-Read-Many)的场景
  - redis性能毕竟不如内存，而且有广播类通信（写放大）
- 以下场景会降级（时间窗口变大），但至少会保证当前节点的强一致性
  - redis不可用、网络错误
  - 消费goroutine panic
  - 存在未生效节点（灰度canary发布，或者发布过程中）的情况下，比如
    - 已使用ecache但首次添加此插件
    - 新加入缓存的数据或者新加的删除操作

关于性能

释放锁不用defer（单接口性能差20倍，看到有宣称高性能还用defer的，直接pass吧）
不用异步清理（没意义，分散到写时驱逐更合理，不易抖动）
没有用内存容量来控制（单个item的大小一般都有预估大小，简单控制个数即可）
分桶策略，自动选择2的幂次个桶（分散锁竞争，2的幂次掩码操作更快）
key用string类型（可扩展性强；语言内建支持引用，更省内存）
不用虚表头（虽然绕脑一些，但是有20%左右提升）
选择LRU-2实现LRU-K（实现简单，近乎没有额外损耗）
没用整块内存（写满后复用以前的内存效果也很好，整块方式尝试过提升不大、但可读性大大降低）
可以直接存指针（不用序列化，如果使用[]byte那优势大大降低）
使用内部定时器计时（默认100ms精度，每秒校准，剖析发现time.Now()产生临时对象导致GC耗时增加）

失败的优化尝试

key由string改为reflect.StringHeader，结果：负优化
node预分配连续空间，通过游标和freelist决定新申请（是否满）还是复用，结果：不明显
互斥锁改为读写锁，Get请求也会修改数据，访问违例，即使不改数据，结果：读写混合场景负优化
time.Timer实现内部定时器，结果：触发不稳定，后直接用Sleep实现定时器
分布式一致性组件挂inspector自动同步更新和删除，结果：性能影响较大且需要特殊处理循环调用问题

关于GC优化

就像我在C++版性能剖析器里提到的性能优化的几个层次，单从一个层次考虑性能并不高明
《第三层次》里有一句“没有比不存在的东西性能更快的了”（类似奥卡姆剃刀），能砍掉一定不要想着优化
比如为了减少GC大块分配内存，却提供[]byte的值存储，意味着必须序列化、拷贝（虽不在库的性能指标里，人家用还是要算，包括：GC、内存、CPU）
如果序列化的部分可以复用用在协议层拼接，能做到ZeroCopy，那也无可厚非，而ecache存储指针直接省了额外的部分
我想表达的并不是GC优化不重要，而更多应该结合场景，使用者额外损耗也需要考虑，而非宣称gc-free，结果用起来并非那样
我所崇尚的“暴力美学”是极简，缺陷率和代码量成正比，复杂的东西早晚会被淘汰，KISS才是王道
ecache一共只有不到300行，千行bug率一定的情况下，它的bug不会多

常见问题

问：一个实例可以存储多种对象吗？

答：可以呀，比如加前缀格式化key就可以了（像用redis那样冒号分割），注意⚠️别搞错类型。

问：如何给不同item设置不同过期时间？

答：用多个缓存实例。（��没想到吧）

问：如果有热热热热key问题怎么解决？

答：本身【本地内存缓存】就是用来抗热key的，这里可以理解成是非常非常热的key（单节点几十万QPS），它们最大的问题是对单一bucket锁定次数过多，影响在同一个bucket的其他数据。那么可以这样：一是改用LRU-2不让类似遍历的请求把热数据刷掉，二是除了增加bucket，可以用多实例（同时写入相同的item）+读随机访问某一个的方式，让热key有多个副本，不过删除（反写）的时候要注意多实例全部删除，适用于“写少读多WORM(Write-Once-Read-Many)”的场景，或者“写多读多”的场景可以把有变化的diff部分单独摘出来转化为“写少读多WORM(Write-Once-Read-Many)”的场景。

问：为什么不用虚表头方式处理双链表？太弱了吧！

答：2019-04-22泄漏的【lrucache】被人在V站上扒出来喷过，还真不是不会，现在的写法，虽然比pointer-to-pointer方式读起来绕脑，但是有20%左右的提升哈！（��没想到吧）

问：为什么不提供int类型的key的接口？

答：考虑过，但是为了分布式一致性处理的简单，只提供string的接口看着也不错，用fmt.Sprint(i)也不麻烦。

使用案例

ecache详细用法配置

ecache缓存机制，web项目启动时自动加载相应字典，配置文档等内容，提供性能。主要功能：初始化缓存，或者响应缓存内容，获取缓存列表，清除缓存等功能。集成springMVC，具体配置及后台代码实现，请点击下面连接，下载使用：本人已经实践过，没问题。 ecache配置使用说明文档
shiro中ecache-core版本引起的异常

ecache-core包版本不对引起的错误，将2.5.3换成2.4.5就好了来源 WARN [RMI TCP Connection(3)-127.0.0.1] - Exception encountered during context initialization - cancelling refresh attempt org.springframework.beans.fact
Spring + ecache

applicationxml  <cache:annotation-driven cache-manager="ehcacheManager"/> <bean id="ehcacheManagerFactory" class="org.springframework.cache.ehcache.EhCacheManagerFactoryBean"> <proper
ecache和redis缓存

最近在写自己框架的时候研究了下ecache缓存技术，我在纠结使用ecache还是使用redis呢，因为redis是基于内存的缓存技术，当然他们的应用场景不同。我更加倾向于redis，所以，自己写了基于spring aop的redis注解，本来想用ecache的注解方式实现redis注解，发现工作量庞大，所以，就实现了一个最初版：注解 package com.nise.common.framewo
Java Ecache缓存工具类源码下载

Java Ecache缓存工具类源代码复制到编译器,调用即可： public class EcacheUtil { public static CacheManager manager = CacheManager.getInstance();//找到ehcache.xml的路径 public static Cache cache = manager.getCache("cache");//cac
Springboot2.x集成ecache3.8.1使用@Cacheable缓存（代码方式，无xml）

前言 EhCache 是一个纯Java的进程内缓存框架，具有快速、精干等特点，是Hibernate中默认的CacheProvider。具体详情参考官网：ehcache官网 Ehcache2和Ehcache3之间的差异比较大，最大差异在：Ehcache2包名为：net.sf.ehcache，而Ehcache3包名为：org.ehcache。Ehcache有xml配置和代码配置两种方式，本文只讲代码
缓存ecache使用

1、配置ecache.xml文件内容如下：注释：<diskStore path="java.io.tmpdir"/>代表默认临时文件路径 user.home 代表用户主目录 user.dir 代表当前工作目录 <?xml version="1.0" encoding="UTF-8"?> <ehcache name="es"> <diskStore path="java.

ecache

特性

基准性能

如何使用

下载包（预计5秒）

引入包（预计5秒）

定义实例（预计5秒）

设置缓存（预计5秒）

查询缓存（预计5秒）

删除缓存（预计5秒）

运行吧

参数说明

最佳实践

特别场景

LRU-2模式

空缓存哨兵（不存在的对象不用再回源）

需要修改部分数据，且用对象指针方式存储时

统计缓存使用情况

绑定缓存实例（名称为自定义的池子名称，内部会按名称聚合）

打印统计信息

分布式一致性组件

引入dist包

绑定缓存实例

绑定redis client

go-redis v7及以下版本

go-redis v8及以上版本

redigo

主动通知所有节点、所有实例删除（包括本机）

不希望你白来

什么是本地内存缓存

使用场景，解决什么问题

设计思路

什么是LRU

什么是LRU-2

分布式一致性组件原理

关于性能

失败的优化尝试

关于GC优化

常见问题

同类工具

相关阅读

相关文章

相关问答

相关文档