对于缓存,大家都不陌生。百度百科的定义是这样的:
缓存是指可以进行高速数据交换的存储器,它先于内存与CPU交换数据,因此速率很快。
由此可知,缓存是用来提高数据交换速度的。我们今天要讲的缓存不是CPU中的缓存,而是在应用程序中对数据库的缓存。应用程序先于数据库,从缓存中读取数据,以降低数据库的压力,提高应用程序的读取性能。
在实际项目中,相信大家也都遇到过类似的情景:数据量小,但访问又较频繁(例如国家标准行政区域数据),想将其完全存放于本地内存中。这样就可以避免直接访问mysql或redis,减少网络传输,提高访问速度。那具体应该怎么实现呢?
本文就介绍一种Go项目中经常使用到的方法:将数据从数据库中加载到本地文件,然后再将文件中的数据加载到内存中,内存中的数据直接供应用程序使用。如下图所示:
本文会忽略数据库到本地文件的过程,因为这个环节就是一个文件上传和下载到本地的过程。所以我们会重点讲解如何从本地文件加载数据到内存中这个环节。
01 目标
在Go语言的项目中,将本地文件的数据加载到应用程序的内存中,以供应用程序直接使用。
我们再将目标拆解成两个目标:
1、程序启动时,将本地文件的数据初始化到内存中,即冷启动
2、程序运行期间,本地文件有更新时,将数据更新到内存中。
02 代码实现
本文主要是目的就是给大家讲解目标的实现,所以不会带大家一步步分析,而是通过讲解已实现的代码来给大家提供一种参考实现。
所以,我们先给出我们设计的类图:
从类图中可知,有两个主要的结构体:FileDoubleBuffer和LocalFileLoader。下面我们一一讲解这两个结构体的属性和方法实现。
2.1 场景假设
我们以城市的天气状况为示例,将每个城市的实时温度和风力以json格式存储在文件中,当城市的温度或风力有变化时,再更新该文件。如下:
代码语言:javascript复制{
"beijing": {
"temperature": 23,
"wind": 3
},
"tianjin": {
"temperature": 20,
"wind": 2
},
"shanghai": {
"temperature": 20,
"wind": 20
},
"chongqing": {
"temperature": 30,
"wind": 10
}
}
2.2 main的调用
这里,先给出main函数的调用示例,根据main函数中的实现,我们一步步看图中两个主要结构体的实现,代码如下:
代码语言:javascript复制//第一步,定义装载文件中数据的结构体
type WeatherContainer struct {
Weathers map[string]*Weather //每个城市对应的实况天气
}
//文件数据中每个城市的天气状况
type Weather struct {
Temperature int //当前气温 `json:"temperature"`
Wind int //当前风力 `json:"wind"`
}
func main() {
pwd, _ := os.Getwd()
//加载的文件路径
filename := pwd "/cache/cache.json"
//初始化本地文件加载器
localFileLoader := NewLocalFileLoader(filename)
//初始化文件缓冲实例,将localFileLoader作为底层的文件缓冲
fileDoubleBuffer := NewFileDoubleBuffer(localFileLoader)
// 开始将文件中的内容加载到缓冲变量中,本质上就是通过load和reload加载文件数据
fileDoubleBuffer.StartFileBuffer()
//获取数据
weathersConfig := fileDoubleBuffer.Data().(*WeatherContainer)
fmt.Println("weathers:", weathersConfig.Weathers["beijing"])
blockCh := make(chan int)
//该通道用于阻塞进程不结束,这样reload的协程就可以执行了
<-blockCh
}
2.3 FileDoubleBuffer结构体及实现
该结构体的作用主要是面向应用程序(我们这里是main函数),供应用程序直接从内存即bufferData中获取数据的。该结构体的定义如下:
代码语言:javascript复制// main应用主要面向该结构体获取数据
type FileDoubleBuffer struct {
Loader *LocalFileLoader
bufferData []interface{}
curIndex int32
mutex sync.Mutex
}
首先看该结构体的属性:
- Loader:是一个LocalFileLoader类型(后面会定义该结构体),用于从具体的文件中加载数据到bufferData中。
- bufferData切片:接收文件中数据的变量。一方面会将文件中的数据加载到该变量中。另一方面,应用程序直接从该变量中获取想要的数据信息,而非文件或数据库。该变量的数据类型是interface{},说明可以加载任何类型的数据结构。另外,我们注意该变量是一个切片,该切片只有2个元素,两个元素具有相同的数据结构,结合curIndex属性使用。
- curIndex:该属性是指定当前bufferData正在使用哪个索引中的数据,该属性的值在0和1之间循环,用于新老数据的切换。例如,当前对外使用的是curIndex=1这个索引元素的数据,当文件中有新数据时,先将文件的数据加载到索引0这个元素中,当将文件的数据完全加载完后,再将curIndex的值指向0。这样,当文件中有新数据进行刷新内存中的数据时,不会影响应用程序对老数据的使用。
再来看FileDoubleBuffer中的函数:
Data()函数
应用程序通过该函数来获取FileDoubleBuffer中的dataBuffer数据。具体实现如下:
代码语言:javascript复制func (buffer *FileDoubleBuffer) Data() interface{} {
// bufferData实际上存储了两个相同结构的元素,用于切换新老数据
index := atomic.LoadInt32(&buffer.curIndex)
return buffer.bufferData[index]
}
load函数
该函数是用于加载文件中的数据到bufferData中。代码实现如下:
代码语言:javascript复制func (buffer *FileDoubleBuffer) load() {
buffer.mutex.Lock()
defer buffer.mutex.Unlock()
//判断当前使用的是bufferData数组哪个元素
// 因bufferData中只有两个元素,所以要么是0,要么是1
curIndex := 1 - atomic.LoadInt32(&buffer.curIndex)
err := buffer.Loader.Load(buffer.bufferData[curIndex])
if err == nil {
atomic.StoreInt32(&buffer.curIndex, curIndex)
}
}
reload函数
用于从文件中加载新的数据到bufferData中。实际上是一个for循环,每隔一定的时间执行一次load函数,代码如下:
代码语言:javascript复制func (buffer *FileDoubleBuffer) reload() {
for {
time.Sleep(time.Duration(5) * time.Second)
fmt.Println("开始加载...")
buffer.load()
}
}
StartFileBuffer函数
该函数的作用是启动数据的加载和更新,代码如下:
代码语言:javascript复制func (buffer *FileDoubleBuffer) StartFileBuffer() {
buffer.load()
go buffer.reload()
}
NewFileDoubleBuffer(loader *LocalFileLoader) *FileDoubleBuffer 函数
该函数的作用是初始化FileDoubleBuffer实例,代码如下:
代码语言:javascript复制func NewFileDoubleBuffer(loader *LocalFileLoader) *FileDoubleBuffer {
buffer := &FileDoubleBuffer{
Loader: loader,
curIndex: 0,
}
//这里分配内存空间,以便将文件中的值加载到该变量中,供应用程序使用
buffer.bufferData = append(buffer.bufferData, loader.Alloc(), loader.Alloc())
return buffer
}
2.4 LocalFileLoader结构体及实现
由于我们是将数据先从数据库加载到本地文件上,然后再将文件的数据加载到内存缓冲区中,故有了LocalFileLoader结构体。该结构体的作用是执行具体的文件数据加载和检测文件更新的任务。LocalFileLoader的定义如下:
代码语言:javascript复制type LocalFileLoader struct {
filename string //需要加载的文件,完整路径
lastModifyTime int64 //文件最近一次的修改时间
}
首先来看该结构体的属性:
- filename:指定具体的文件名,说明从该文件中加载数据
- modifyTime:最后一次加载文件的时间。如果文件的更新时间大于该时间,则说明文件有更新
再来看LocalFileLoader中的函数:
Load(filename string, i interface)函数
该函数用于将filename文件中的数据加载到变量i中。该变量i实际上是从FileDoubleBuffer中传进来的bufferData中的元素,代码如下:
代码语言:javascript复制// 这里i变量实际上是从FileDoubleBuffer结构的load方法中传入的dataBuffer中的一个元素
func (loader *LocalFileLoader) Load(i interface{}) error {
// WeatherContainer结构体是依据文件中具体存储的数据定义的,后面会讲到
weatherContainer := i.(*WeatherContainer)
fileHandler, _ := os.Open(loader.filename)
defer fileHandler.Close()
body, _ := ioutil.ReadAll(fileHandler)
_ := json.Unmarshal(body, &weatherContainer.Weathers)
// 这里我们省略了那些err的判断
return nil
}
DetectNewFile()函数
该函数用于检测filename文件是否有更新,如果文件的修改时间大于modifyTime,则FileDoubleBuffer会将新的数据加载到dataBuffer中。代码如下:
代码语言:javascript复制// 该函数检查文件是否有更新,如果有更新 则返回true,否则返回false
func (loader *LocalFileLoader) DetectNewFile() bool {
fileInfo, _ := os.Stat(loader.filename)
//文件的修改时间比上次修改时间大,说明文件有更新
if fileInfo.ModTime().Unix() > loader.lastModifyTime {
loader.lastModifyTime = fileInfo.ModTime().Unix()
return true
}
return false
}
Alloc() interface{}
用于分配具体的变量,以供装载文件中的数据。这里分配的变量最终会存储到FileDoubleBuffer中的dataBuffer数据中。代码如下:
代码语言:javascript复制// 分配具体的变量,来承载文件中的具体内容,变量结构体需要和文件中的结构体保持一致
func (loader *LocalFileLoader) Alloc() interface{} {
return &WeatherContainer{
Weathers: make(map[string]*Weather),
}
}
同样需要一个初始化LocalFileLoader实例的函数:
代码语言:javascript复制//指定需要加载的文件路径path
func NewLocalFileLoader(path string) *LocalFileLoader {
return &LocalFileLoader{
filename: path,
}
}
总结
这种方式一般适用于数据量较小、频繁读的场景。在文章开始的图中我们可以看到,因为是服务器往往是集群,所以每台机器上的文件内容可能会有短暂的差异,所以该实现也不适用于对数据具有强一致要求的场景中。