第1章 Memcached 的基础

优质

小牛编辑

131浏览

2023-12-01

1.1 Memcached 是什么？

memcached 是以 LiveJournal 旗下 Danga Interactive公司的Brad Fitzpatric为首开发的一款软件。现在已成为 mixi、hatena、Facebook、Vox、LiveJournal 等众多服务中提高 Web 应用扩展性的重要因素。

许多 Web 应用都将数据保存到 RDBMS 中，应用服务器从中读取数据并在浏览器中显示。但随着数据量的增大、访问的集中，就会出现 RDBMS 的负担加重、数据库响应恶化、网站显示延迟等重大影响。

这时就该 Memcached 大显身手了。Memcached 是高性能的分布式内存缓存服务器。一般的使用目的是，通过缓存数据库查询结果，减少数据库访问次数，以提高动态 Web 应用的速度、提高可扩展性。

图 1.1：一般情况下 Memcached 的用途

1.2 Memcached 的特征

memcached 作为高速运行的分布式缓存服务器，具有以下的特点。

协议简单
基于libevent的事件处理
内置内存存储方式
memcached 不互相通信的分布式

协议简单

Memcached 的服务器客户端通信并不使用复杂的 XML 等格式，而使用简单的基于文本行的协议。因此通过 telnet 也能在 Memcached 上保存数据、取得数据。下面是例子。

telnet localhost 11211
Trying 127.0.0.1...
Connected to localhost.localdomain (127.0.0.1).
Escape character is '^]'.
set foo 0 0 3 （保存命令）
bar （数据）
STORED （结果）
get foo （取得命令）
VALUE foo 0 3 （数据）
bar （数据）

协议文档位于 Memcached 的源代码内，也可以参考以下的 URL。

http://code.sixapart.com/svn/memcached/trunk/server/doc/protocol.txt

基于 libevent 的事件处理

libevent 是个程序库，它将 Linux 的 epoll、BSD 类操作系统的 kqueue 等事件处理功能封装成统一的接口。即使对服务器的连接数增加，也能发挥的性能。Memcached 使用这个 libevent 库，因此能在 Linux、BSD、Solaris 等操作系统上发挥其高性能。关于事件处理这里就不再详细介绍，可以参考 Dan Kegel 的 The C10K Problem。

libevent：http://www.monkey.org/~provos/libevent/
The C10K Problem：http://www.kegel.com/c10k.html

内置内存存储方式

为了提高性能，Memcached 中保存的数据都存储在 Memcached 内置的内存存储空间中。由于数据仅存在于内存中，因此重启 Memcached、重启操作系统会导致全部数据消失。另外内容容量达到指定值之后，就基于 LRU（Least Recently Used）算法自动删除不使用的缓存。Memcached 本身是为缓存而设计的服务器，因此并没有过多考虑数据的永久性问题。关于内存存储的详细信息，请参考本文的第2章以后前坂介绍的内容。

Memcached 不互相通信的分布式

Memcached 尽管是 分布式 缓存服务器，但服务器端并没有分布式功能。各个 Memcached 不会互相通信以共享信息。那么怎样进行分布式呢？这完全取决于客户端的实现。本文也将介绍 Memcached 的分布式。

图 1.2：Memcached 的分布式

接下来简单介绍一下 Memcached 的使用方法。

1.3 安装 Memcached

Memcached 的安装比较简单，这里稍加说明，Memcached 支持许多平台。

Linux
FreeBSD
Solaris （memcached 1.2.5 以上版本）
Mac OS X

另外也能安装在 Windows 上。这里使用 Fedora Core 8 进行说明。

Memcached 的安装

运行 Memcached 需要本文开头介绍的 libevent 库。Fedora 8 中有现成的 rpm 包，通过 yum 命令安装即可。

sudo yum install libevent libeventdevel

Memcached 的源代码可以从 Memcached 网站上下载。本文执笔时的最新版本为 1.2.5。Fedora 8 虽然也包含了 Memcached 的 rpm，但版本比较老。因为源代码安装并不困难，这里就不使用 rpm 安装了。

下载 Memcached，下载地址在这里 http://www.danga.com/memcached/download.bml ，Memcached 安装与一般应用程序相同，configure、make、make install 就行了。

$ wget http://www.danga.com/memcached/dist/memcached1.2.5.tar.gz
$ tar zxf memcached1.2.5.tar.gz
$ cd memcached1.2.5
$ ./configure
$ make
$ sudo make install

默认情况下 Memcached 安装到 /usr/local/bin 下。

Memcached 的启动从终端输入以下命令，启动 Memcached。

$ /usr/local/bin/memcached p 11211 m 64m vv

slab class	1: chunk size
slab class	2: chunk size	112 perslab	9362
slab class	3: chunk size	144 perslab	7281
中间省略
slab class	38: chunk size 391224 perslab			2
slab class	39: chunk size 489032 perslab			2

<23 server listening
<24 send buffer was 110592, now 268435456
<24 server listening (udp)
<24 server listening (udp)
<24 server listening (udp)
<24 server listening (udp)

这里显示了调试信息。这样就在前台启动了 Memcached，监听 TCP 端口 11211 最大内存使用量为 64M。调试信息的内容大部分是关于存储的信息，下一章将具体说明。

作为 daemon 后台启动时，只需运行下面的命名

$ /usr/local/bin/memcached p 11211 m 64m d

这里使用的 Memcached 启动选项的内容如下。

选项	说明
p	使用的TCP端口。默认为11211
m	最大内存大小。默认为64M
vv	用very vrebose模式启动，调试信息和错误输出到控制台
d	作为daemon在后台启动

上面四个是常用的启动选项，其他还有很多，通过

$ /usr/local/bin/memcached h

命令可以显示。许多选项可以改变 Memcached 的各种行为，推荐读一读。

1.4 用客户端连接

许多语言都实现了连接 Memcached 的客户端，其中以 Perl、PHP 为主。仅仅 Memcached 网站上列出的语言就有

Perl
PHP
Python
Ruby
C#
C/C++
Lua

Memcached 客户端 API http://www.danga.com/memcached/apis.bml，这里介绍通过 mixi 正在使用的 Perl 库链接 Memcached 的方法。

1.5 使用 Cache::Memcached

Perl 的 Memcached 客户端有

Cache::Memcached
Cache::Memcached::Fast

Cache::Memcached::libmemcached 等几个 CPAN 模块。这里介绍的 Cache::Memcached 是 Memcached 的作者 Brad Fitzpatric 的作品，应该算是 Memcached 的客户端中应用最为广泛的模块了。

Cache::Memcached search.cpan.org http://search.cpan.org/dist/CacheMemcached/

使用 Cache::Memcached 连接 Memcached

下面的源代码为通过 Cache::Memcached 连接刚才启动的 Memcached 的例子。

#!/usr/bin/perl
use strict;
use warnings;
use Cache::Memcached;
my $key = "foo";
my $value = "bar";
my $expires = 3600; # 1 hour
my $memcached = Cache::Memcached>new({
  servers => ["127.0.0.1:11211"],
  compress_threshold => 10_000
});
$memcached>add($key, $value, $expires);
my $ret = $memcached>get($key);
print "$ret\n";

在这里，为 Cache::Memcached 指定了 Memcached 服务器的 IP 地址和一个选项，以生成实例。 Cache::Memcached 常用的选项如下所示。

选项	说明
servers	用数组指定 memcached服务器和端口
compress_threshold	数据压缩时使用的值
namespace	指定添加到键的前缀

另外 Cache::Memcached 通过 Storable 模块可以将 Perl 的复杂数据序列化之后再保存，因此散列、数组、对象等都可以直接保存到 Memcached 中。

保存数据向 Memcached 保存数据的方法有

add
replace
set

它们的使用方法都相同：

my $add = $memcached>add( '键', '值', '期限' );
my $replace = $memcached>replace( '键', '值', '期限' );
my $set = $memcached>set( '键', '值', '期限' );

向 Memcached 保存数据时可以指定期限（秒）。不指定期限时，Memcached 按照 LRU 算法保存数据。这三个方法的区别如下：

选项	说明
add	仅当存储空间中不存在键相同的数据时才保存
replace	仅当存储空间中存在键相同的数据时才保存
set	与 add和replace不同，无论何时都保存

获取数据获取数据可以使用 get 和 get_multi 方法。

my $val = $memcached>get('键');
my $val = $memcached>get_multi('键1', '键2', '键3', '键4', '键5');

一次取得多条数据时使用 get_multi。get_multi 可以非同步地同时取得多个键值，其速度要比循环调用 get 快数十倍。

删除数据删除数据使用 delete 方法，不过它有个独特的功能。

$memcached>delete('键', '阻塞时间(秒)');

删除第一个参数指定的键的数据。第二个参数指定一个时间值，可以禁止使用同样的键保存新数据。此功能可以用于防止缓存数据的不完整。但是要注意，set 函数忽视该阻塞，照常保存数据。

增一和减一操作可以将 Memcached 上特定的键值作为计数器使用。

my $ret = $memcached>incr('键');
$memcached>add('键', 0) unless defined $ret;

增一和减一是原子操作，但未设置初始值时，不会自动赋成 0。因此应当进行错误检查，必要时加入初始化操作。而且服务器端也不会对超过 2³²时的行为进行检查。

1.6 总结

这次简单介绍了 Memcached，以及它的安装方法、Perl 客户端 Cache::Memcached 的用法。只要知道， Memcached 的使用方法十分简单就足够了。

下一章将为大家说明 Memcached 的内部结构。了解 Memcached 的内部构造，就能知道如何使用 Memcached 才能使 Web 应用的速度更上一层楼。欢迎继续阅读下一章。