第1章 Memcached 的基础

优质
小牛编辑
131浏览
2023-12-01

1.1 Memcached 是什么?

memcached 是以 LiveJournal 旗下 Danga Interactive公司的Brad Fitzpatric为首开发的一款软件。现在已成为 mixihatenaFacebookVox、LiveJournal 等众多服务中提高 Web 应用扩展性的重要因素。

许多 Web 应用都将数据保存到 RDBMS 中,应用服务器从中读取数据并在浏览器中显示。但随着数据量的增大、访问的集中,就会出现 RDBMS 的负担加重、数据库响应恶化、网站显示延迟等重大影响。

这时就该 Memcached 大显身手了。Memcached 是高性能的分布式内存缓存服务器。一般的使用目的是,通过缓存数据库查询结果,减少数据库访问次数,以提高动态 Web 应用的速度、提高可扩展性。

图 1.1:一般情况下 Memcached 的用途

1.2 Memcached 的特征

memcached 作为高速运行的分布式缓存服务器,具有以下的特点。

  • 协议简单
  • 基于libevent的事件处理
  • 内置内存存储方式
  • memcached 不互相通信的分布式

协议简单

Memcached 的服务器客户端通信并不使用复杂的 XML 等格式,而使用简单的基于文本行的协议。因此通过 telnet 也能在 Memcached 上保存数据、取得数据。下面是例子。

telnet localhost 11211
Trying 127.0.0.1...
Connected to localhost.localdomain (127.0.0.1).
Escape character is '^]'.
set foo 0 0 3 (保存命令)
bar (数据)
STORED (结果)
get foo (取得命令)
VALUE foo 0 3 (数据)
bar (数据)

协议文档位于 Memcached 的源代码内,也可以参考以下的 URL。

http://code.sixapart.com/svn/memcached/trunk/server/doc/protocol.txt

基于 libevent 的事件处理

libevent 是个程序库,它将 Linux 的 epoll、BSD 类操作系统的 kqueue 等事件处理功能封装成统一的接口。即使对服务器的连接数增加,也能发挥的性能。Memcached 使用这个 libevent 库,因此能在 Linux、BSD、Solaris 等操作系统上发挥其高性能。关于事件处理这里就不再详细介绍,可以参考 Dan Kegel 的 The C10K Problem。

内置内存存储方式

为了提高性能,Memcached 中保存的数据都存储在 Memcached 内置的内存存储空间中。由于数据仅存在于内存中,因此重启 Memcached、重启操作系统会导致全部数据消失。另外内容容量达到指定值之后,就基于 LRU(Least Recently Used)算法自动删除不使用的缓存。Memcached 本身是为缓存而设计的服务器,因此并没有过多考虑数据的永久性问题。关于内存存储的详细信息,请参考本文的第2章以后前坂介绍的内容。

Memcached 不互相通信的分布式

Memcached 尽管是 分布式 缓存服务器,但服务器端并没有分布式功能。各个 Memcached 不会互相通信以共享信息。那么怎样进行分布式呢?这完全取决于客户端的实现。本文也将介绍 Memcached 的分布式。

图 1.2:Memcached 的分布式

接下来简单介绍一下 Memcached 的使用方法。

1.3 安装 Memcached

Memcached 的安装比较简单,这里稍加说明,Memcached 支持许多平台。

  • Linux
  • FreeBSD
  • Solaris (memcached 1.2.5 以上版本)
  • Mac OS X

另外也能安装在 Windows 上。这里使用 Fedora Core 8 进行说明。

Memcached 的安装

运行 Memcached 需要本文开头介绍的 libevent 库。Fedora 8 中有现成的 rpm 包,通过 yum 命令安装即可。

sudo yum install libevent libeventdevel

Memcached 的源代码可以从 Memcached 网站上下载。本文执笔时的最新版本为 1.2.5。Fedora 8 虽然也包含了 Memcached 的 rpm,但版本比较老。因为源代码安装并不困难,这里就不使用 rpm 安装了。

下载 Memcached,下载地址在这里 http://www.danga.com/memcached/download.bml ,Memcached 安装与一般应用程序相同,configure、make、make install 就行了。

$ wget http://www.danga.com/memcached/dist/memcached1.2.5.tar.gz
$ tar zxf memcached1.2.5.tar.gz
$ cd memcached1.2.5
$ ./configure
$ make
$ sudo make install

默认情况下 Memcached 安装到 /usr/local/bin 下。

Memcached 的启动从终端输入以下命令,启动 Memcached。

$ /usr/local/bin/memcached p 11211 m 64m vv
slab class1: chunk size88 perslab 11915
slab class2: chunk size112 perslab9362
slab class3: chunk size144 perslab7281
中间省略
slab class38: chunk size 391224 perslab2
slab class39: chunk size 489032 perslab2
<23 server listening
<24 send buffer was 110592, now 268435456
<24 server listening (udp)
<24 server listening (udp)
<24 server listening (udp)
<24 server listening (udp)

这里显示了调试信息。这样就在前台启动了 Memcached,监听 TCP 端口 11211 最大内存使用量为 64M。调试信息的内容大部分是关于存储的信息,下一章将具体说明。

作为 daemon 后台启动时,只需运行下面的命名

$ /usr/local/bin/memcached p 11211 m 64m d

这里使用的 Memcached 启动选项的内容如下。

选项说明
p使用的TCP端口。默认为11211
m最大内存大小。默认为64M
vv用very vrebose模式启动,调试信息和错误输出到控制台
d作为daemon在后台启动

上面四个是常用的启动选项,其他还有很多,通过

$ /usr/local/bin/memcached h

命令可以显示。许多选项可以改变 Memcached 的各种行为,推荐读一读。

1.4 用客户端连接

许多语言都实现了连接 Memcached 的客户端,其中以 Perl、PHP 为主。仅仅 Memcached 网站上列出的语言就有

  • Perl
  • PHP
  • Python
  • Ruby
  • C#
  • C/C++
  • Lua

Memcached 客户端 API http://www.danga.com/memcached/apis.bml,这里介绍通过 mixi 正在使用的 Perl 库链接 Memcached 的方法。

1.5 使用 Cache::Memcached

Perl 的 Memcached 客户端有

  • Cache::Memcached
  • Cache::Memcached::Fast

Cache::Memcached::libmemcached 等几个 CPAN 模块。这里介绍的 Cache::Memcached 是 Memcached 的作者 Brad Fitzpatric 的作品,应该算是 Memcached 的客户端中应用最为广泛的模块了。

Cache::Memcached search.cpan.org http://search.cpan.org/dist/CacheMemcached/

使用 Cache::Memcached 连接 Memcached

下面的源代码为通过 Cache::Memcached 连接刚才启动的 Memcached 的例子。

#!/usr/bin/perl
use strict;
use warnings;
use Cache::Memcached;
my $key = "foo";
my $value = "bar";
my $expires = 3600; # 1 hour
my $memcached = Cache::Memcached>new({
  servers => ["127.0.0.1:11211"],
  compress_threshold => 10_000
});
$memcached>add($key, $value, $expires);
my $ret = $memcached>get($key);
print "$ret\n";

在这里,为 Cache::Memcached 指定了 Memcached 服务器的 IP 地址和一个选项,以生成实例。 Cache::Memcached 常用的选项如下所示。

选项说明
servers用数组指定 memcached服务器和端口
compress_threshold数据压缩时使用的值
namespace指定添加到键的前缀

另外 Cache::Memcached 通过 Storable 模块可以将 Perl 的复杂数据序列化之后再保存,因此散列、数组、对象等都可以直接保存到 Memcached 中。

保存数据向 Memcached 保存数据的方法有

  • add
  • replace
  • set

它们的使用方法都相同:

my $add = $memcached>add( '键', '值', '期限' );
my $replace = $memcached>replace( '键', '值', '期限' );
my $set = $memcached>set( '键', '值', '期限' );

向 Memcached 保存数据时可以指定期限(秒)。不指定期限时,Memcached 按照 LRU 算法保存数据。这三个方法的区别如下:

选项说明
add仅当存储空间中不存在键相同的数据时才保存
replace仅当存储空间中存在键相同的数据时才保存
set与 add和replace不同,无论何时都保存

获取数据获取数据可以使用 get 和 get_multi 方法。

my $val = $memcached>get('键');
my $val = $memcached>get_multi('键1', '键2', '键3', '键4', '键5');

一次取得多条数据时使用 get_multi。get_multi 可以非同步地同时取得多个键值,其速度要比循环调用 get 快数十倍。

删除数据删除数据使用 delete 方法,不过它有个独特的功能。

$memcached>delete('键', '阻塞时间(秒)');

删除第一个参数指定的键的数据。第二个参数指定一个时间值,可以禁止使用同样的键保存新数据。此功能可以用于防止缓存数据的不完整。但是要注意,set 函数忽视该阻塞,照常保存数据。

增一和减一操作可以将 Memcached 上特定的键值作为计数器使用。

my $ret = $memcached>incr('键');
$memcached>add('键', 0) unless defined $ret;

增一和减一是原子操作,但未设置初始值时,不会自动赋成 0。因此应当进行错误检查,必要时加入初始化操作。而且服务器端也不会对超过 232 时的行为进行检查。

1.6 总结

这次简单介绍了 Memcached,以及它的安装方法、Perl 客户端 Cache::Memcached 的用法。只要知道, Memcached 的使用方法十分简单就足够了。

下一章将为大家说明 Memcached 的内部结构。了解 Memcached 的内部构造,就能知道如何使用 Memcached 才能使 Web 应用的速度更上一层楼。欢迎继续阅读下一章。