条款20:为指针的关联容器指定比较类型

优质
小牛编辑
124浏览
2023-12-01

条款20:为指针的关联容器指定比较类型

假定你有一个string*指针的set,你把一些动物的名字插入进set:

set<string*> ssp;						// ssp = “set of string ptrs”
ssp.insert(new string("Anteater"));
ssp.insert(new string("Wombat"));
ssp.insert(new string("Lemur"));
ssp.insert(new string("Penguin"));

然后你写了下列代码打印set的内容,希望字符串按字母顺序出现。毕竟,确定set保持它们的内容有序。

for (set<string*>::const_iterator i = ssp.begin();		// 你希望看到
			i != ssp.end();			// 这个:“Anteater”
			++i)				// “Lemur”,“Penguin”,
	cout << *i << endl;				// “Wombat”

注释描述了你希望看见的,但你根本没看见。取而代之的是,你看见四个十六进制的数。它们是指针的值。因为set容纳指针,*i不是一个string,它是一个string的指针。让这成为提醒你坚持条款43的指导并避免自己写循环的一课。如果你已经改为调用copy算法,

copy(ssp.begin(), ssp.end(),				// 把ssp中的字符串
	ostream_iterator<string>(cout, "\n"));		// 拷贝到cout(但这
							// 不能编译)

你将不仅打更少的字符,而且你将很快会查明你的错误,因为这个copy的调用将不能编译,ostream_iterator需要知道被打印的对象的类型,所以当你告诉它是一个string时(通过作为模板参数传递),编译器检测到那和ssp中储存的对象类型(是string*)之间不匹配,它们会拒绝编译代码。获得了额外的类型安全。

如果你愤怒地把显式循环中的*i改为**i,你可能可以得到你想要的输出,但也可能不。是的,动物名字将被打印,但它们按字母顺序出现的机会只是24份之1。ssp保持它的内容有序,但是它容纳的是指针,所以它以指针的值排序,而不以string值。对于四个指针值可能有24种排列(译注:4! = 4 * 3 * 2 * 1 = 24),所以指针被储存时有24种可能的顺序。因此你看见字符串按字母排序有24份之1的几率。[1]

为了克服这个问题,你应该回忆起

set<string*> ssp; 

是这个的简写:

set<string*, less<string*> > ssp; 

好,为了完全准确,它是

set<string*, less<string*>, allocator<string*> > ssp; 

的简化,但是分配器在本条款里与我们无关,所以我们将忽略它们。

如果你想要string*指针以字符串值确定顺序被储存在set中,你不能使用默认比较仿函数类less<string*>。你必须改为写你自己的比较仿函数类,它的对象带有string*指针并按照指向的字符串值来进行排序。就像这样:

struct StringPtrLess:
	public binary_function<const string*,		// 使用这个基类
				const string*,		// 的理由参见条款40
				bool> {
	bool operator()(const string *ps1, const string *ps2) const
	{
		return *ps1 < *ps2;
	}
};

然后你可以使用StringPtrLess作为ssp的比较类型:

typedef set<string*, StringPtrLess> StringPtrSet;
StringPtrSet ssp;					// 建立字符串的集合,
						// 按照StringPtrLess定义的顺序排序

...						// 和前面一样插入
						// 同样四个字符串

现在你的循环最后将做你想要它做的(也就是前面你使用*i代替**i所修正的问题):

for (StringPtrSet::const_iterator i = ssp.begin();	// 打印“Anteater”,
		i != ssp.end();			// “Lemur”
		++i)				// “Penguin”
	cout << **i << endl;			// “Wombat”

如果你想要改为使用算法,你可以写一个知道怎么在打印string*指针之前对它们解引用的函数,然后和for_each联用那个函数:

void print(const string *ps)			// 把ps指向的
{						// 对象打印到cout
	cout << *ps << endl;
}

for_each(ssp.begin(), ssp.end(), print);		// 在ssp中的每个
						// 元素上调用print

或者你想象并写出了泛型的解引用仿函数类,然后让它和transform与ostream_iterator连用:

// 当本类型的仿函数被传入一个T*时,它们返回一个const T&
struct Dereference {
	template <typename T>
	const T& operator()(const T *ptr) const
	{
		return *ptr;
	}
};

transform(ssp.begin(), ssp.end(),				// 通过解引用“转换”
		ostream_iterator<string>(cout, "\n"),	// ssp中的每个元素,
		Dereference());				// 把结果写入cout

但是,用算法代替循环不是要点,至少对于本条款来说是这样的。(它是条款43的要点。)要点是无论何时你建立一个指针的标准关联容器,你必须记住容器会以指针的值排序。这基本上不是你想要的,所以你几乎总是需要建立自己的仿函数类作为比较类型。

注意到我写的是“比较类型”。你可能奇怪为什么必须特意创造一个仿函数类而不是简单地为set写一个比较函数。例如,你可能想试试:

bool stringPtrLess(const string* ps1,		// 将成为用于
			const string* ps2)		// 按字符串值
{						// 排序的string*指针
	return *ps1 < *ps2;			// 的比较函数
}

set<string*, stringPtrLess> ssp;			// 假设使用stringPtrLess
						// 作为ssp的比较函数;
						// 这不能编译

这里的问题是每个set模板的第三个参数都是一种类型。令人遗憾的是,stringPtrLess不是一种类型,它是一个函数。这就是为什么尝试使用stringPtrLess作为set的比较函数不能编译的原因,set不要一个函数,它要的是能在内部用实例化建立函数的一种类型。

无论何时你建立指针的关联容器,注意你也得指定容器的比较类型。大多数时候,你的比较类型只是解引用指针并比较所指向的对象(就像上面的StringPtrLess做的那样)。鉴于这种情况,你手头最好也能有一个用于那种比较的仿函数模板。像这样:

struct DereferenceLess {
	template <typename PtrType>
		bool operator()(PtrType pT1,		// 参数是值传递的,
				PtrType pT2) const		// 因为我们希望它们
		{					// 是(或行为像)指针
			return *pT1 < *pT2;
		}
};

这样的模板消除了写像StringPtrLess那样的类的需要,因为我们可以改为使用DereferenceLess:

set<string*, DereferenceLess> ssp;		// 行为就像
					// set<string*, StringPtrLess>

噢,还有一件事。本条款是关于指针的关联容器,但它也可以应用于表现为指针的对象的容器,例如,智能指针和迭代器。如果你有一个智能指针或迭代器的关联容器,那也得为它指定比较类型。幸运的是,指针的这个解决方案也可以用于类似指针的对象。正如DereferenceLess适合作为T*的关联容器的比较类型一样,它也可以作为T对象的迭代器和智能指针容器的比较类型。


[1] 实际上,这24种排列很可能不是平等的,所以“24份之1”的陈述有点使人误解。确实,有24个不同的顺序,而且你可能得到它们中的任何一个。