天天看点

知无涯之C++ typename的起源与用法

c++的难学,还在于它提供了四种不同(但相辅相成)的程序设计思维模式:procedural-based, object-based, object-oriented, generics

对于较少使用最后一种泛型编程的我来说,程序设计基本上停留在前三种思维模式当中。虽说不得窥见高深又现代的泛型技术,但前三种思维模式已几乎满足我所遇到的所有需求,因此一直未曾深入去了解泛型编程。

近日,看到这样一行代码:

虽说已经有多年c++经验,但上面这短短一行代码却看得我头皮发麻。看起来它应该是定义一个类型别名,但是<code>typedef</code>不应该是像这样使用么,<code>typedef</code>+原类型名+新类型名:

可为何此处多了一个<code>typename</code>?另外<code>__type_traits</code>又是什么?看起来有些眼熟,想起之前在effective c++上曾经看过<code>traits</code>这一技术的介绍,和这里的<code>__type_traits</code>有点像。只是一直未曾遇到需要<code>traits</code>的时候,所以当时并未仔细研究。然而stl中大量的充斥着各种各样的<code>traits</code>,一查才发现原来它是一种非常高级的技术,在更现的高级语言中已经很普遍。因此这次花了些时间去学习它,接下来还有会有另一篇文章来详细介绍c++的<code>traits</code>技术。在这里,我们暂时忘记它,仅将它当成一个普通的类,先来探讨一下这个多出来的<code>typename</code>是怎么回事?

对于<code>typename</code>这个关键字,如果你熟悉c++的模板,一定会知道它有这样一种最常见的用法(代码摘自c++ primer):

也许你会想到上面这段代码中的<code>typename</code>换成<code>class</code>也一样可以,不错!那么这里便有了疑问,这两种方式有区别么?查看c++ primer之后,发现两者完全一样。那么为什么c++要同时支持这两种方式呢?既然<code>class</code>很早就已经有了,为什么还要引入<code>typename</code>这一关键字呢?问的好,这里面有一段鲜为人知的历史(也许只是我不知道:-))。带着这些疑问,我们开始探寻之旅。

对于一些更早接触c++的朋友,你可能知道,在c++标准还未统一时,很多旧的编译器只支持<code>class</code>,因为那时c++并没有<code>typename</code>关键字。记得我在学习c++时就曾在某本c++书籍上看过类似的注意事项,告诉我们如果使用<code>typename</code>时编译器报错的话,那么换成<code>class</code>即可。

一切归结于历史。

stroustrup在最初起草模板规范时,他曾考虑到为模板的类型参数引入一个新的关键字,但是这样做很可能会破坏已经写好的很多程序(因为<code>class</code>已经使用了很长一段时间)。但是更重要的原因是,在当时看来,<code>class</code>已完全足够胜任模板的这一需求,因此,为了避免引起不必要的麻烦,他选择了妥协,重用已有的<code>class</code>关键字。所以只到iso c++标准出来之前,想要指定模板的类型参数只有一种方法,那便是使用<code>class</code>。这也解释了为什么很多旧的编译器只支持<code>class</code>。

但是对很多人来说,总是不习惯<code>class</code>,因为从其本来存在的目的来说,是为了区别于语言的内置类型,用于声明一个用户自定义类型。那么对于下面这个模板函数的定义(相对于上例,仅将<code>typename</code>换成了<code>class</code>):

从表面上看起来就好像这个模板的参数应该只支持用户自定义类型,所以使用语言内置类型或者指针来调用该模板函数时总会觉得有一丝奇怪(虽然并没有错误):

令人感到奇怪的原因是,<code>class</code>在类和模板中表现的意义看起来存在一些不一致,前者针对用户自定义类型,而后者包含了语言内置类型和指针。也正因为如此,人们似乎觉得当时没有引入一个新的关键字可能是一个错误。

这是促使标准委员会引入新关键字的一个因素,但其实还有另外一个更加重要的原因,和文章最开始那行代码相关。

在我们揭开真实原因的面纱之前,先保持一点神秘感,因为为了更好的理解c++标准,有几个重要的概念需要先行介绍一下。

限定名(qualified name),故名思义,是限定了命名空间的名称。看下面这段代码,<code>cout</code>和<code>endl</code>就是限定名:

<code>cout</code>和<code>endl</code>前面都有<code>std::</code>,它限定了<code>std</code>这个命名空间,因此称其为限定名。

如果在上面这段代码中,前面用<code>using std::cout;</code>或者<code>using namespace std;</code>,然后使用时只用<code>cout</code>和<code>endl</code>,它们的前面不再有空间限定<code>std::</code>,所以此时的<code>cout</code>和<code>endl</code>就叫做非限定名(unqualified name)。

依赖名(dependent name)是指依赖于模板参数的名称,而非依赖名(non-dependent name)则相反,指不依赖于模板参数的名称。看下面这段代码:

因为是内置类型,所以类中前三个定义的类型在声明这个模板类时就已知。然而对于接下来的三行定义,只有在模板实例化时才能知道它们的类型,因为它们都依赖于模板参数<code>t</code>。因此,<code>t</code>, <code>vector&lt;t&gt;</code>和<code>vector&lt;t&gt;::iterator</code>称为依赖名。前三个定义叫做非依赖名。

更为复杂一点,如果用了<code>typedef t u; u u;</code>,虽然<code>t</code>没再出现,但是<code>u</code>仍然是依赖名。由此可见,不管是直接还是间接,只要依赖于模板参数,该名称就是依赖名。

在类外部访问类中的名称时,可以使用类作用域操作符,形如<code>myclass::name</code>的调用通常存在三种:静态数据成员、静态成员函数和嵌套类型:

<code>myclass::a</code>, <code>myclass::b</code>, <code>myclass::c</code>分别对应着上面三种。

结束以上三个概念的讨论,让我们接着揭开<code>typename</code>的神秘面纱。

在stroustrup起草了最初的模板规范之后,人们更加无忧无虑的使用了<code>class</code>很长一段时间。可是,随着标准化c++工作的到来,人们发现了模板这样一种定义:

这段代码的目的是什么?多数人第一反应可能是:作者想定义一个指针<code>iter</code>,它指向的类型是包含在类作用域<code>t</code>中的<code>iterator</code>。可能存在这样一个包含<code>iterator</code>类型的结构:

然后像这样实例化<code>foo</code>:

这样一来,<code>iter</code>那行代码就很明显了,它是一个<code>containsatype::iterator</code>类型的指针。到目前为止,咱们猜测的一点不错,一切都看起来很美好。

在类作用域一节中,我们介绍了三种名称,由于<code>myclass</code>已经是一个完整的定义,因此编译期它的类型就可以确定下来,也就是说<code>myclass::a</code>这些名称对于编译器来说也是已知的。

可是,如果是像<code>t::iterator</code>这样呢?<code>t</code>是模板中的类型参数,它只有等到模板实例化时才会知道是哪种类型,更不用说内部的<code>iterator</code>。通过前面类作用域一节的介绍,我们可以知道,<code>t::iterator</code>实际上可以是以下三种中的任何一种类型:

静态数据成员

静态成员函数

嵌套类型

前面例子中的<code>containsatype::iterator</code>是嵌套类型,完全没有问题。可如果是静态数据成员呢?如果实例化<code>foo</code>模板函数的类型是像这样的:

然后如此实例化<code>foo</code>的类型参数:

那么,<code>t::iterator * iter;</code>被编译器实例化为<code>containsanothertype::iterator * iter;</code>,这是什么?前面是一个静态成员变量而不是类型,那么这便成了一个乘法表达式,只不过<code>iter</code>在这里没有定义,编译器会报错:

error c2065: ‘iter’ : undeclared identifier

但如果<code>iter</code>是一个全局变量,那么这行代码将完全正确,它是表示计算两数相乘的表达式,返回值被抛弃。

同一行代码能以两种完全不同的方式解释,而且在模板实例化之前,完全没有办法来区分它们,这绝对是滋生各种bug的温床。这时c++标准委员会再也忍不住了,与其到实例化时才能知道到底选择哪种方式来解释以上代码,委员会决定引入一个新的关键字,这就是<code>typename</code>。

a name used in a template declaration or definition and that is dependent on a template-parameter is assumed not to name a type unless the applicable name lookup finds a type name or the name is qualified by the keyword typename.

对于用于模板定义的依赖于模板参数的名称,只有在实例化的参数中存在这个类型名,或者这个名称前使用了<code>typename</code>关键字来修饰,编译器才会将该名称当成是类型。除了以上这两种情况,绝不会被当成是类型。

因此,如果你想直接告诉编译器<code>t::iterator</code>是类型而不是变量,只需用<code>typename</code>修饰:

这样编译器就可以确定<code>t::iterator</code>是一个类型,而不再需要等到实例化时期才能确定,因此消除了前面提到的歧义。

但是如果仍然用<code>containsanothertype</code>来实例化<code>foo</code>,前者只有一个叫<code>iterator</code>的静态成员变量,而后者需要的是一个类型,结果会怎样?我在visual c++ 2010和g++ 4.3.4上分别做了实验,结果如下:

visual c++ 2010仍然报告了和前面一样的错误:

虽然我们已经用关键字<code>typename</code>告诉了编译器<code>iterator</code>应该是一个类型,但是用一个定义了<code>iterator</code>变量的结构来实例化模板时,编译器却选择忽略了此关键字。出现错误只是由于<code>iter</code>没有定义。

再来看看g++如何处理这种情况,它的错误信息如下:

in function ‘void foo() [with t = containsanothertype]’: instantiated from here error: no type named ‘iterator’ in ‘struct containsanothertype’

g++在<code>containsanothertype</code>中没有找到<code>iterator</code>类型,所以直接报错。它并没有尝试以另外一种方式来解释,由此可见,在这点上,g++更加严格,更遵循c++标准。

typename在下面情况下禁止使用:

模板定义之外,即typename只能用于模板的定义中

非限定类型,比如前面介绍过的<code>int</code>,<code>vector&lt;int&gt;</code>之类

基类列表中,比如<code>template &lt;class t&gt; class c1 : t::innertype</code>不能在<code>t::innertype</code>前面加typename

构造函数的初始化列表中

如果类型是依赖于模板参数的限定名,那么在它之前必须加typename(除非是基类列表,或者在类的初始化成员列表中)

其它情况下typename是可选的,也就是说对于一个不是依赖名的限定名,该名称是可选的,例如<code>vector&lt;int&gt; vi;</code>

对于不会引起歧义的情况,仍然需要在前面加<code>typename</code>,比如:

不像前面的<code>t::iterator * iter</code>可能会被当成乘法表达式,这里不会引起歧义,但仍需加<code>typename</code>修饰。

再看下面这种:

是否和文章刚开始的那行令人头皮发麻的代码有些许相似?没错!现在终于可以解开<code>typename</code>之迷了,看到这里,我相信你也一定可以解释那行代码了,我们再看一眼:

它是将<code>__type_traits&lt;t&gt;</code>这个模板类中的<code>has_trivial_destructor</code>嵌套类型定义一个叫做<code>trivial_destructor</code>的别名,清晰明了。

既然<code>typename</code>关键字已经存在,而且它也可以用于最常见的指定模板参数,那么为什么不废除<code>class</code>这一用法呢?答案其实也很明显,因为在最终的标准出来之前,所有已存在的书、文章、教学、代码中都是使用的是<code>class</code>,可以想像,如果标准不再支持<code>class</code>,会出现什么情况。

对于指定模板参数这一用法,虽然<code>class</code>和<code>typename</code>都支持,但就个人而言我还是倾向使用<code>typename</code>多一些,因为我始终过不了<code>class</code>表示用户定义类型这道坎。另外,从语义上来说,<code>typename</code>比<code>class</code>表达的更为清楚。c++ primer也建议使用<code>typename</code>:

使用关键字typename代替关键字class指定模板类型形参也许更为直观,毕竟,可以使用内置类型(非类类型)作为实际的类型形参,而且,typename更清楚地指明后面的名字是一个类型名。但是,关键字typename是作为标准c++的组成部分加入到c++中的,因此旧的程序更有可能只用关键字class。

c++ primer

effective c++

<a href="http://pages.cs.wisc.edu/~driscoll/typename.html">a description of the c++ typename keyword</a>

<a href="http://zh.wikipedia.org/wiki/typename">维基百科typename</a>

一个简单的关键字就已经充满曲折,这可以从一个角度反映出一门语言的发展历程,究竟要经历多少决断、波折与妥协,最终才发展成为现在的模样。在一个特定的时期,由于历史、技术、思想等各方面的因素,设计总会向现实做出一定的让步,出现一些“不完美”的设计,为了保持向后兼容,有些“不完美”的历史因素被保留了下来。现在我可以理解经常为人所诟病的windows操作系统,intel芯片,ie浏览器,visual c++等,为了保持向后兼容,不得不在新的设计中仍然保留这些“不完美”,虽然带来的是更多的优秀特性,但有些人却总因为这些历史因素而唾弃它们,也为自己曾有一样的举动而羞愧不已。但也正是这些“不完美”的出现,才让人们在后续的设计中更加注意,站在前人的肩膀上,做出更好,更完善的设计,于是科技才不断向前推进。

(全文完)

继续阅读