资讯详情

GNU C++的符号改编机制

转载地址:https://blog.csdn.net/Roland_Sun/article/details/43233565

前言

众所周知,强大C 相较于C增添了许多功能。这其中就包括类、命名空间和重载这些特性。

对于类,相同的函数和变量可以在不同的类别中定义,不会相互干扰。命名空间可以确保不同名称空间中的类别、函数和变量名称不会相互影响。重载可以确保函数名称可以相同,即使在相同的命名空间中,只要参数不同。

这种设计方便了程序开发者,不用担心不同开发者定义相同名称的函数。然而,这也使符号管理更加复杂。

在最终的编译和链接过程中,如何区分不同类别中的同名函数,或不同名称空间中的同名函数,或同名空间或类别中的同名重载函数?C 人们发明了所谓的符号改编(Name Mangling)机制。

其原理其实很简单,就是根据函数所在的名称空间、类别和参数,按照一定的规则重新命名函数。不同的编译器有不同的命名规则。这里我们主要介绍一下GNU C 编译器使用的规则。主要分为以下情况:

具体规则

全局变量:

也就是说,在命名空间和类之外的变量中,改编后的符号名称是变量名,即不进行任何修改。

全局函数:

以“_Z开头,然后是函数名字符的数量,然后是函数名,最后是函数参数的别名。

以后会详细介绍函数参数的别名。

类或命名空间中的变量或函数:

以“_ZN一开始,然后是变量或函数所在名称空间或类别名称的字符长度,然后是真实的名称空间或类别名称,然后是变量或函数名称的长度和变量或函数名称,然后是字母E最后,如果是函数,则与参数别名,如果是变量,则无需添加任何东西。

构造函数和析构函数

以”_ZN一开始,然后构建函数所在的名称空间和类名的字符长度,然后是真实的名称空间或类名,然后构建函数连接到C1”或者“C二、析构函数接D1”或者“D然后加上字母2E最后,接函数参数的别名结束。

在介绍了命名规则之后,我们将详细介绍函数参数别名的规则。主要分为以下情况:函数参数的基本类型

每种基本类型的别名如下表所示:

参数类型

参数别名

void

v

wchar_t

w

bool

b

char

c

signed char

a

unsigned char

h

short

s

unsigned short

t

int

i

unsigned int

j

long

l

unsigned long

m

long long或__int64

x

unsigned long long或unsigned __int64

y

__int128

n

unsigned __int128

o

float

f

double

d

long double或__float80

e

__float128

g

函数参数是类或结构体时

当函数的参数中含有类或结构体时,在类或者结构体名字前加上类或结构体名的字符长度。 例如,全局函数int structure_func(int i, struct test  s, double d),其经过符号改编后,函数名变成了_Z14structure_funci4testd。

函数参数是指针(*)时

当函数参数中含有指针时,该参数的别名是“P”(大写)加上该指针指向的参数类型的别名。当参数为指针的指针时,该参数的别名是“PP”加上所指向的参数类型的别名,以此类推。

函数参数是一维数组时

当函数参数中含有一维数组时,和参数是指针的处理方式一样,也是“P”加上作为参数的数组其元素类型的别名。

函数参数是多维数组时

对于多维数组,第一维可以看做是指针,其它维则看做是数组。

当函数参数中含有多维数组时,以“P”(代表数组的第一维)开始,后面接“A”加上各维数组的长度,以“_”间隔,最后以下划线加数组元素类型的别名结束。 例如,全局函数void multi_array_func(int a[10][10][20][30]),其经过符号改编后,函数名变成了_Z16multi_array_funcPA10_A20_A30_i。

函数参数含有const修饰符时

当函数参数中含有const修饰符时,以“K”(大写)开始,后面接修饰参数类型的别名。

函数参数是引用(&)时

当函数参数中含有引用时,该参数的别名是“R”(大写)加上该引用所引用的变量类型的别名。

例如,全局函数void ref_const_func(const int &i),其经过符号改编后,函数名变成了_Z14ref_const_funcRKi。

函数参数是别的命名空间中的类或结构体

当函数的参数含有别的命名空间中的类或结构体时,该参数的别名是“N”(大写),加上空间名的长度,再加上空间名,接着是类或结构名的长度和类或结构的名字,最后以“E”(大写)结束。

再举一个复杂点的例子,假设代码如下:  

namespace NS1
{
    class Test1
    {
    };
}
 
namespace NS2
{
    class Test2
    {
    public:
	void MyFunction(NS1:Test1 t) {}
    };
}

那么MyFunction经过符号改变后变成了什么呢?答案是:_ZN3NS25Test210MyFunctionEN3NS15Test1E。

总结

1. 除了全局变量不用做改编之外,其它所需要改编符号的时候,都是以_Z开始;

2. 若想表示某个符号是在命名空间或类中的,要以“N”开始,以“E”结束;

3. 所有的名字空间名、类名、函数名或变量名,改编的时候都是名字所包含的字符数加上真正的名字;

4. 所有的名字按照从外层到里层的顺序进行改编;

5. 如果是函数的话,所有的参数按照前后出现的顺序进行改编。

最后再提一句,这里的符号改编机制都是暗地里编译器帮你做的。只要你的程序使用GNU C++编译器进行编译,它都会用上文所述的规则对你的各种符号名进行改编(包括变量和函数)。

如果你的程序有一些用C语言编写及编译,而另外一些用C++语言编写及编译,并且这两部分还会互相调用到,则需要进行特殊处理。

C++程序在编译的时候会用符号改编,而C程序在调用的时候并不会用符号改编,而是还用原始的函数名作为符号名进行调用,这样C程序就找不到那个对应的C++函数了。

或者,倒过来,C程序在编译的时候不会进行符号重编,而C++程序在调用的时候也会将这个函数名进行重编,这样C++程序同样也找不到那个对应的C函数了。

解决的方法是把那些需要让C程序用到的C++程序中的变量和函数,或者C++程序用到的C程序中的变量和函数,单独抽出来,让编译器不对它们进行符号重编。

具体方法是将它们用extern "C"包起来:

extern "C"
{
    void func();    
    ......
}

当然,也可以一个一个指定:

extern "C" void func();
......

标签: 二极管丝印z16

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台