天天看点

bash的环境变量和shell变量

作者:whowin1963

本文简单介绍了bash的启动过程;shell变量和环境变量的区别及相互转换;环境变量传递给子进程的过程;在当前环境下执行脚本及其实际应用。

1. 导言

  • shell是一个Linux的命令行解释器,Linux下有很多shell,其中ubuntu中默认的shell是应该是dash,因为我们看到/bin/sh被链接到了dash;
bash的环境变量和shell变量

图1:/bin/sh指向dash

  • 但是当你启动终端时(不管是在桌面还是远程),默认启动的却是bash(Bourne-Again SHell),bash是GNU(Gnu's Not Unix)开发的;
  • 使用cat /etc/shells命令可以看到在你的Linux下有那些shell;
  • 使用echo $SHELL可以看到当前你正在使用的shell;
  • 本文中如无特别说明,shell指的是bash,所有范例在ubuntu 16.04下完成,在更高版本的ubuntu上,可能会有些微区别;在较低版本的ubuntu上不能保证有相同的效果。

2. 终端是如何启动 shell 的

  • ubuntu的1号进程是systemd,这是ubuntu在加载完Linux内核后启动的第一个进程,是所有其它进程的祖宗;
  • 你可能用ps aux(ps -ef)命令发现1号进程是/sbin/init,而不是systemd,但你用ls -l /sbin/init看一下就会恍然大悟;
bash的环境变量和shell变量

图2:1号进程

bash的环境变量和shell变量

图3:/sbin/init指向systemd

  • 当你在ubuntu桌面版上启动一个终端时,会启动一个gnome-terminal进程,gnome-terminal进程启动了bash进程,这样你就看到可爱的提示符了,这个过程使用pstree命令一目了然;
bash的环境变量和shell变量

图4:gnome-terminal进程启动bash

  • 当你使用ssh客户端远程登录到Linux系统时,bash进程是由sshd进程启动的,这个也可以用pstree命令看到;
bash的环境变量和shell变量

图5:sshd进程启动bash

  • 只有启动了bash你才拥有了一个shell环境,你才能够在终端上输入命令,你从键盘输入的任何内容都必须由bash进行解释并做出进一步的处理。

3. shell 变量和环境变量

shell 变量

shell管理着一个变量表,这使得用户可以自己定义变量,这些变量是在shell下建立,由shell管理,在shell下使用;

在启动shell(bash)的时候,shell会创建一些变量(不同的shell创建的变量会有所不同),同时,shell在启动过程中还会去执行一些可以由客户自定义的脚本,比如:在启动bash时会执行:/etc/bash.bashrc,在登录时会执行:~/.bashrc等,这些脚本通常也会建立一些变量;

由于有些脚本是在用户登录时执行的,比如:~/.bashrc,而这个脚本是放在用户的home目录下的,这就使得不同的用户在登录时可以执行不同的脚本,从而每个用户在登录后所建立的shell变量也可以是不一样的;

在shell下,可以直接用:"变量名=变量值"的方法定义或修改shell变量;也可以用:"unset 变量名"来删除变量,按照惯例,shell变量名使用大写字母;

使用set命令可以查看当前所有的shell变量;用"echo $变量名"可以显示指定变量名的值。

环境变量

环境变量也是shell变量,但环境变量却不等同于shell变量,我们暂时把不是环境变量的shell变量称作普通shell变量,在bash内部,环境变量与普通shell变量的区别,仅仅是一个不同的标记而已;

环境变量和普通shell变量的最主要的区别是,在建立一个子进程时,环境变量会被传递给这个子进程,而普通shell变量不会,所以,环境变量可能会对一个子进程的行为产生影响,因为子进程可以根据环境变量的值做出不同的动作;

环境变量可以使用"export 变量名=变量值"进行设置,可以像普通shell变量一样用"unset 变量名"进行删除;

可以使用printenv命令查看所有的环境变量;用"echo $变量名"可以显示指定环境变量的值;也可以用"printenv 环境变量名"来显示一个环境变量的值;

env如果不带参数的话,也是可以显示环境变量的,但这个命令主要用于在指定环境下执行命令。

关于env命令的两个例子

"env 环境变量名=变量值"命令和"env -u 环境变量名"命令都只能临时在一个新的环境中改变或者删除一个变量,用于在一个指定的环境中执行命令,这一点在很多文章中都没有明确说明;

下面的例子设置了一个临时环境变量ENV_VAR_1,并且在这个临时环境中将这个变量的值打印出来

$ printenv ENV_VAR_1                           # 当前环境下,不存在环境变量 ENV_VAR_1
$ env ENV_VAR_1=first_value printenv ENV_VAR_1 # 临时设置环境变量并打印出值
first_value                                    # 临时设置的环境变量ENV_VAR_1的值
$ printenv ENV_VAR_1                           # 当前环境下,仍然不存在环境变量 ENV_VAR_1
$            

下面的例子中在临时环境中删除一个在当前环境中存在的环境变量,在临时环境中打印该环境变量为空,确定该环境变量在临时环境中已经不存在

$ export ENV_VAR_2=second_value                  # 当前环境下设置环境变量
$ printenv ENV_VAR_2                             # 打印该环境变量的值
second_value
$ env -u ENV_VAR_2 printenv SHELL ENV_VAR_2 USER # 临时删除该环境变量,并在临时环境中打印该变量
/bin/bash                                        # SHELL变量的值
demouser                                         # USER变量的值,偏偏没有变量ENV_VAR_2的值
$ printenv ENV_VAR_2                             # 当前环境下打印环境变量ENV_VAR_2
second_value
$            

环境变量和普通shell变量的转换

  • 普通shell变量,通过"export 变量名"可以转变成环境变量
$ set|grep VAR_TO_ENVVAR                # 没有VAR_TO_ENVVAR这个shell变量
$ VAR_TO_ENVVAR=convert_var_to_envvar   # 设置VAR_TO_ENVVAR
$ set|grep VAR_TO_ENVVAR                # VAR_TO_ENVVAR是一个shell变量
VAR_TO_ENVVAR=convert_var_to_envvar
$ printenv|grep VAR_TO_ENVVAR           # VAR_TO_ENVVAR不是一个环境变量
$ export VAR_TO_ENVVAR                  # 执行export命令
$ printenv|grep VAR_TO_ENVVAR           # VAR_TO_ENVVAR已经变成一个环境变量
VAR_TO_ENVVAR=convert_var_to_envvar
$            
  • 普通shell变量,通过"declare -x 变量名"可以转变成环境变量
$ unset VAR_TO_ENVVAR                   # 删除变量VAR_TO_ENVVAR
$ VAR_TO_ENVVAR=convert_var_to_envvar   # 设置VAR_TO_ENVVAR
$ set|grep VAR_TO_ENVVAR                # VAR_TO_ENVVAR是一个shell变量
VAR_TO_ENVVAR=convert_var_to_envvar
$ printenv|grep VAR_TO_ENVVAR           # VAR_TO_ENVVAR不是一个环境变量
$ declare -x VAR_TO_ENVVAR              # 执行declare命令
$ printenv|grep VAR_TO_ENVVAR           # VAR_TO_ENVVAR已经变成一个环境变量
VAR_TO_ENVVAR=convert_var_to_envvar
$            
  • 环境变量,通过"declare +x 变量名"可以转变成普通shell变量
$ export ENV_VAR_1=testing    # 设置一个环境变量
$ printenv|grep ENV_VAR_1     # 确认设置成功
ENV_VAR_1=testing
$ declare +x ENV_VAR_1        # 执行declare +x命令
$ printenv|grep ENV_VAR_1     # 该变量已经不再是环境变量
$ set|grep ENV_VAR_1          # 该变量仍然是一个普通shell变量
ENV_VAR_1=testing
$            
  • "declare 变量名=变量值"可以用来设置或修改一个普通shell变量的值;
  • "declare -x 变量名=变量值"可以用来设置或修改一个环境变量的值;
  • "declare -x 变量名"可以将普通shell变量变成环境变量;
  • "declare +x 变量名"可以将环境变量变成普通shell变量。

在Bourne Shell家族中(bash - Bourne-Again SHell)对变量和环境变量的区分确实不是很严格,很容易混为一谈,比如:两者按惯例都是用大写字母表示,设置和删除方法相同;但是在C Shell(csh)是进行了严格区分的,在csh中,按惯例shell变量使用小写字母,环境变量使用大写字母,shell变量使用set和unset命令进行设置和删除,而环境变量必须用setenv和unsetenv命令进行设置和删除。

4. bash如何将环境变量传给子进程

bash 如何执行一个命令

  • shell在收到一个换行符(new line,ASCII码0x0A)时开始解释命令行的命令;
  • shell查找命令是否有别名(alias),如果有则用别名代替命令;
  • 如果命令中不包含"/",shell首先查找同名函数,如果有,执行这个函数即可;
  • 如果没有同名函数则查找内建命令,如果是内建命令,则在bash内部执行即可;
  • 如果也不是内建命令,则根据环境变量PATH的顺序查找命令文件;
  • 如果找不到命令文件,则显示错误信息并回到提示符接收下面的命令;
  • 如果找到命令文件或者命令中有"/"字符,bash会fork一个子进程,自身进程执行wait()等待子进程结束,然后在子进程中执行execve(),一切的其他工作交给execve()来处理。

环境变量的传递

  • 我们看一下 execve() 的手册
bash的环境变量和shell变量

图6:execve()手册

  • 在执行 execve() 时,需要传递三个参数过去
  1. filename: 要执行的程序文件名;
  2. argv[]: 执行这个程序需要的参数;
  3. envp: 环境变量;

环境变量就是这样传递给了可执行程序

  • 大家可能注意到,shell不仅可以执行一个二进制的程序,也可以执行一个shell脚本(ASCII文本文件),我们并不需要告诉shell我们在执行那种文件,而shell却不会搞错,其实这个识别过程也是 execve() 的功劳

execve()在执行程序时首先要读出文件的前128个字节,用以分析文件的类别,以便用适当的方式执行这个文件;

比如:shell脚本文件的前两个字符是"#!",这一点在手册中有明确说明;ELF文件的前四个字符是:0x45 0x4c 0x46 0x7c等,还有其它不同的可执行格式,这个过程其实还是比较复杂的,但是和shell变量毫无关系,所以不在本文讨论的范围内。

一个打印环境变量的C程序

  • 该程序只是验证传递给子进程的环境变量不包括普通shell变量
  • 源代码,文件名:print_env.c
#include<stdio.h>

extern char **environ;

int main() {
    int i;

    for (i = 0; environ[i]; i++)
        printf("*%s\n", environ[i]);

    return 0;
}
           
  • 编译执行
$ gcc print_env.c -o print_env 
$ ./print_env            
  • 本程序打印出的环境变量与printenv命令打印出的结果一致

跟踪程序的执行

  • 用"strace ./print_env"命令可以清楚地看到环境变量被传递给了程序print_env
bash的环境变量和shell变量

图7:跟踪程序print_env

  • 我们先用"printenv|wc -l"打印出环境变量的数量,然后我们看到有相同数量的变量被传递给了我们的程序print_env

环境变量对启动程序的影响

  • 上面这个小程序我们在运行时是使用"./print_env"的方式运行的,其中"./"表示当前路径,但是这个程序其实就在当前目录下,我们为什么一定要指定路径呢?我们试一下不指定路径会怎样;
bash的环境变量和shell变量

图8:命令执行失败

  • 这是因为shell是沿着环境变量PATH的顺序来查找命令文件的,而当前目录./并不在当前的PATH中,我们可以试着把./加入到环境变量PATH中,然后再运行一下试试;
bash的环境变量和shell变量

图9:执行print_env成功

  • 正如我们所期待的,执行成功了。

子进程中无法修改父进程环境的环境变量

  • shell传递给程序的环境仅仅是父进程环境的一个副本,所以我们在程序中改变这个副本中的变量是无法改变父进程的环境的,当程序运行结束时,这个环境副本将被销毁;
  • 下面这个例子我们首先在shell下定义一个环境变量ENV_VAR_1,然后编写一个脚本修改这个环境变量,在脚本退出后我们再次打印这个环境变量;

脚本文件名为:chg_envvar.sh,脚本的代码如下:

#!/bin/bash

echo "Print environment variable - ENV_VAR_1"
printenv ENV_VAR_1
echo "Change ENV_VAR_1 to 'second_value'"
ENV_VAR_1="second value"
echo "Again, print environment variable - ENV_VAR_1"
printenv ENV_VAR_1

exit 0           
  • 下面我们完成这个测试
$ chmod +x chg_envvar.sh
$ export ENV_VAR_1="first value"
$ printenv ENV_VAR_1
first value
$ ./chg_envvar.sh
Print environment variable - ENV_VAR_1
first value
Change ENV_VAR_1 to 'second_value'
Again, print environment variable - ENV_VAR_1
second value
$ printenv ENV_VAR_1
first value
$
           
  • 我们看到,在脚本内部执行"printenv ENV_VAR_1"时,打印出来的结果已经是"second value",说明我们已经修改成功了这个环境变量的值,但当脚本退出,我们再次打印这个变量时,其值仍然是"first value",并没有改变,这说明我们在子进程中对环境的修改并不能影响到父进程。

5. 在当前环境下运行程序

  • 我们在前面一再强调,shell在执行一个程序的时候会先fork一个子进程,然后在子进程中执行程序,这实际上是shell为执行一个程序新建立了一个环境,然后在这个环境中执行程序,当然这个新环境继承了父进程的环境;
  • 其实,shell也可以不fork一个子进程,而是直接在当前进程下执行你的程序,shell下有一个内建命令source就是为此而设计的,我们先来看看这个命令的手册
bash的环境变量和shell变量

图10:source命令的help手册

  • 说明已经很清楚了,要说明的是source命令只能执行脚本文件
  • 我们提出的问题是,既然source命令是在当前shell下执行程序,那是不是意味着上面那个改变环境变量的脚本文件可以改变当前shell下的环境变量了呢?我们执行一下试试
  • 我们在前面执行脚本时使用的命令是:./chg_envvar.sh,我们已经解释过"./"的含义以及为什么要有"./",这次我们执行这个脚本准备用". ./chg_envvar.sh"来执行,只是在原来命令的前面多了". ",点后面有个空格,其实这个"."就等同于source,所以这个命令就相当于"source ./chg_envvar.sh";
$ . ./chg_envvar.sh           
  • 当我们用这种方法执行这个脚本的时候,我们发现意外出现了,整个shell都退出了,这是为什么呢?

这是因为在我们的脚本的最后一行有一个"exit 0"语句,正常情况下,如果我们不使用source去运行时,exit会退出shell为这个脚本建立的子进程,所以一点问题都没有;

但是当用source去运行这个脚本时,没有建立子进程,那么退出的就是当前shell进程,所以你的shell就没有了,因为被你运行的脚本退出了;

如果我们不使用exit而使用return退出确实是可以解决在使用source命令运行的问题,但是不使用source运行就要出问题了,大家自己可以试一下;

那么是不是可以不写exit和return呢?当然可以,但是这不是写shell脚本的好习惯,因为执行完你的脚本后,可能还要执行下一个脚本,而下一个脚本可能要判断你的这个脚本的返回值,所以在写脚本时返回一个有意义的值是非常良好的习惯;

其实我们修改一下这个脚本就可以解决这个问题,这里仅提供源码,解释超出了本文涉及的内容

$ cat chg_envvar.sh 
#!/bin/bash

echo "Print environment variable - ENV_VAR_1"
printenv ENV_VAR_1
echo "Change ENV_VAR_1 to 'second_value'"
ENV_VAR_1="second value"
echo "Again, print environment variable - ENV_VAR_1"
printenv ENV_VAR_1

if [ $0 != "$BASH_SOURCE" ]; then
    return 0
else
    exit 0
fi
$            

用这种方法,也可以让某些必须用source运行的程序如果没有在source下运行,可以给出提示并停止运行。

  • 现在回到正题,这个脚本能不能改变当前shell下的环境变量呢?答案是肯定的。
$ export ENV_VAR_1="first value"
$ printenv ENV_VAR_1
first value
$ source ./chg_envvar.sh 
Print environment variable - ENV_VAR_1
first value
Change ENV_VAR_1 to 'second_value'
Again, print environment variable - ENV_VAR_1
second value
$ printenv ENV_VAR_1
second value
$            
  • 很显然,脚本chg_envvar.sh运行完毕后,我们发现,环境变量ENV_VAR_1已经发生了改变;
  • 实际上这种方法是一种常用的方法,常被用于改变当前环境

在嵌入式开发中,不同的开发板使用的CPU可能不同,这样在交叉编译时的工具链也不同,不同的开发板即便是相同的CPU也可能使用不同的工具链进行编译,比如即便是相同的CPU可能有些需要用软浮点的编译器,有些使用硬浮点的编译器,这时我们可以用上面的方法为每一个交叉编译的工具链写一个脚本,脚本中为某个指定的工具链所需的环境,然后用source去运行,下面是我的环境下的一个例子

$ cat a8.sh
#!/bin/bash
#A8 arm-linux-gnueabi工具链
export PATH=/home/whowin/toolschain/4.5.1/bin:$PATH
$            

6. 结语

  • 启动终端程序时启动了bash进程,使我们可以在shell下输入命令;
  • 环境变量也是shell变量,但又与shell变量略有不同;
  • 环境变量与普通shell变量的主要区别是环境变量会传递给新建的子进程;
  • 环境变量和普通shell变量之间可以使用export或declare进行转换;
  • shell可以在当前进程下运行脚本程序(不创建子进程),这种运行方式常被用于改变当前运行环境下的环境变量。

欢迎访问我的博客:

https://whowin.gitee.io/