-
- ASCII预备知识
- 打印ASCII码表
- 最终的成果
到现在为止,我们已经学习了三种基本数据类型char/int/float、变量定义及赋值、使用printf()函数进行输出、条件表达式以及循环语句。基于这些基础知识,我们已经完全有能力做点有意思的事情了,比如输出ASCII表,同时更进一步探讨一些细节知识。
ASCII预备知识
ASCII码使用指定的7位或8位二进制数组合来表示128或256种可能的字符。
标准ASCII 码也叫基础ASCII码,使用7位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号, 以及在美式英语中使用的特殊控制字符。其中:
- 0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回-车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。
- 32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。
- 65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。
- 后128个称为扩展ASCII码。许多基于x86的系统都支持使用扩展(或“高”)ASCII。扩展ASCII 码允许将每个字符的第8位用于确定附加的128个特殊符号字符、外来语字母和图形符号。
打印ASCII码表
由ASCII码基础知识我们可以得知,表中有128或256种可能的字符,这些编码从0开始,其中存在一些控制字符,这些字符是不可打印的,也就是说使用printf()函数打印后在屏幕上不可见。另外后128个ASCII码属于扩展编码,我们的程序先不予考虑,因此,我们最终只输出前128个编码即可。面对同样的事情做128次,首先循环语句上阵,下面这是最简单的第一版。
#include <stdio.h>
int main()
{
for ( int i = ; i < ; i += )
{
printf( "%c ", i );
}
printf( "\n" );
return ;
}
这里的for循环是从0开始(我们以前的练习是从1开始的),条件表达式为i<128,代表总共输出128个字符。在循环体中我们以”%c”控制符打印数值对应的ASCII码。程序运行结果图如下,这看起来有些杂乱无章。此外,你也需要注意到这些情况:我们在循环体中并没有输出换行符,但第一行在输出一些字符后换行了;我们无法有效的使用它查询信息,比如说字母’X’对应的数值是多少?也就是说程序没有太多的实用性。最后,你可能会听到“叮咚”一声铃响。我们先把程序改进一些,让输出变得美观一些,然后再来解释这些现象,下面是我们改进后的第2版。
#include <stdio.h>
int main()
{
printf( "DEC\t HEX\t CHR\n" );
printf( "--------------------\n" );
for ( int i = ; i < ; i += )
{
printf( "%d\t %x\t %c\n", i, i, i );
}
return ;
}
这一版的程序中,我们首先使用printf()打印了一个表头,该表格有三列,分别用于显示当前数值的十进制,十六进制以及字符表示。我们使用\t水平制表符控制表格列之间的间距,\t后面多出一个空格,只是为了使代码看起来更清晰。在循环体中,由于printf()函数使用了三个控制字符,因此需要将当前数值传值三次。看一下运行结果图,感觉还不错。你也留意到了在CHR一列,有些数值没有对应的字符,这些可以称为不可见字符。同时还要注意第10行与第11行之间多了一个空行,这是为什么呢?
查阅一下ASCII码表,我们会发现数值10代表换行控制符。当以%c格式符打印数值10时,相当于执行了一次换行操作,而在循环体中使用printf()输出字符时又追了一个\n,因此中间多出了一个空行。同时ASCII码值为7的控制字符代表响铃,其转义字符用’\a’表示,这就是你能听到“叮咚”一声响的原因。你可以使用下面两行响铃代码测试一下。
// 响铃: 虽然程序要求响铃两次,事实上只会发生一次。
// 可以认为是输出太快而响铃太慢,当第一次响铃时,两次printf()已经完成。
printf( "\a" );
printf( "%c", );
如果你想听到两次响铃声,可以在这两行代码中设置断点,当第一个printf()执行后,响铃开始,铃声结束后,再执行下一条语句就可以了。现在继续回到主线任务,这一版的程序已经相当友好了,只是假设控制台是一张纸,这样的显示有些太浪费了,毕竟右边空白了那么多,我们完全可以按两列输出。
#include <stdio.h>
int main()
{
printf( "DEC\t HEX\t CHR\t\t DEC\t HEX\t CHR\n" );
printf( "----------------------------------------------------\n" );
for ( int i = ; i < ; i += )
{
printf( "%d\t %x\t %c\t\t ", i, i, i );
printf( "%d\t %x\t %c\n", i+, i+, i+ );
}
printf( "\n" );
return ;
}
看一下输出效果,由于数值10按%c输出时的缘故,程序进行了换行操作,导致下一个输出错乱,这就是美中不足的地方。为此,我们可以使用if语句对数值10进行特殊处理,其它的保持不变。由于此时输出了两列,因此for语句中的变量递增变成了i+=2,而非i+=1。
现在我们尝试将其按三列输出,看看还会有什么问题。
#include <stdio.h>
int main()
{
printf( "DEC\tHEX\tCHR\t DEC\tHEX\tCHR\t DEC\tHEX\tCHR\n" );
printf( "--------------------------------------------------------------------\n" );
for ( int i = ; i < ; i += )
{
printf( "%d\t%x\t%c\t ", i, i, i );
printf( "%d\t%x\t%c\t ", i+, i+, i+ );
printf( "%d\t%x\t%c\n", i+, i+, i+ );
}
}
这次的输出前半部分显得太凌乱了!数值10/11/14并没有与列起始处对齐,同时数值12消失了!13居然在14的后面输出!先来解决10没有对齐到列的问题。再次查看一下ASCII码表,数值9代表的正是控制字符\t,也就是说当程序按”%c”格式输出数值9值,相当于增加了水平间距,这导致后面10的输出没有对齐。
为了解决这个问题,我们在按”%c”输出9时,把9替换为32,32对应的字符是空格,相当于消除的制表符自身的影响。同理,由于10的控制字符是\n,会引起换行操作,我们也将它替换空格字符。对于消失的数值12,相信你也有经验了,它是控制符换页的意思,我们也将它替换为空格即可。
最终的成果
#include <stdio.h>
int main()
{
int i;
int c1, c2;
printf( "DEC\tHEX\tCHR\t DEC\tHEX\tCHR\t DEC\tHEX\tCHR\n" );
printf( "--------------------------------------------------------------------\n" );
for ( i = ; i < ; i += )
{
// 表格有列,因此每行开头的索引为,,,....
if ( i != && i != )
{
c1 = i;
c2 = i + ;
}
else
{
if ( i == )
{
c1 = ; // 将制表符替换为空格
c2 = ; // 将换行符替换为空格
}
else if ( i == )
{
c1 = ; // 将换页符替换为空格
c2 = ; // 将回车符替换为空格
}
}
printf( "%d\t0x%x\t%c\t ", i, i, c1 );
printf( "%d\t0x%x\t%c\t ", i+, i+, c2 );
printf( "%d\t0x%x\t%c\n" , i+, i+, i+ );
}
return ;
}
程序定义了c1/c2两个变量用于特殊化第一列与第二列的控制字符的输出。同时,对于第二列16进制值的输出,加入了前导符0x标记。在循环体中,我们使用了if语句处理了上面分析中存在的特殊情况。第一个if语句描述了更多的通用情况,else子句则用于处理特殊情况。一般情况下更容易成立的条件优先处理是个较好的选择。
这个程序是目前我们编写的最复杂的程序,希望能达到巩固知识的目的。相信你现在也已经迫不急待的想要尝试一下。最后,你可以将控制台输出拖动到最后一行,你会发现程序输出了值为128的情况。等等,这是为什么?我们在for循环中指定的判断条件是i<128呀,尝试自己思考一下这个问题的所在。