1. 前言
从语言的分类角度而言,C
是一种非常特殊的存在。
属于高级语言
范畴,但又具有低级语言
的直接访问硬件的能力,这也成就了C
语言的另类性,因保留有其原始特性,其语法并不象其它高级语言一样易理解,但处理能力却比其它语言高很多。
从语言的处理能力和速度而言,让人爱;从语法体系角度而言,对于学习者并不友好。
但对于专业开发者,建议学好C
语言,C
的底层特性对于理解其它语言的高级封装原理有很大的帮助。
本文将从一个简单的Hello world
C
程序开始,以此程序中出现的基础知识为导入点,深入探讨这些知识的底层逻辑
。
好!现在!开始C
之旅……
2. 基本结构语法
先从下面的Hello World
程序开始,逐一解释这几行代码中所包含的程序微观世界中的结构逻辑。
#include <iostream>
using namespace std;
int main(int argc, char** argv) {
cout<<"Hello World"<<endl;
return 0;
}
所谓“一叶而知秋”,上述的Hello World
程序虽然只是简单的寥寥几行代码,但是却完整地诠释了一个标准的C
程序所需要具备的基础逻辑结构。
几行代码和多行代码的程序的区别在于所要实现的功能不同,其核心的组织结构都有同工异曲之地。 当规模较大时,程序结构无非在遵循基本结构的主导思想上进行分、再分、继续分…… 如同一个大家庭分成几个小家庭,但每一个家庭的基本结构相似。
2.1 预处理指令
Hello World
程序中的第一行代码:
#include <iostream>
语法解释:
#
是C
预处理指令标识符号,表示后面紧跟着的是预处理指令
。- 不同的
预处理指令
有不同的功能。
预处理指令
在编写C
程序时是否是必须的?
答案:不是必须,那么什么时候需要预处理指令
?
要了解什么时候需要添加预处理指令
,则需要理解此行代码的语法用意。
高级语言
与 机品语言
的区别之一是
高级语言会提供大量的已经编好的功能代码,这些功能性代码统称为
API(应用程序调用接口)`。
对于不同语言而讲,其提供的名称略有不同,如 JAVA
中以类库方式提供,PYTHON
语言中以模块方式提供,C
则是以头文件方式提供……其本质一样。
编写程序时,如果需要用到语言提供的功能代码时,则需要遵循不同语言的调用语法导入后方能使用。
#include
指令的作用:指定程序中需要包含的头文件。欲在程序中使用C
提供的API
,因API
庞大繁复,C
对其API
以分类方式存储在不同的文件中,这些文件称为 头文件
,#include
后需要指定 头文件
名称。
理论上讲,在程序中可以不使用
#include
指令。但在实际程序中几乎是不可能的,否则,并不能发挥高级语言的优势,请直接使用机器语言便可。
#include
语法
include
是一个导入或包含头文件的指令,还有另一个语义,默认情况下,C
运行系统会建立一个名为include
的目录,存放所有的自带头文件
。此目录也称为预定义目录。
#include <头文件名>
在导入C
语言的头文件名时,需要指定头文件的扩展名h
,导入c
标准中的头文件时,可以不指定扩展名。
//导入 C 语言的头文件需要指定扩展名
#include <stdio.h>
//导入 C 标准中的头文件时可以不指定扩展名
#include <iostream>
#include
还有另外一种使用语法:
#include "头文件名"
使用双引号和使用尖括号包含头文件的区别:
- 使用
#include <文件名>
指令时,编译器会直接从include
目录中查找对应的头文件。 - 使用
#include "文件名"
指令时,则是先在当前文件所在的目录搜索,没有则到Include
目录里去找对应的文件。
在导入系统提供的头文件时,建议使用尖括号 。 在导入自定义头文件时,建议使用双引号。
在Hello World
程序中,导入了iostream
文件,则意味着程序需要iostream
文件中提供的API
,那么又是什么?有什么作用?
这个问题稍后回答。
2.2 主函数
C
是面向过程的编程语言,所谓过程指代码以函数为基本单位进行组织,当然,函数还有更多特性,关于函数的细节,另行文再聊。
这里聊聊主函数的功能和语法结构。
代码语言:javascript复制int main(int argc, char** argv) {
//自己的代码
return 0;
}
主函数功能描述:
- 主函数是整个程序的入口。当执行程序时,
C
运行系统会查找程序中是否有一个符合系统要求的主函数语法结构。 - 如果找到,则从此函数的第一行代码进行指令解析。
- 如果没有找到,则调用失败。
类似于要去某一个小区拜访朋友,首先第一步要找到小区的入口大门。 小区也许会有多个入口大门,但
C
只有主函数这么一个入口。
主函数的语法结构:
虽然上文的主函数中包含较多的组成元素,如返回类型、参数……因C
有向下兼容性。只要保证函数名为 main
其它元素都可以省略,对于C
运行系统而言,可以只认 main
函数名称 。
如下去头剔尾之后的主函数,C
运行系统依然认识。
main() {
//自己的代码
}
C
可理解为C
语言的plus
版本,C
在发展过程中,有很多标准,所以C
新标准都会向后兼容。 编写代码时,主函数尽可能遵循当前C
的新标准。
2.3 逻辑结构
麻雀虽小,五脏俱全
。Hello World
程序虽然看似简陋,但缩影了任何其它功能强大程序的基本逻辑结构。
无论程序的规模大小,程序的本质都是用来处理数据。从全局角度来讲,任何程序的逻辑结构都是如下几部分组件:
- 数据。可以说,程序开拔,数据先行,无数据无程序。数据的来源有多种,如已知数据、交互数据、外部存储设备中的数据、网络数据……对于
Hello World
程序而言,功能是输出Hello world
,Hello World
便是程序中的数据(已知数据)。 - 逻辑处理。
Hello World
程序只是演示程序,没有数据处理这一环节,但是在开发实际可用的程序时必须有数据处理环节,否则,吃进去又直接吐出来,是没有意义和营养的程序。 - 输出或展示数据。程序总是通过处理数据,生成结果数据。结果数据需要通过某一种途径告诉使用者,从而指导使用者的行为和认知。这便是输出的意义。
代码语言:javascript复制可以说,编写程序,就是如何掌控数据的轮回和重生。
cout<<"Hello World"<<endl;
如上代码,Hello World
数据的存在形态在C
语法中称为常量或字面值数据。
cout
是c
提供的专用于输出的指令,其包含在iostream
文件中,如此,应该明白为何要在程序的第一行添加:
#include <iostream>
cout
语法:
cout<<"数据";
cout
是一个输出指令,但其语义是指代一个标准的输出设备,其底层是以一个抽象名的方式连接到了一个具体的输出硬件设备资源,这个设备往往指的就是显示器。或称其为标准输出设备。
在 cout
和数据之间有一个<<
,这是一个重定向运算符,表示数据通过 <<
流向标准输出设备。
至于怎么流的,可能就要查阅源代码,其实现过程非一言二语能说清。
这也是高级语言的特性之一,屏蔽底层逻辑,让开发者只关注于自身的高级业务逻辑。
在使用 cout
指令时,还有一个命名空间的概念。再回头,查看上文最初给出的完整的Hello Wolrd
程序中,其中有一行代码:
using namespace std;
如果没有这一行代码,不好意思,cout
不能工作,或者说,根本找不到cout
。可以打开iostream
的源代码看一看。
#define _GLIBCXX_IOSTREAM 1
#pragma GCC system_header
#include <bits/c config.h>
#include <ostream>
#include <istream>
namespace std _GLIBCXX_VISIBILITY(default)
{
_GLIBCXX_BEGIN_NAMESPACE_VERSION
//@{
extern istream cin; /// Linked to standard input
extern ostream cout; /// Linked to standard output
extern ostream cerr; /// Linked to standard error (unbuffered)
extern ostream clog; /// Linked to standard error (buffered)
#ifdef _GLIBCXX_USE_WCHAR_T
extern wistream wcin; /// Linked to standard input
extern wostream wcout; /// Linked to standard output
extern wostream wcerr; /// Linked to standard error (unbuffered)
extern wostream wclog; /// Linked to standard error (buffered)
#endif
//@}
// For construction of filebuffers for cout, cin, cerr, clog et. al.
static ios_base::Init __ioinit;
_GLIBCXX_END_NAMESPACE_VERSION
} // namespace
#endif /* _GLIBCXX_IOSTREAM */
源代码中有一行:
代码语言:javascript复制namespace std _GLIBCXX_VISIBILITY(default)
C
引入了命名空间这一概念。
什么是命名空间?
就是起到一个逻辑分类的作用。
一个班上如果有
2
个同姓名的学生怎么办? 在姓名前面再添加一个标识就可以了,如大张三
,小张三
,这里的有大
和小
就类似于命名空间。 在C
可以使用命名空间作为附加信息来区分不同库中相同名称的函数、类、变量等。
也就是说为了避免其它的头文件中有 cout
,iosteam
为自己的cout
前面添加了前缀 std
。当然除了使用如下的语法。
using namespace std;
也可以直接在cout
前面添加 std
命名空间描述符。
#include <iostream>
int main(int argc, char** argv) {
std::cout<<"Hello World"<<std::endl;
return 0;
}
注意使用语法,命名空间后面有
::
。endl
是一个换行指令。也是定义在iostream
文件中的std
命名空间中。
3. 运行程序
遵循C
语法编写的代码称为源代码,源代码以标准扩展名cpp
的文件存储,称此文件为源代码文件。
Tip: 源代码文件的扩展名不一定是
cpp
。不同的平台上的C
扩展名可能不一样,如果扩展名不是cpp
,只要文件内容符合C
语法标准,此文件依然是C
源代码文件。
源代码并不能直接被计算机识别,需要请一个专业翻译员把源代码翻译成计算机能理解的二进制指令和数据,翻译后的代码称为目标代码。
翻译员在翻译时有 2
种可选的翻译模式:
- 解释模式:逐行翻译源代码。显然,其速度较慢,但易于调试和找出程序中的逻辑错误。
- 编译模式:把源代码一次性翻译成目标代码。显然,其速度较快。现代编译系统已经具备很好的调试功能。
所以,运行C
程序之前,需要安装C
运行系统,此系统中至少要包含C
提供的API
和翻译员,C
选择的编译模式。
安装
C
运行系统,最简单的方式直接安装类似于带有运行环境的dev-c IDE
开发工具。 如何安装,本文不做赘述。
编译器的执行流程:
- 编译成目标文件:检查源代码中是否存在语法错误,然后把源程序编译成扩展名为
obj
目标文件,目标文件并不是最终编译产物,也不能执行。 - 链接头文件:因程序中会使用到
C
的各种API
,会包含各种头文件,则需要将目标文件和各种必须的库(头文件的集合)链接在一起生成最终的可执行文件。 - 可执行文件:在
windows
平台中,可执行文件的扩展名为exe
,源代码被编译后的最终执行文件名默认为a.exe
。
本文使用dev-c
编辑和编译程序。
4.总结
本文从一个简单的C
程序入手,讲解C
程序的基本逻辑结构。程序虽小,却是所有可运行程序的缩影。
当然,规模不同,其要使用到的C
相关知识会更多,但全局宏观结构是相似的。