C语言这么厉害,它自身又是用什么语言写的?
这是来自我的星球的一个提问:“C语言本身用什么语言写的?”
换个角度来问,其实是:C语言在运行之前,得编译才行,那C语言的编译器从哪里来? 用什么语言来写的?假如是用C语言本身来写的,究竟是先有蛋还是先有鸡?
1
我们假设世界上不存在任何编译器, 先从机器语言说起,看看怎样办。
机器语言可以直接被CPU执行,不需要编译器。
而后是汇编语言, 汇编语言尽管只是机器语言的助记符,但是也需要编译成机器语言才能执行,没办法只能用机器语言来写这第一个编译器了(以后就不用了)。
汇编语言的问题处理了,就往前迈进了一大步,这时候即可以用汇编语言去写C语言的编译器,我们说这是C编译器的老祖宗。
有了这个老祖宗,即可以编译任意的C语言程序了,那是不是可以用C语言本身写一个编译器?只需用老祖宗编译一下即可以了。
OK, 这么一层层上来,终于得到了一个用C语言写的编译器, 真是够麻烦的。
到这个时候,之前那个汇编写的C语言编译器即可以抛弃了。
当然,假如在C语言之前,已经出现了别的高级语言,例如Pascal,那即可以用Pascal来写一个C语言的编译器。
第一个Pascal的编译器据说使用Fortran写的。而做为第一个高级语言的Fortran,它的编译器应该是汇编语言写的。
2
关于编译器,这里边有个有趣的传说:
传说Unix 发明人之一的 Ken Thompson在贝尔试验室,大摇大摆的走到任何一台Unix机器前,输入自己的客户名和密码,就能以root的方式登录!
贝尔试验室人才辈出,另外少量大牛发誓要把这个漏洞找出来,他们通读了Unix的C源码,终于找到了登录的后门, 清除后门以后编译Unix , 运行, 可是Thompson 还是能够登录进去。
有人觉得可能是编译器中有问题,在编译Unix的时候植入了后门, 于是他们又用C语言重新写了一个编译器,用新的编译器再次编译了Unix, 这下总算天下太平了吧。
可是依然不论用, Thompson 仍然可以用root登录,真是让人崩溃 !
后来Thompson 本人解开了秘密,是第一个C 语言编译器有问题, 这个编译器在编译Unix源码的时候,当然会植入后门, 这还不够,更牛的是,假如你用C 语言写了一个新编译器,一定也需要编译成二进制代码啊,用什么来编译,只有用Thompson写的那第一个编译器来编译,好了, 你写的这个编译器就会被污染了,你的编译器再去编译Unix , 也会植入后门 🙂
说到这里我就想起了几年前的XcodeGhost 事件,简单来说就是在Xcode(非官方渠道下载的)中植入了木马,这样XCode编译出的ios app都被污染了,这些app即可以被黑客利用做非法之事。
尽管这个XCodeGhost和Thompson的后面相比差得远,但是提示我们,下载软件的时候要走正规渠道,从官方网站下载,认准网站的HTTPS标准,甚至可以验证一下checksum。
想要成为一个优秀的、有能力程序员,做软件开发的话,就来学习C/C++吧,而且学习编程的话有一个学习的氛围跟交流圈子特别重要!这里我推荐一个C语言C++交流,–87;09;后6。32;51,不论你是大牛还是小白,大家都一起成长进步。
3
可能有人问:我用汇编写一段Hello World都很麻烦,居然有人可以用它写复杂的编译器?这可能吗?
当然可能,在开发第一代Unix的时候,连C语言都没有, Ken Thompson 和 Dennis Ritchie 可是用汇编一行行把Unix敲出来的。 WPS第一版是求伯君用汇编写出来的, Turbo Pascal 的编译器也是Anders 用汇编写出来的,大神们的能力不是普通人能想象得到的。
对于编译器来说,还可以采用“滚雪球”的方式来开发:
还是以C语言为例,第一个版本可以先选择C语言的一个子集,例如只支持基本的数据类型,流程控制语句,函数调用…… 我们把这个子集称为C0。
而后用汇编语言写个编译器,只搞定这个语言的子集C0,这样写起来就容易不少。
C0这个语言可以工作了,而后我们扩展这个子集,例如增加struct,指针…… ,把新的语言称为C1。
那C1这个语言的编译器由谁来写? 自然是C0。
等到C1可以工作了,再次扩展语言特性,用C1写编译器,得到C2。
而后是C3, C4…… 最后得到完整的C语言。
这个过程被称为bootstraping , 中文叫做自举。
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » C语言这么厉害,它自身又是用什么语言写的?