码迷,mamicode.com
首页 > 编程语言 > 详细

程序设计语言

时间:2015-07-23 00:47:01      阅读:568      评论:0      收藏:0      [点我收藏+]

标签:

阅读指引

读懂此文,需要以下基础

1.        至少写过1000行的代码。

2.        汇编基础(静态数据段,代码段,堆栈段)

有以下或者类似知识就更好了

1.        C语言编译,C++对象模型,MFC反射的实现。

2.        JAVA的动态编译器原理,

3.        使用过javascriptPythonPHP:经历过其代码和类型在运行时的自由性

4.        计算机组成原理

—— 一些问题

1.        程序设计语言的目的是什么?

2.        为什么大多数语言有控制流?逐行执行+跳转。这与我们的需求差很远(例如一个教务管理系统。)

3.        为什么类型申明在C语言中要与控制流隔离开来?

4.        现在主流语言最基本的元素是?

5.        有没有语言它的类型结构,在运行时也可以改变?

动态性?

什么是动态性?

1.        编译后确定了什么信息,之后不再改变。

2.        运行时可以改变、添加什么。

3.        运行时是否保存着类型信息。

程序中的信息分为几类?

1.        数据信息

a)       编译时Meta-Data元数据(类型框架,空间占用)

b)       运行时Meta-Data元数据(继承体系,用于new或者反射)(特别区别编译与运行的Meta-Data的不同。许多时候就是这里弄昏头了。)

c)        堆栈段中地址偏移(C++switch case中不能声明变量;共享内存)

d)       静态段中地址

2.        指令信息

a)       加载代码段(需要操作系统或者虚拟机支持,例如动态链接库,动态类加载,lisp语言自生成代码)

语言举例

汇编语言

汇编语言没有动态性吗?

没有。

首先,寄存器、数据段、堆栈、代码段完全由程序员控制。完完全全是写死了的。

然后,根据冯诺伊曼机的规则;取指令,执行,取指令,执行……

既然都有数据段了,还要堆栈段来做什么?这不是多余?

一开始本没有堆栈,直到60年代出现了module模块化,才有了堆栈。

汇编中的模块叫子程序,不过仍旧靠程序员全权控制。

堆栈和模块化的优点有?

1.        递归

2.        功能分离到模块,可复用

3.        封装作用域

堆栈和模块化的缺点有?

1.        时间上:保存现场、还原现场的代价(另,高级语言编译消除尾递归节约部分成本)

2.        空间上:爆栈的危险

C语言

C语言比起汇编多了什么东西?

1.        编译器

2.        表达式

3.        函数与模块{}(真·模块化)

4.        类型(原子类型、结构类型、数组、指针)

5.        头文件,库

总之,C语言并没有比汇编多了新的特性,它只是把汇编的繁琐操作抽象出来,让编译器完成,减轻程序员负担。

编译器的作用是?(减少程序员负担)

1.        解析表达式,控制流(汇编中指令总是1-3个操作数,而表达式可以多个操作数)

2.        模块和函数的抽象(完成堆栈中保存恢复现场的工作)

3.        类型变量的管理

a)       编译时Meta-Data(需要记住各个struct的成员,记住数组的长度;编译结束即丢弃。)

b)       计算出每个变量相对于该模块的偏移(一旦算出该偏移,将固定在执行码中,无法改变;就是说编译完成后,所有变量的偏移地址都固定下来了。

c)        对变量的存储进行管理(总共有多少变量,地址在哪,都是在编译时确定的;也就是说,可执行码中没有类型信息,只有地址,操作的字节数目。

4.        优化

编译出来的执行码与汇编的执行码有特征的区别吗?

没有。特别是在编译器优化之后。

无法通过执行码,区分汇编和C程序。

打个比方,一只程序猫在黑布笼子里,在里面喵喵的叫,无法通过它的叫声来判断它是汇编猫还是“C语言猫

从效率上来讲,C的多余代价在哪里?

1.        编译的时间

2.        模块的堆栈操作

总之,经过优化的C程序执行码与汇编效率几乎相同。

因为从理论上来说,C并没有引入运行时的新机制。

我理解的C语言只是一种汇编的宏而已。

 

C++语言(推荐《深度探索C++对象模型》)

C++语言比C语言多了什么?

1.        成员函数

2.        类型继承体系

3.        虚函数虚继承

4.        模板

5.        涉及到了多种编程范型(开始更抽象,语言逐渐开始脱离冯氏结构。)

其中,面向对象的思想,让程序与现实事物的关系更加紧密。

程序设计的负担,也因为OO与设计模式的流行,而变得轻松。

编程范型是什么?

就是一套指导思想行为准则。

(例如,C是过程式,Haskell是函数式,JAVA是面向对象,Python是简单的大杂烩,shell是调用命令的,lua是调用c程序的,PHP是写页面的,ProLog是线性逻辑推理的。

再例如,UML是描述规格specification的,XML是存储数据的。

再再例如,CSS是描述网页表现的,HTML是描述网页内容的。

javascript比较神奇,不敢说。)

C++有什么编程范型?

1.        过程式(使用STL的类C语言编程)

2.        ADT式(自定义抽象数据类型,继承;但是不用new,不用virtual;拷贝构造)

3.        面向对象式(使用new,使用virtual,需要指针或引用)

C++编译器是怎样实现的?

C++开始有一个叫做cfront的编译器,即把C++语言先翻译成C语言。

然后再用C编译器来编译,C的编译器并不知道此段代码是来自C++还是C

C++语言特性分别是怎样实现?简单说。

1.        成员变量:和C语言的struct 类似,最后也会被直接编译成地址偏移。

2.        成员函数:使用特殊函数名编码方案翻译成C函数,并添加this指针作参数。

3.        类型继承体系:通过C++编译时的Meta-Data来实现。即在编译时,编译器是知道类型信息与继承体系的,但是翻译成C语言后就丧失了此类型信息。

4.        虚函数虚继承:为了支持多态,这也是面向对象最重要的特性,使用了虚函数表和虚基类表。注意,运行时多态是通过运行时查表实现的。稍后详细说。

5.        模板:通过代码复制的方式实现。

C++编译器的准则与virtual机制?

1.        首先,C++的编译准则,希望做到与C一样的效率

a)       没有运行时调用间接性。任何数据在运行时都是一个地址直接就访问到。

b)       没有运行时的Meta-Data。无需通过Meta-Data来访问某个复杂的类层次。

c)        所有的数据都希望用Cstruct来实现,即在编译时就确定好对象及其成员地址。

2.        以上,在过程式范型,与ADT范型中都是成立的。

3.        但是,在面向对象范型中,却遇到问题:

a)       需要维系着同一个继承体系成员结构的一致性,只有这样,才能保证运行时的多态性。即能够通过同一个地址偏移,访问到父类或子类的相同数据成员、函数成员,而不在乎具体对象的类型。

b)       虚函数

i.          虚函数,运行时,每个有虚函数的类型(哪怕是子类)都维持着一个虚函数表,这已经是运行时的Meta-Data,通过查表,即可找到对象自己的虚函数。

ii.         例如下图中clone肯定是object.__vptr__Base->#3(),无论具体的对象。

iii.        技术分享

c)        多重继承

i.          如何处理后继的base基类?由编译器判断指针类型并加上相应的偏移

d)       虚继承

i.          添加一个虚基类指针,指向共享部分

ii.         技术分享

iii.        这样的缺点有两个

1.        虚基类的子类都要背负一个基类指针指向共享部分。如果继承了多个虚基类,还需要多个这样的指针。(Microsoft的解决方法是增加一个虚基类表,类似于虚函数表。)

2.        虚继承链条的增加,会导致间接访问的层次增加。例如两个菱形继承的串联。

头文件,库,源代码跨平台

1.        C++确实在源代码的层次是可能跨平台的。

2.        也可以通过相同的头文件去访问不同平台的库。

3.        但是,不同操作系统中的不同的API大大增加了跨平台的难度。

4.        跨平台的责任留给了程序员(充斥着大量宏的C++跨平台代码确实让人头疼。)

5.        编译器面对不同的系统也不敢作为,它只是负责编译源代码,链接。

如何使用C++才能保证其高效性能?

1.        虚函数,虚继承,拷贝构造,这些是有额外负担的。

2.        用一次虚函数,多了一次指针寻址的效率损失,并且相对于inline内联(另,inline是编译器优化的重头),还损失了保存和恢复现场的效率。

3.        用一次虚继承,也多一次指针寻址的效率损失。(另,虚基类没有成员变量没有虚函数的时候会被优化。这也是JAVA可以多重继承接口interface的原因。)

4.        不要使用virtual在复杂的多继承,深层次继承中。

5.        virtual编译时的Meta-Data需要处理更多,编译速度会较慢。

JAVA语言(推荐本地Java代码的静态编译和动态编译问题)

JAVA语言比C++语言多了什么?

1.        虚拟机

a)       跨平台

b)       动态编译

2.        没有指针

3.        没有类的多继承,有接口的多继承

4.        统一的库

从编译来说,JAVAC++迈出了一大步。它的跨平台特性和动态特性,为JAVA自己以及未来语言都提供了很多可能性。

虚拟机的好处有什么?

1.        跨平台:在OS与字节码间隔了一层。实现了程序员无负担的跨平台。

2.        动态编译:许多信息不必在编译后确定,为动态特性提供可能,稍后详细说。

JAVA编译执行的过程是怎样的?                        

1.        编译后产生一个基于堆栈的字节码

2.        JRE在不同的OS上提供支持

3.        起初的JRE是解释执行的,效率低下。

a)       获取待执行的下一个字节码。

b)       解码。

c)        从操作数堆栈获取所需的操作数。

d)       按照 JVM 规范执行操作。

e)       将结果写回堆栈。

JAVA是如何解决执行效率低下的问题呢?

使用JITJust-in-time)编译器进行动态编译。

技术分享

JIT是怎样运行的呢?如何解决了效率的问题?             

如上图:

1.        每次按照一个function来编译。转成中间表示,并优化其效率,再生成可执行码。

2.        编译器的编译线程和执行线程是分开的,应用程序不会等待编译的执行。

3.        分析框架Profiler会观察程序行为,对频繁执行的function进一步优化。(例如function内部对象维持一个池不必每次生成。)

动态编译的优点有什么?

可以根据程序的行为,优化其代码

1.        例如频繁执行的function——热方法

2.        例如arrayCopy方法,如果每次都拷贝大段内存,在指令集中有特别指令可以加速。

3.        例如类层次结构,多态的优化。(大多数虚调用都有其固定的一个目标,JIT因此生成的直接调用代码比虚表调用代码的效率会更高。)

动态编译的缺点有什么?

1.        大量的初始编译会影响程序启动时间。

2.        运行时候的编译,行为分析都需要花费时间。

3.        运行效率达到稳定需要时间。

4.        实时GUI型的程序不能忍受动态编译“GC”带来的延迟。

JAVA如何解决实时的需求?

使用AOTahead of time)编译器:预先编译成为可执行码。

AOT的缺点

对于一些动态特性的支持效率低下

1.        反射机制

2.        运行时类加载

JITAOT的对比

技术分享技术分享

总体来说,JAVA适合怎样的应用呢?

JAVA比较时候需要长期运行的应用,例如Web服务器,Daemon服务。

函数式语言

函数式语言通常有哪些呢?

1.        纯函数式语言

a)       Lisp

b)       Schema

c)        Haskell

d)       F#

2.        包含了函数式特性的语言

a)       Python

b)       Javascript

c)        JAVA

d)       C?

函数式语言有哪些特性?

1.        函数无副作用,只对输入输出有作用

2.        高阶函数,lamda演算。(这个像C函数指针,但是它是高阶的,即返回值可能也是函数)

3.        没有过程,类似规格说明的语法,更容易理解,自解释。

4.        基于list的编程,函数更通用。

5.        惰性计算(这个很像树形DP”

6.        有对应的数学形式化表达,有可能证明其正确性。(目标可能是保证程序没有bug。)

总的来说,函数式语言,向着更抽象迈了一大步,几乎与冯诺伊曼体系断绝了关系。

函数式语言的劣势?

1.        效率不高(因为其抽象,远离了冯诺伊曼体系)

2.        平台以及开发环境都比较简单。

3.        缺少推广,应用不广泛

逻辑程序设计

ProLog语言,线性逻辑。人工智能语言。没有接触过。

动态性有哪些呢?

1.        多态性:运行时根据具体对象来访问属于它的方法。(而不理会指针的类型。)

2.        反射:运行时维系着类型结构的Meta-Data

3.        运行时类加载:运行后再次加载新的数据类型和指令流。

4.        动态链接:OS根据按需链接库文件。

编译语言 和 解释语言

语言本身并没有编译类型或者解释类型。(例如:JAVA也可以静态编译后成可执行码。)

只有少数运行时特性是依赖于解释型的。(可能需要运行环境的支持。)

为什么解释语言都需要虚拟机或者运行环境支持?

动态编译,运行时Meta-Data的保存,这些功能对于每个程序都是一致的。

所以把它们分离开来,不必每个程序植入这些代码。

非脚本语言 和 脚本语言

脚本语言,我理解是负责调度其他代码的语言。

例如shell脚本(调用命令),lua(调用C)。

但是也不确定,例如Python

跨平台

跨平台分为哪些层次?

1.        源码跨平台(CC++,但是因为系统调用接口不同,程序员负担太大,但是汇编却不是。)

2.        执行码跨平台(JAVA,有些语言直接从源码解释执行,例如JavascriptPHP

 

发展历史(推荐《近看图灵碗 (. 从苏黎世到巴黎)》)

学术上有哪些实验性语言?

1.        Fortran

2.        ALGOL58

3.        ALGOL60

4.        Lisp

5.        smalltalk

常用语言

过程式:CALGOLDelphiPascal

面向对象式:C++smalltalkJAVA

函数式:LispSchemaHaskell

逻辑式:Prolog

脚本?PHPPythonRuby

结语

程序设计语言的目的是什么?

1.        控制数据

2.        控制指令流

为什么大多数语言有控制流?逐行执行+跳转。这与我们的需求差很远(例如一个教务管理系统。)

逐行执行的执行,很大程度是起源于冯诺依曼体系结构。

为什么类型申明在C语言中要与控制流隔离开来?

因为在编译时,具体的类型信息,要转化成地址偏移,然后替换控制流中的类型变量。

现在主流语言最基本的元素是?

是控制流 与 类型系统。

有没有语言它的类型结构,在运行时也可以改变?

Javascript可以运行时给某个类添加新的数据成员。

许多后来的语言在运行时都保存着类型信息的,例如PythonJAVA

 

 总结

控制流——指令流
类型系统——为了计算出变量地址信息
区分运行时的Meta-Data与编译时的Meta-Data

 


版权声明:本文为博主原创文章,未经博主允许不得转载。

程序设计语言

标签:

原文地址:http://blog.csdn.net/selfind/article/details/47011209

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!