Python 语言基本语法元素
前言
上一节,我们学习【Python开发环境的搭建】,知道什么了是程序设计语言,了解了 Python 语言的发展及特点,并进行 Python 开发环境的搭建以及 Python 集成开发环境 PyCharm 的安装及模板设置. 本节我们将学习【Python 语言的基本语法元素】。包括 Python 程序的格式框架,语法元素名称,数据类型和语句元素以及基本的输入输出函数。
一、程序的格式框架
程序的格式框架,即段落格式,是Python
语法的一部分,可以提高代码的可读性和可维护性。
1.缩进
Python 语言采用严格的缩进来表示程序逻辑。也就是我们所说的 Python 程序间的包含与层次关系。一般代码不要求缩进,顶行编写且不留空白。在if、while、for、def、class
等保留字所在完整语句后通过英文的“:
”结尾并在之后行进行缩进,表明后续代码与紧邻无缩进语句的所属关系。
缩进可以用Tab
键实现,也可以用多个空格实现(一般是4个空格
),但两者不能混用。建议采用 4 个空格方式书写代码。
当程序执行时,产生了“unexpected indent
”错误,说明代码中出现了缩进不匹配的问题。
2.注释
注释是代码中的辅助性文字,会被编译器或解释器略去,不被计算机执行,一般用于程序员对代码的说明。Python 语言中使用“#
”表示一行注释的开始。注释可以在一行中任意位置通过“#
”开始,其后面的本行内容被当作注释,而之前的内容依然是 Python 执行程序的一部分。
注释的作用:
注释一般用于在代码中标明作者和版权信息
解释代码原理和用途
通过注释单行代码辅助程序调试。
3.续行符
Python 程序是逐行编写的,每行代码长度并无限制,但从程序员角度,单行代码太长并不利于阅读。这个时候就可以使用续行符将单行代码分割为多行表达。
Python 中的续行符为“\
”。续行符之后不允许再存在空格,即续行符后直接换行。
二、语法元素的名称
Python 语言的基本单位是单词,少部分单词是 Python 语言规定的,被称为保留字。大部分单词是用户自己定义的,通过命名过程形成了变量或函数,用来代表数据或代码,称为标识符。
1.变量
变量是保存和表示数据值的一种语法元素,变量的值是可以改变的,通过赋值运算符“=
”方式被修改。Python 语言中,变量可以随时命名、随时赋值、随时使用。
由三部分组成:
多次赋值后将指向新的空间
2.保留字
保留字也称 keyword 关键字,被编程语言内部定义并保留使用的,每种程序设计语言都有一套保留字,保留字一般用来构成程序的整体框架,Python3.x
中一共有 35 个保留字。
Python3.x 中的 35 个保留字
Python 二级考试涉及到的保留字一共有 22 个。选学 5 个:None、finally、lambda、pass、with。
Python 中的保留字也是大小写敏感的。举例:True
为保留字,而true
则不是保留字。
3.标识符
标识符可以简单的理解为一个名字,主要用来标识变量、函数、类、模块和其他对象的名称。
标识符的命名规则- 字母、数字、下划线- 不能以数字开头- 不能是 Python 中的保留字 - 只允许使用ISO-Latin(ISO-8859-1)
字符集中的A-Z
和a-z
- 允许使用中文,但不建议
注意:标识符对大小写敏感,
name
和Name
是两个不同的名字。
三、数据类型
1.二进制与字符编码
二进制是一套计数方法,每个位置上的数有 2 种可能(0 - 1);二进制是计算机的执行语言,但是早在计算机出现前就存在这套计数方法,最早可追溯到古埃及。在日常生活中,我们使用的是十进制,每个位置上的数有 10 种可能(0 - 9)。
早期的程序员爸爸为了让计算机能够认识我,将我能够认识的符号和数字对应好,然后做成一张表叫ASCII
表,告诉计算机某种符号你应该使用哪个整数表示,A
使用了 8 个位(置)才能装得下我,在计算机中他们叫一个字节。
ASCII 码使用指定的 7 位或 8 位二进制数组合来表示 128 或 256 种可能的字符。标准 ASCII 码也叫基础 ASCII 码,使用 7 位二进制数来表示所有的大写和小写字母,数字 0 到 9、标点符号, 以及在美式英语中使用的特殊控制字符。其中:
0~31 及 127(共 33 个)是控制字符或通信专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(振铃)等;通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII 值为 8、9、10 和 13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。
32~126(共 95 个)是字符(32sp 是空格),其中 48~57 为 0 到 9 十个阿拉伯数字;
65~90 为 26 个大写英文字母,97~122 号为 26 个小写英文字母,其余为一些标点符号、运算符号等。
同时还要注意,在标准 ASCII 中,其 最高位(b7) 用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中 1 的个数必须是奇数,若非奇数,则在最高位 b7 添 1;偶校验规定:正确的代码一个字节中 1 的个数必须是偶数,若非偶数,则在最高位 b7 添 1。
后 128 个称为扩展 ASCII 码,目前许多基于 x86 的系统都支持使用扩展(或“高”)ASCII。扩展 ASCII 码允许将每个字符的第 8 位用于确定附加的 128 个特殊符号字符、外来语字母和图形符号。
ASCII 码表
ASCII 码表字符解释
2.数值类型
Python 提供的 3 种数值类型:整数类型:与数学中的整数一致,包含正、负、0。一个整数有二进制、八进制、十进制、十六进制 4 种表示方式。
浮点数类型:与数学中的小数一致,没有取值范围限制,可正、可负。有两种表示形式,一种是小数点的形式,另外一种是科学计数法。浮点数只有十进制形式。
复数:与数学中的复数一致,采用a+bj
的形式表示,存在实部和虚部。
3.字符串类型
计算机经常处理文本信息,文本信息在程序中使用字符串类型表示。在 Python 中使用单引号或双引号括起来的一个或多个字符来表示。单引号和双引号的作用相同。
字符序列有两种序号体系:正向递增序号: 有效范围为[0,N-1],其中 N 为字符串中字符的个数。最左侧的字符序号为 0,依次向右递增,最右侧字符序号为 N-1。
反向递减序号:有效范围为[-1,-N],其中 N 为字符串中字符的个数。最右侧的字符序与为-1,依次向左递减,最左侧的字符序号为-N。
两种索引可以同时使用,以下代码为对单个字符进行的索引。
还可以采用[N:M]
格式获取字符串的子串,这种操作被称为切片操作。[N:M]
获取字符串中从N
到M
(但不包含M
)的连续的子字符串。N
和M
都表示的是索引序号,可以混合使用正向递增序号和反向递减序号。
通过 Python 默认提供的 len()函数获取字符串的长度,一个中文字符和一个英文字符的长度都记为 1。
四、程序的语句元素
1.表达式
产生或计算新数据值的代码片段称为表达式。类似于数学中的公式,一般由数据和操作符构成。
2.赋值语句
对变量进行赋值的一行代码被称为赋值语句。在 Python 中使用一个“=
”表示“赋值”,即将等号右侧表达式计算后的结果值赋给左侧的变量。基本赋值语句语法:变量 = 表达式
同步赋值语句就是同时给多个变量进行赋值。同步赋值语句语法:
变量1,变量2,......变量N=表达式1,表达式2,......,表达式N
同步赋值语句应用最多的就是互换变量的值。即交换两个变量的值。
3.引用
Python 程序会经常使用到当前程序之外已有的功能代码,这个过程叫引用。
Python 语言中使用import
这个保留字引用当前程序以外的功能库。import <功能库名称>
引用功能库之后使用 功能库.函数名()
的方式调用基本功能,这种方式简称为“A.B()
”方式。
4.其他语句
除了赋值语句之外,Python 还有分支语句和循环语句。先简单介绍一下使用,后面后详细讲解。
分支语句:根据判断条件选择程序执行路径。一般包含单分支结构、双分支结构和多分支结构。单分支语法结构:
任何能够产生 True 或 False 的语句都可以作为条件,当条件为 True 时,则执行语句块中的内容。
双分支语法结构:
当条件为True
时,执行语句块 1,当条件为False
时,执行语句块 2。其中if...else
都是保留字。
循环结构与分支结构一样都是程序控制语句,它的作用是根据判断条件确定一个程序是否再执行一次或者多次。
条件循环的语法结构:
当条件为True
时,执行语句块 1,然后再次判断条件,当条件为False
时,退出循环,执行语句块 2。
五、基本输入输出函数
1.input( )函数
input()
函数是从控制台获得用户的一行输入,无论用户输入什么内容,input()
函数都以字符串类型返回。input()
函数可以包含一些提示性文字,用来提示用户。
input 语法格式:变量=input('提示性文字')
无论用户输入的是数字还是字符,input()
函数统一按照字符串类型输出,为了后续能够操作用户输入的信息,需要将输入指定一个变量进行存储。
input()
函数的提示性文字不是必须的,可写可不写。
2.eval( )函数
eval(s)
函数将去掉字符串s
最外侧的引号,并按照 Python 语句方式执行去掉引号后的字符内容。
eavl 语法格式:变量 = eval(字符串)
变量用来保存对字符串内存进行 Python 运算的结果。
eval()
函数去掉了字符串’1.2
’最外侧的引号,结果赋值给a
,所以a
的类型为float
类型。eval()
函数去掉了字符串’1.2+3.4’
最外侧的引号,对其内容当作 Python 语句进行运算,运算的结果为4.6
,保存到变量 a 中,所以 a 的类型是float
类型。
当eval()
函数处理字符串’python
’时,字符串去掉了两边的引号,Python 语句将其解释为一个变量,由于这个变量在之前别有定义,因此解释器报错。如果定义变量python
并赋值为123
,再运行这个语句时就没有问题,如果输出为123
。
eval()
函数经常和input()
函数一起使用,用来获取用户输入的数字。
eval()
与input()
函数一起使用的语法:变量=eval(input(提示性文字))
q
用户输入的数字、包括小数和负数,input()
解析为字符串,再由eval()
去掉字符串引号,将被直接解析为数字保存到变量中。
3.print()函数
print()
函数用于输出运算结果。
sep=' '
分隔符,默认为一个空格end='\n'
结束符,默认以换行结束
print()
函数的三种用法:
1.仅用于输出字符串或单个变量print(待输出字符串或变量)
对于字符串,print()
函数输出后将出掉两侧引号,对于其它类型,则会直接输出。
当print()
输出字符串表示时,字符串统一使用单引号表达。在[]
中的字符串都使用了双引号,但是在被print()
函数打印输出时,输出结果都采用了单引号。
2.用于输出一个或多个变量 ,输出后的各变量之间用一个空格分隔。print(变量1,变量2,......,变量N)
3.用于混合输出字符串与变量的值,其中输出字符串模板中使用{}表示一个槽位,每个槽位对应.format()
中的一个变量。print(输出字符串模板.format(变量1,变量2,......,变量N))
print()
函数输出的输出内容
print()
函数输出的目的地
‘整数{}和整数{}的差是:{}
’是输出字符串模板,也就是混合字符串输出的样式,大括号{}
表示一个槽位,括号中的内容由后面紧跟着的format()
方法中的参数按顺序填充。
六、转义字符与原字符
1.转义字符
就是反斜杠+想要实现的转义功能首字母。
为什么需要转义字符?当字符串中包含反斜杠、单引号和双引号等有特殊用途的字符时,必须使用反斜杠对这些字符进行转义(转换一个含义)。
反斜杠 :
\\
单引号:
\'
双引号:
\“
当字符串中包含换行、回车,水平制表符或退格等无法直接表示的特殊字符时,也可以使用转义字符当字符串中包含换行、回车,水平制表符或退格等无法直接表示的特殊字符时,也可以使用转义字符。
换行:
\n
回车:
\r
水平制表符 :
\t
退格 :
\b
2.原字符
原字符:不希望字符串中的转义字符起作用,就使用原字符,就是在字符创之前加上
注意事项,最后一个字符不能是反斜线
七、总结
Python 语言的基本语法元素:包括 Python 程序的格式框架,语法元素名称,数据类型和语句元素以及基本的输入输出和转义字符。
版权声明: 本文为 InfoQ 作者【是阿伟啊】的原创文章。
原文链接:【http://xie.infoq.cn/article/4c44917f3680a1baee328b5c9】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论