Python基础学习二

Python基础学习二

Python基础学习二

1.编码

utf-8编码:自动将英文保存为1个字符,中文3个字符。ASCll编码被囊括在内。

unicode:将所有字符保存为2给字符,容纳了世界上所有的编码。

2.字符串内置函数

replace()函数:替换字符串内字符

str1="a1234"

str2=str1.replace("a","A") #将字符a替换为A

需要注意的是,在函数replace()的作用下,虽然修改了str1的内容,但是变量str1不变,其修改存储在str2中。

ord()函数:获取字符的utf-8编码的整数形式。

ord("A") #输出65

ord("中") #输出20013

chr()函数:将utf-8的整数形式转换为对应字符。

chr("67") #输出"C"

chr("25991") #输出"文"

encode()函数:获取字符对应编码方式的16进制形式。

"我".encode("utf-8") #输出b"xe6x88x91"

其中b表示以字节的方式存储,在utf-8编码中,中文有3个字节,转化为三个16进制数。

decode()函数:解码函数,将上述得到的数字按照对应的编码形式翻译为对应字符

b"xe6x88x91".decode("utf-8",errors="ignore") #输出"我"

其中errors="ignore"表示忽视错误字节,如输入四个字节时,默认读取前三个。

len()函数:用于计算字符串的长度或字节数

3.指定utf-8编码

为了确保解释器以utf-8编码读取文件,需要在文件开头写上两行注释


# !/usr/bin/env python3

# -*- coding: utf-8 -*-


第一行用于告诉Linux操作系统,这是Python文件,第二行说明文字编码方式。

4.变量输出

与C语言相同,用“%”获取,格式如下

"Today is %s , i have $" % ("good","10000")

格式 内容
%d 整数
%f 浮点数
%s 字符串
%x 16进制数
%% %

format()函数:用于传入参数


"Hello, {0}! You have ${1}".format("li",100000)