[Python工匠]输出① 变量与注释

文章列表

[Python工匠]输出① 变量与注释

变量（variable）是用来从内存找到某个东西的标记

#去掉s两边的空格，再处理
value = process(s.strip())

s = " hello World   "
value1 = len(s)
value2 = len(s.strip())print(value1)
print(value2)

#用户输入可能会有空格，使用strip()去掉空格
username = extract_username(input_string.strip())

user_input = input("What's your name ? ").strip()
print(input("What's your name ? "))
print(user_input)

1.1 基础知识

1.1.1 变量常见用法

>>
>>> author = 'Maxwell'
>>> print('Hello, {}!'.format(author))
Hello, Maxwell!
>>>

在一行语句里同时操作多个变量，比如调换两个变量所指向的值

>>>
>>> author,reader = 'Maxwell','Ray'
>>> author,reader = reader,author
>>> author
'Ray'
>>>

01．变量解包

变量解包（unpacking）是Python里的一种特殊赋值操作，允许我们把一个可迭代对象（比如列表）的所有成员，一次性赋值给多个变量：

# 注意：左侧变量的个数必须和待展开的列表长度相等，否则会报错。

>>>
>>> usernames = ['Maxwell', 'Ray']
>>> author, reader = usernames
>>> author
'Maxwell'
>>>

假如在赋值语句左侧添加小括号(...)，甚至可以一次展开多层嵌套数据：

>>>
>>> attrs = [1, ['maxwell', 100]]
>>> user_id, (username, score) = attrs
>>> user_id
1
>>> username
'maxwell'
>>>

Python还支持更灵活的动态解包语法。只要用星号表达式（*variables）作为变量名，它便会贪婪[插图]地捕获多个值对象，并将捕获到的内容作为列表赋值给variables。

>>>
>>> data = ['Maxwell', 'apple','orange','banana', 100]
>>> username, *fruits, score = data
>>> username
'Maxwell'
>>> fruits
['apple', 'orange', 'banana']
>>> score
100
>>>

和常规的切片赋值语句比起来，动态解包语法要直观许多：

#1. 动态解包
>>> username, *fruits, score = data
# 2. 切片赋值
>>> username, fruits, score = data[0], data[1:-1], data[-1]
# 两种变量赋值方式完全等价

>>>
>>>
>>> for username, score in [('Maxwell',100), ('Ray', 60)]:
...     print(username)
...
Maxwell
Ray
>>>

02．单下划线变量名_

在常用的诸多变量名中，单下划线_是比较特殊的一个。它常作为一个无意义的占位符出现在赋值语句中。_这个名字本身没什么特别之处，这算是大家约定俗成的一种用法。

举个例子，假如你想在解包赋值时忽略某些变量，就可以使用_作为变量名

#忽略展开时的第二个变量
>>> author, _ = usernames
# 忽略第一个和最后一个变量之间的所有变量
>>> username, *_, score = data

而在Python交互式命令行（直接执行python命令进入的交互环境）里，_变量还有一层特殊含义——默认保存我们输入的上个表达式的返回值：

>>>
>>> 'foo'.upper()
'FOO'
>>> print(_)
FOO
>>>

1.1.2 给变量注明类型

为了解决动态类型带来的可读性问题，最常见的办法就是在函数文档（docstring）里做文章。我们可以把每个函数参数的类型与说明全都写在函数文档里。

def remove_invalid(items):"""剔除 items 里面无效的元素:param items: 待剔除对象:type items: 包含整数的列表，[int, ...]"""

下面是给remove_invalid()函数添加类型注解后的样子：

from typing import Listdef remove_invalid(items: List[int]): ➊"""剔除 items 里面无效的元素"""... ...

❶List表示参数为列表类型，[int]表示里面的成员是整型

强烈建议在多人参与的中大型Python项目里，至少使用一种类型注解方案——Sphinx格式文档或官方类型注解都行。能直接看到变量类型的代码，总是会让人更安心。

1.1.3 变量命名原则

计算机科学领域只有两件难事：缓存失效和命名。——Phil Karlton

01．遵循PEP 8原则

给变量起名主要有两种流派：一是通过大小写界定单词的驼峰命名派CamelCase，二是通过下划线连接的蛇形命名派snake_case。这两种流派没有明显的优劣之分，似乎与个人喜好有关

ython制定了官方的编码风格指南：PEP 8。这份风格指南里有许多详细的风格建议，比如应该用4个空格缩进，每行不超过79个字符，等等。其中，当然也包含变量的命名规范：

· 对于普通变量，使用蛇形命名法，比如max_value；

· 对于常量，采用全大写字母，使用下划线连接，比如MAX_VALUE；

· 如果变量标记为“仅内部使用”，为其增加下划线前缀，比如_local_var；

· 当名字与Python关键字冲突时，在变量末尾追加下划线，比如class_。

除变量名以外，PEP 8中还有许多其他命名规范，比如类名应该使用驼峰风格（FooClass）、函数应该使用蛇形风格（bar_function），等等。给变量起名的第一条原则，就是一定要在格式上遵循以上规范。

PEP 8是Python编码风格的事实标准。“代码符合PEP 8规范”应该作为对Python程序员的基本要求之一。

02．描述性要强

#描述性弱的名字：看不懂在做什么
value = process(s.strip())
# 描述性强的名字：尝试从用户输入里解析出一个用户名
username = extract_username(input_string.strip())

表1-1 描述性弱和描述性强的变量名示例

03．要尽量短

中诀窍在于：为变量命名要结合代码情境和上下文。比如在上面的代码里，upgrade_to_level3(user)函数已经通过自己的名称、文档表明了其目的，那在函数内部，我们完全可以把how_many_points_needed_for_user_level3直接删减成level3_points。

04．要匹配类型

匹配布尔值类型的变量名

布尔值（bool）是一种很简单的类型，它只有两个可能的值：“是”（True）或“不是”（False）。

表1-2 布尔值变量名示例

匹配int/float类型的变量名

自然就会认定它们是int或float类型。这些名字可简单分为以下几种常见类型：

释义为数字的所有单词，比如port（端口号）、age（年龄）、radius（半径）等；
使用以_id结尾的单词，比如user_id、host_id；
使用以length/count开头或者结尾的单词，比如length_of_username、max_length、users_count。

匹配其他类型的变量名

字符串（str）、列表（list）、字典（dict）

05．超短命名

在众多变量名里，有一类非常特别，那就是只有一两个字母的短名字。这些短名字一般可分为两类，一类是那些大家约定俗成的短名字，比如：

· 数组索引三剑客i、j、k

· 某个整数n

· 某个字符串s

· 某个异常e

· 文件对象fp

其他技巧

除了上面这些规则外，下面再分享几个给变量命名的小技巧：

· 在同一段代码内，不要出现多个相似的变量名，比如同时使用users、users1、users3这种序列；

· 可以尝试换词来简化复合变量名，比如用is_special来代替is_not_normal；

· 如果你苦思冥想都想不出一个合适的名字，请打开GitHub[插图]，到其他人的开源项目里找找灵感吧！

1.1.4 注释基础知识

注释（comment）是代码非常重要的组成部分。通常来说，注释泛指那些不影响代码实际行为的文字，它们主要起额外说明作用。

Python里的注释主要分为两种，一种是最常见的代码内注释，通过在行首输入#号来表示：

#用户输入可能会有空格，使用strip去掉空格

username = extract_username(input_string.strip())

另一种注释则是我们前面看到过的函数（类）文档（docstring），这些文档也称接口注释（interface comment）。

class Person:"""人:param name: 姓名:param age: 年龄:param favorite_color: 最喜欢的颜色"""def __init__(self, name, age, favorite_color):self.name = nameself.age = ageself.favorite_color = favorite_color

接口注释有好几种流行的风格，比如Sphinx文档风格、Google风格等，其中Sphinx文档风格目前应用得最为广泛。上面的Person类的接口注释就属于Sphinx文档风格。

编程新手们常常会犯同类型的错误，以下是我整理的最常见的3种。

01．用注释屏蔽代码

#源码里有大段大段暂时不需要执行的代码
# trip = get_trip(request)
# trip.refresh()
# ... ...

对于不再需要的代码，我们应该直接把它们删掉，而不是注释掉。

02．用注释复述代码

在编写注释时，新手常犯的另一类错误是用注释复述代码。

#调用strip()去掉空格
input_string = input_string.strip()

指引性注释。这种注释并不直接复述代码，而是简明扼要地概括代码功能，起到“代码导读”的作用。

以下代码里的注释就属于指引性注释：

#初始化访问服务的client对象

token = token_service.get_token()

service_client = ServiceClient(token=token)

service_client.ready()

# 调用服务获取数据，然后进行过滤

data = service_client.fetch_full_data()

for item in data:

if item.value > SOME_VALUE:

...

指引性注释并不提供代码里读不到的东西——假如没有注释，耐心读完所有代码，你也能知道代码做了什么事儿。指引性注释的主要作用是降低代码的认知成本，让我们能更容易理解代码的意图。

03．弄错接口注释的受众

接口文档主要是给函数（或类）的使用者看的，它最主要的存在价值，是让人们不用逐行阅读函数代码，也能很快通过文档知道该如何使用这个函数，以及在使用时有什么注意事项。

对于上面的resize_image()函数来说，文档里提供以下内容就足够了：

def resize_image(image, size):"""将图片缩放到指定尺寸，并返回新的图片。注意：当文件超过 5MB 时，请使用resize_big_image():param image: 图片文件对象:param size: 包含宽高的元组：（width, height）:return: 新图片对象"""

1.3 编程建议

1.3.1 保持变量一致性

在foo()函数的作用域内，users变量被使用了两次：第一次指向字典，第二次则变成了列表。虽然Python的类型系统允许我们这么做，但这样做其实有很多坏处，比如变量的辨识度会因此降低，还很容易引入bug。

建议在这种情况下启用一个新变量：

def foo():users = {'data': ['piglei', 'raymond']}...# 使用一个新名字user_list = []...

1.3.2 变量定义尽量靠近使用

def generate_trip_png(trip):"""根据旅途数据生成 PNG 图片"""# 预先定义好所有的局部变量waypoints = []photo_markers, text_markers = [], []marker_count = 0# 开始初始化 waypoints 数据waypoints.append(...)...# 经过几行代码后，开始处理 photo_markers、text_markersphoto_markers.append(...)...# 经过更多代码后，开始计算 marker_countmarker_count += ...# 拼接图片：已省略……

1.3.3 定义临时变量提升可读性

#为所有性别为女或者级别大于3的活跃用户发放10000个金币
user_is_eligible = user.is_active and (user.sex == 'female' or user.level > 3)if user_is_eligible:user.add_coins(10000)return

1.3.4 同一作用域内不要有太多变量

代码清单1-3 局部变量过多的函数

def import_users_from_file(fp):"""尝试从文件对象读取用户，然后导入数据库:param fp: 可读文件对象:return: 成功与失败的数量"""# 初始化变量：重复用户、黑名单用户、正常用户duplicated_users, banned_users, normal_users = [], [], []for line in fp:parsed_user = parse_user(line)# …… 进行判断处理，修改前面定义的{X}_users 变量succeeded_count, failed_count = 0, 0# …… 读取 {X}_users 变量，写入数据库并修改成功与失败的数量return succeeded_count, failed_count

代码清单1-4 对局部变量分组并建模

class ImportedSummary:"""保存导入结果摘要的数据类"""def __init__(self):self.succeeded_count = 0self.failed_count = 0class ImportingUserGroup:"""用于暂存用户导入处理的数据类"""def __init__(self):self.duplicated = []self.banned = []self.normal = []def import_users_from_file(fp):"""尝试从文件对象读取用户，然后导入数据库　　:param fp: 可读文件对象:return: 成功与失败的数量"""importing_user_group = ImportingUserGroup()for line in fp:parsed_user = parse_user(line)# …… 进行判断处理，修改上面定义的importing_user_group 变量summary = ImportedSummary()# …… 读取 importing_user_group，写入数据库并修改成功与失败的数量return summary.succeeded_count, summary.failed_count

1.3.5 能不定义变量就别定义

定义临时变量可以提高代码的可读性。但有时，把不必要的东西赋值为临时变量，反而会让代码显得啰唆：

def get_best_trip_by_user_id(user_id):# 心理活动：嗯，这个值未来说不定会修改/二次使用，我们先把它定义成变量吧！user = get_user(user_id)trip = get_best_trip(user_id)result = {'user': user,'trip': trip}return result

上面这段代码里的三个临时变量完全可以去掉，变成下面这样：

def get_best_trip_by_user_id(user_id):return {'user': get_user(user_id),'trip': get_best_trip(user_id)}

1.3.6 不要使用locals()

locals()是Python的一个内置函数，调用它会返回当前作用域中的所有局部变量：

def foo():name = 'piglei'bar = 1print(locals())# 调用foo() 将输出：
{'name': 'piglei', 'bar': 1}

Python之禅：显式优于隐式

"Python之禅"中有一句“Explicit is better than implicit”（显式优于隐式）

1.3.7 空行也是一种“注释”

代码里的注释不只是那些常规的描述性语句，有时候，没有一个字符的空行，也算得上一种特殊的“注释”。

1.3.8 先写注释，后写代码

每个函数的名称与接口注释（也就是docstring），其实是一种比函数内部代码更为抽象的东西。你需要在函数名和短短几行注释里，把函数内代码所做的事情，高度浓缩地表达清楚。

在写出一句有说服力的接口注释前，别写任何函数代码。

1.4 总结

以下是本章要点知识总结。

（1）变量和注释决定“第一印象”
· 变量和注释是代码里最接近自然语言的东西，它们的可读性非常重要
· 即使是实现同一个算法，变量和注释不一样，给人的感觉也会截然不同

（2）基础知识·
Python的变量赋值语法非常灵活，可以使用*variables星号表达式灵活赋值
· 编写注释的两个要点：不要用来屏蔽代码，而是用来解释“为什么”
· 接口注释是为使用者而写，因此应该简明扼要地描述函数职责，而不必包含太多内部细节· 可以用Sphinx格式文档或类型注解给变量标明类型
（3）变量名字很重要

· 给变量起名要遵循PEP 8原则，代码的其他部分也同样如此
· 尽量给变量起描述性强的名字，但评价描述性也需要结合场景
· 在保证描述性的前提下，变量名要尽量短
· 变量名要匹配它所表达的类型
· 可以使用一两个字母的超短名字，但注意不要过度使用
（4）代码组织技巧
· 按照代码的职责来组织代码：让变量定义靠近使用
· 适当定义临时变量可以提升代码的可读性
· 不必要的变量会让代码显得冗长、啰唆
· 同一个作用域内不要有太多变量，解决办法：提炼数据类、拆分函数
· 空行也是一种特殊的“注释”，适当的空行可以让代码更易读
（5）代码可维护性技巧
· 保持变量在两个方面的一致性：名字一致性与类型一致性
· 显式优于隐式：不要使用locals()批量获取变量
· 把接口注释当成一种函数设计工具：先写注释，后写代码

[Python工匠]输出① 变量与注释

1.1 基础知识

1.1.1 变量常见用法

01．变量解包

02．单下划线变量名_

1.1.2 给变量注明类型

1.1.3 变量命名原则

01．遵循PEP 8原则

02．描述性要强

03．要尽量短

04．要匹配类型

05．超短命名

1.1.4 注释基础知识

1.3 编程建议

1.3.1 保持变量一致性

1.3.2 变量定义尽量靠近使用

1.3.3 定义临时变量提升可读性

1.3.4 同一作用域内不要有太多变量

1.3.5 能不定义变量就别定义

1.3.6 不要使用locals()

1.3.7 空行也是一种“注释”

1.3.8 先写注释，后写代码

1.4 总结

公告

标签

[Python工匠]输出① 变量与注释

1.1 基础知识

1.1.1 变量常见用法

01．变量解包

02．单下划线变量名_

1.1.2 给变量注明类型

1.1.3 变量命名原则

01．遵循PEP 8原则

02．描述性要强

03．要尽量短

04．要匹配类型

05．超短命名

1.1.4 注释基础知识

1.3 编程建议

1.3.1 保持变量一致性

1.3.2 变量定义尽量靠近使用

1.3.3 定义临时变量提升可读性

1.3.4 同一作用域内不要有太多变量

1.3.5 能不定义变量就别定义

1.3.6 不要使用locals()

1.3.7 空行也是一种“注释”

1.3.8 先写注释，后写代码

1.4 总结

相关问题

公告

标签