Мне кажется, в каждом языке программирования есть моменты, которые требуют повышенной концентрации внимания или больше практики для своего понимания. Python в этом плане не исключение, и сегодня я расскажу вам о нескольких каверзных вопросах, с которыми вы можете столкнуться как в повседневной разработке, так и в ходе прохождения собеседования.
Каждый пример будет построен так, чтобы сначала можно было подумать самому, потом получить подсказку, почитать объяснение, и только в конце увидеть ответ.
Обратите внимание, что первичное объяснение не всегда корректно. Чтобы получить правильный ответ, дочитывайте пример до конца.
Первый пример
Очень короткий. Про операторы и порядок их вычислений.
11 > 0 is True
С ходу можно интерпретировать это выражение следующим образом:
- Приоритет операторов сравнения и
is
одинаков. 11 > 0
— этоTrue
.- Упрощаем выражение, получая
True is True
. - Всё выражение в итоге станет
True
.
На самом же деле это выражение вернёт False
.
Вот еще пара похожих выражений.
0 < 0 == 0 # False
1 in range(2) == True # False
Также обратите внимание, что расстановка скобок изменит результат.
(11 > 0) is True # True
(0 < 0) == 0 # True
(1 in range(2)) == True # True
Как всегда, никакой магии в этих примерах нет. Приведенные выражения — это chained comparisons, которые следует читать так: a op1 b op2 c ... y opN z
эквивалентно a op1 b and b op2 c and ... y opN z
.
Итак, ответ: исходное выражение эквивалентно (11 > 0) and (0 is True)
, что, очевидно, является ложью.
Остался вопрос про скобки? Расстановка скобок превращает выражение в обычное, не chained comparisons. То есть благодаря скобкам приоритет смещается на выражение в них, оно вычисляется первым, а затем выполняется вторая операция.
Второй пример
В отличие от остальных примеров, незнание следующего факта вряд ли приведёт к ошибке в коде, но знать о таких вещах, мне кажется, как минимум любопытно.
a = 123
b = 123
a == b
a is b
Двойное равно проверяет объекты на равенство (и очевидно, что 123 == 123). А оператор is
проверяет, что переменные ссылаются на один и тот же объект. a
и b
— разные объекты, поэтому a is b
вернёт False
.
На самом деле в Python есть оптимизация, касающаяся небольших int-ов (от -5 до 256 включительно). Эти объекты загружаются в память интерпретатора при его запуске. Получается небольшой кеш. Из-за этого объект получается один, и результат будет True
.
Аналогичный пример для числа > 256 сработает ожидаемо:
a = 257
b = 257
a == b # True
a is b # False
Второй пример. Продолжение
Давайте попробуем копнуть глубже и посмотрим на следующий пример:
def test():
a = 257
b = 257
print(a is b)
test()
257 не входит в кеш, и должно отобразиться False
.
Отличие от предыдущего примера в том, что тут за счёт функции все инструкции интерпретатору подаются единым блоком. Чтобы понять, что происходит, давайте обратимся к байткоду этой функции:
import dis
dis.dis(test)
Мы увидим следующие инструкции:
2 0 LOAD_CONST 1 (257)
2 STORE_FAST 0 (a)
3 4 LOAD_CONST 1 (257)
6 STORE_FAST 1 (b)
4 8 LOAD_GLOBAL 0 (print)
10 LOAD_FAST 0 (a)
12 LOAD_FAST 1 (b)
14 COMPARE_OP 8 (is)
16 CALL_FUNCTION 1
18 POP_TOP
20 LOAD_CONST 0 (None)
22 RETURN_VALUE
Предпоследняя колонка — это аргументы для операций. Для LOAD_CONST
— это индекс в массиве констант. Поскольку для обеих операций LOAD_CONST
подаётся один и тот же индекс, в байткоде у нас лишь один объект, отвечающий за число 257.
Получается, что интерпретатор способен на подобные оптимизации: код предварительно анализируется, и некоторые константы переиспользуются (float-ы тоже, но не tuple-ы).
Итак, исходный код выведет True
.
Третий пример
Этот вопрос однажды встретился мне на собеседовании. Он про классы и методы.
class C:
a = lambda self: self.b()
def __init__(self):
self.b = lambda self: None
c = C()
c.a()
Здесь стоит внимательно пройти цепочку вызовов, отличая методы класса от обычных функций.
Вспоминаем, что вызов метода применительно к экземпляру класса c.method()
— это то же самое, что вызов метода применительно к классу с первым аргументом в качестве экземпляра: C.method(c)
.
Теперь проверим, во что превратились параметры a
и b
класса C
.
type(c.a) # <class 'method'>
type(c.b) # <class 'function'>
Параметр а
превратился в метод класса, такой же, как при определении метода внутри класса через def a(self)
.
А вот b
— это обычная функция, потому что она присваивается атрибуту экземпляра класса, а не определяется (как a
) в момент создания класса.
Получается, что при вызове c.a()
мы получаем C.a(c)
. Тут в качестве аргумента self
в метод валидно передастся экземпляр класса. Далее внутри a
вызывается функция b
. Поскольку это обычная функция, то «автоматической» передачи экземпляра в качестве первого аргумента не произойдёт. И получается, что функция b
вызовется без аргументов. Но она требует аргумент! Ведь она задана как lambda self: None
. Не обращайте внимание, что аргумент называется self
. Это сделано для дополнительного запутывания.
Итак, ответ:
Traceback (most recent call last):
File "<input>", line 1, in <module>
File "<input>", line 2, in <lambda>
TypeError: <lambda>() missing 1 required positional argument: 'self'
Это происходит потому, что функции b
не передан аргумент.
Четвёртый пример
Он про определение переменных в замыкании. Взят из списка хитрых вопросов с toptall:
def create_multipliers():
return [lambda x : i * x for i in range(5)]
for multiplier in create_multipliers():
print(multiplier(2))
Кажется, ничего сложного. create_multipliers
вернёт список из 5 функций (назовём их list_lamba_f
). Каждая list_lamba_f
будет умножать свой аргумент на свой индекс в результирующем массиве.
Получается, что на экране мы увидим:
0
2
4
6
8
Дальнейший разбор предполагает, что вам знакомо замыкание (closure) при использовании вложенных функций (nested functions).
Свои коррективы в наивное объяснение выше вносит позднее связывание. Согласно ему, значение переменной из замыкания (это переменная i
) вычисляется в тот момент, когда вызывается внутренняя функция (наши list_lamba_f
).
Получается, что значение i
в list_lamba_f
вычисляется в момент вызова multiplier(2)
в пятой строчке. Но в этот момент create_multipliers
уже отработала целиком. и значение i
— это 4. То есть для всех list_lamba_f
значение i
равно 4.
Итак, ответ:
8
8
8
8
8
Надеюсь, вам было интересно и понятно. С удовольствием почитаю комментарии с вопросами и задачами, которые кажутся вам полезными для понимания Python и просто занятными. Только не пишите ответ сразу!
Автор: alexey_and_kazakov