Содержание
- Вступление
- Конструирование и инициализация
- Переопределение операторов на произвольных классах
- Представление своих классов
- Контроль доступа к атрибутам
- Создание произвольных последовательностей
- Отражение
- Вызываемые объекты
- Менеджеры контекста
- Абстрактные базовые классы
- Построение дескрипторов
- Копирование
- Использование модуля pickle на своих объектах
- Заключение
- Приложение 1: Как вызывать магические методы
- Приложение 2: Изменения в Питоне 3
Вступление
Что такое магические методы? Они всё в объектно-ориентированном Питоне. Это специальные методы, с помощью которых вы можете добавить в ваши классы «магию». Они всегда обрамлены двумя нижними подчеркиваниями (например, __init__
или __lt__
). Ещё, они не так хорошо документированны, как хотелось бы. Все магические методы описаны в документации, но весьма беспорядочно и почти безо всякой организации. Поэтому, чтобы исправить то, что я воспринимаю как недостаток документации Питона, я собираюсь предоставить больше информации о магических методах, написанной на понятном языке и обильно снабжённой примерами. Надеюсь, это руководство вам понравится. Используйте его как обучающий материал, памятку или полное описание. Я просто постарался как можно понятнее описать магические методы.
Конструирование и инициализация.
Всем известен самый базовый магический метод, __init__
. С его помощью мы можем инициализировать объект. Однако, когда я пишу x = SomeClass()
, __init__
не самое первое, что вызывается. На самом деле, экземпляр объекта создаёт метод __new__
и затем передаёт аргументы в инициализатор. На другом конце жизненного цикла объекта находится метод __del__
. Давайте подробнее рассмотрим эти три магических метода:
__new__(cls, [...)
Это первый метод, который будет вызван при инициализации объекта. Он принимает в качестве параметров класс и потом любые другие аргументы, которые он должен передать в__init__
.__new__
используется весьма редко, но иногда бывает полезен, в частности, когда класс наследуется от неизменяемого (immutable) типа, такого как кортеж (tuple) или строка. Я не намерен очень детально останавливаться на__new__
, так как он не то чтобы очень часто нужен, но этот метод очень хорошо и детально описан в документации.__init__(self, [...)
Инициализатор класса. Ему передаётся всё, с чем был вызван первоначальный конструктор (так, например, если мы вызываемx = SomeClass(10, 'foo')
,__init__
получит10
и'foo'
в качестве аргументов.__init__
почти повсеместно используется при определении классов.__del__(self)
Если__new__
и__init__
образуют конструктор объекта,__del__
это его деструктор. Он не определяет поведение для выраженияdel x
(поэтому этот код не эквивалентенx.__del__()
). Скорее, он определяет поведение объекта в то время, когда объект попадает в сборщик мусора. Это может быть довольно удобно для объектов, которые могут требовать дополнительных чисток во время удаления, таких как сокеты или файловыве объекты. Однако, нужно быть осторожным, так как нет гарантии, что__del__
будет вызван, если объект продолжает жить, когда интерпретатор завершает работу. Поэтому__del__
не может служить заменой для хороших программистских практик (всегда завершать соединение, если закончил с ним работать и тому подобное). Фактически, из-за отсутствия гарантии вызова,__del__
не должен использоваться почти никогда; используйте его с осторожностью!
Соединим всё вместе, вот пример __init__
и __del__
в действии:
from os.path import join class FileObject: '''Обёртка для файлового объекта, чтобы быть уверенным в том, что файл будет закрыт при удалении.''' def __init__(self, filepath='~', filename='sample.txt'): # открыть файл filename в filepath в режиме чтения и записи self.file = open(join(filepath, filename), 'r+') def __del__(self): self.file.close() del self.file
Переопределение операторов на произвольных классах
Одно из больших преимуществ использования магических методов в Питоне то, что они предоставляют простой способ заставить объекты вести себя по подобию встроенных типов. Это означает, что вы можете избежать унылого, нелогичного и нестандартного поведения базовых операторов. В некоторых языках обычное явление писать как-нибудь так:
if instance.equals(other_instance): # do something
Вы, конечно, можете поступать так же и в Питоне, но это добавляет путаницы и ненужной многословности. Разные библиотеки могут по разному называть одни и те же операции, заставляя использующего их программиста совершать больше действий, чем необходимо. Используя силу магических методов, мы можем определить нужный метод (__eq__
, в этом случае), и так точно выразить, что мы имели в виду:
if instance == other_instance: #do something
Это одна из сильных сторон магических методов. Подавляющее большинство из них позволяют определить, что будут делать стандартные операторы, так что мы можем использовать операторы на своих классах так, как будто они встроенные типы.
Магические методы сравнения
В Питоне уйма магических методов, созданных для определения интуитивного сравнения между объектами используя операторы, а не неуклюжие методы. Кроме того, они предоставляют способ переопределить поведение Питона по-умолчанию для сравнения объектов (по ссылке). Вот список этих методов и что они делают:
__cmp__(self, other)
Самый базовый из методов сравнения. Он, в действительности, определяет поведение для всех операторов сравнения (>, ==, !=, итд.), но не всегда так, как вам это нужно (например, если эквивалентность двух экземпляров определяется по одному критерию, а то что один больше другого по какому-нибудь другому).__cmp__
должен вернуть отрицательное число, еслиself < other
, ноль, еслиself == other
, и положительное число в случаеself > other
. Но, обычно, лучше определить каждое сравнение, которое вам нужно, чем определять их всех в__cmp__
. Но__cmp__
может быть хорошим способом избежать повторений и увеличить ясность, когда все необходимые сравнения оперерируют одним критерием.__eq__(self, other)
Определяет поведение оператора равенства,==
.__ne__(self, other)
Определяет поведение оператора неравенства,!=
.__lt__(self, other)
Определяет поведение оператора меньше,<
.__gt__(self, other)
Определяет поведение оператора больше,>
.__le__(self, other)
Определяет поведение оператора меньше или равно,<=
.__ge__(self, other)
Определяет поведение оператора больше или равно,>=
.
Для примера расммотрим класс, описывающий слово. Мы можем сравнивать слова лексиграфически (по алфавиту), что является дефолтным поведением при сравнении строк, но можем захотеть использовать при сравнении какой-нибудь другой критерий, такой, как длина или количество слогов. В этом примере мы будем сравнивать по длине. Вот реализация:
class Word(str): '''Класс для слов, определяющий сравнение по длине слов.''' def __new__(cls, word): # Мы должны использовать __new__, так как тип str неизменяемый # и мы должны инициализировать его раньше (при создании) if ' ' in word: print "Value contains spaces. Truncating to first space." word = word[:word.index(' ')] # Теперь Word это все символы до первого пробела return str.__new__(cls, word) def __gt__(self, other): return len(self) > len(other) def __lt__(self, other): return len(self) < len(other) def __ge__(self, other): return len(self) >= len(other) def __le__(self, other): return len(self) <= len(other)
Теперь мы можем создать два Word
(при помощи Word('foo')
и Word('bar')
) и сравнить их по длине. Заметьте, что мы не определяли __eq__
и __ne__
, так как это приведёт к странному поведению (например, Word('foo') == Word('bar')
будет расцениваться как истина). В этом нет смысла при тестировании на эквивалентность, основанную на длине, поэтому мы оставляем стандартную проверку на эквивалентность от str
.
Сейчас, кажется, удачное время упомянуть, что вы не должны определять каждый из магических методов сравнения, чтобы полностью охватить все сравнения. Стандартная библиотека любезно предоставляет нам класс-декторатор в модуле functools
, который и определит все сравнивающие методы, от вас достаточно определить только __eq__
и ещё один (__gt__
, __lt__
и т.п.) Эта возможность доступна начиная с 2.7 версии Питона, но если это вас устраивает, вы сэкономите кучу времени и усилий. Для того, чтобы задействовать её, поместите @total_ordering
над вашим определением класса.
Числовые магические методы
Точно так же, как вы можете определить, каким образом ваши объекты будут сравниваться операторами сравнения, вы можете определить их поведение для числовых операторов. Приготовтесь, друзья, их много. Для лучшей организации, я разбил числовые магические методы на 5 категорий: унарные операторы, обычные арифметические операторы, отражённые арифметические операторы (подробности позже), составные присваивания и преобразования типов.
Унарные операторы и функции
Унарные операторы и функции имеют только один операнд — отрицание, абсолютное значение, и так далее.
__pos__(self)
Определяет поведение для унарного плюса (+some_object
)__neg__(self)
Определяет поведение для отрицания(-some_object
)__abs__(self)
Определяет поведение для встроенной функцииabs()
.__invert__(self)
Определяет поведение для инвертирования оператором~
. Для объяснения что он делает смотри статью в Википедии о бинарных операторах.__round__(self, n)
Определяет поведение для встроенной функцииround()
.n
это число знаков после запятой, до которого округлить.__floor__(self)
Определяет поведение дляmath.floor()
, то есть, округления до ближайшего меньшего целого.__ceil__(self)
Определяет поведение дляmath.ceil()
, то есть, округления до ближайшего большего целого.__trunc__(self)
Определяет поведение дляmath.trunc()
, то есть, обрезания до целого.
Обычные арифметические операторы
Теперь рассмотрим обычные бинарные операторы (и ещё пару функций): +, -, * и похожие. Они, по большей части, отлично сами себя описывают.
__add__(self, other)
Сложение.__sub__(self, other)
Вычитание.__mul__(self, other)
Умножение.__floordiv__(self, other)
Целочисленное деление, оператор//
.__div__(self, other)
Деление, оператор/
.__truediv__(self, other)
Правильное деление. Заметьте, что это работает только когда используетсяfrom __future__ import division
.__mod__(self, other)
Остаток от деления, оператор%
.__divmod__(self, other)
Определяет поведение для встроенной функцииdivmod()
.__pow__
Возведение в степень, оператор**
.__lshift__(self, other)
Двоичный сдвиг влево, оператор<<
.__rshift__(self, other)
Двоичный сдвиг вправо, оператор>>
.__and__(self, other)
Двоичное И, оператор&
.__or__(self, other)
Двоичное ИЛИ, оператор|
.__xor__(self, other)
Двоичный xor, оператор^
.
Отражённые арифметические операторы
Помните как я сказал, что собираюсь остановиться на отражённой арифметике подробнее? Вы могли подумать, что это какая-то большая, страшная и непонятная концепция. На самом деле всё очень просто. Вот пример:
some_object + other
Это «обычное» сложение. Единственное, чем отличается эквивалентное отражённое выражение, это порядок слагаемых:
other + some_object
Таким образом, все эти магические методы делают то же самое, что и их обычные версии, за исключением выполнения операции с other
в качестве первого операнда и self
в качестве второго. В большинстве случаев, результат отражённой операции такой же, как её обычный эквивалент, поэтому при определении __radd__
вы можете ограничиться вызовом __add__
да и всё. Заметьте, что объект слева от оператора (other
в примере) не должен иметь обычной неотражённой версии этого метода. В нашем примере, some_object.__radd__
будет вызван только если в other
не определён __add__
.
__radd__(self, other)
Отражённое сложение.__rsub__(self, other)
Отражённое вычитание.__rmul__(self, other)
Отражённое умножение.__rfloordiv__(self, other)
Отражённое целочисленное деление, оператор//
.__rdiv__(self, other)
Отражённое деление, оператор/
.__rtruediv__(self, other)
Отражённое правильное деление. Заметьте, что работает только когда используетсяfrom __future__ import division
.__rmod__(self, other)
Отражённый остаток от деления, оператор%
.__rdivmod__(self, other)
Определяет поведение для встроенной функцииdivmod()
, когда вызываетсяdivmod(other, self)
.__rpow__
Отражённое возведение в степерь, оператор**
.__rlshift__(self, other)
Отражённый двоичный сдвиг влево, оператор<<
.__rrshift__(self, other)
Отражённый двоичный сдвиг вправо, оператор>>
.__rand__(self, other)
Отражённое двоичное И, оператор&
.__ror__(self, other)
Отражённое двоичное ИЛИ, оператор|
.__rxor__(self, other)
Отражённый двоичный xor, оператор^
.
Составное присваивание
В Питоне широко представлены и магические методы для составного присваивания. Вы скорее всего уже знакомы с составным присваиванием, это комбинация «обычного» оператора и присваивания. Если всё ещё непонятно, вот пример:
x = 5 x += 1 # другими словами x = x + 1
Каждый из этих методов должен возвращать значение, которое будет присвоено переменной слева (например, для a += b
, __iadd__
должен вернуть a + b
, что будет присвоено a
). Вот список:
__iadd__(self, other)
Сложение с присваиванием.__isub__(self, other)
Вычитание с присваиванием.__imul__(self, other)
Умножение с присваиванием.__ifloordiv__(self, other)
Целочисленное деление с присваиванием, оператор//=
.__idiv__(self, other)
Деление с присваиванием, оператор/=
.__itruediv__(self, other)
Правильное деление с присваиванием. Заметьте, что работает только если используетсяfrom __future__ import division
.__imod_(self, other)
Остаток от деления с присваиванием, оператор%=
.__ipow__
Возведение в степерь с присваиванием, оператор**=
.__ilshift__(self, other)
Двоичный сдвиг влево с присваиванием, оператор<<=
.__irshift__(self, other)
Двоичный сдвиг вправо с присваиванием, оператор>>=
.__iand__(self, other)
Двоичное И с присваиванием, оператор&=
.__ior__(self, other)
Двоичное ИЛИ с присваиванием, оператор|=
.__ixor__(self, other)
Двоичный xor с присваиванием, оператор^=
.
Магические методы преобразования типов
Кроме того, в Питоне множество магических методов, предназначенных для определния поведения для встроенных функций преобразования типов, таких как float()
. Вот они все:
__int__(self)
Преобразование типа в int.__long__(self)
Преобразование типа в long.__float__(self)
Преобразование типа в float.__complex__(self)
Преобразование типа в комплексное число.__oct__(self)
Преобразование типа в восьмеричное число.__hex__(self)
Преобразование типа в шестнадцатиричное число.__index__(self)
Преобразование типа к int, когда объект используется в срезах (выражения вида [start:stop:step]). Если вы определяете свой числовый тип, который может использоваться как индекс списка, вы должны определить__index__
.__trunc__(self)
Вызывается приmath.trunc(self)
. Должен вернуть своё значение, обрезанное до целочисленного типа (обычно long).__coerce__(self, other)
Метод для реализации арифметики с операндами разных типов.__coerce__
должен вернутьNone
если преобразование типов невозможно. Если преобразование возможно, он должен вернуть пару (кортеж из 2-х элементов) изself
иother
, преобразованные к одному типу.
Представление своих классов
Часто бывает полезно представление класса в виде строки. В Питоне существует несколько методов, которые вы можете определить для настройки поведения встроенных функций при представлении вашего класса.
__str__(self)
Определяет поведение функцииstr()
, вызванной для экземпляра вашего класса.__repr__(self)
Определяет поведение функцииrepr()
, вызыванной для экземпляра вашего класса. Главное отличие отstr()
в целевой аудитории.repr()
больше предназначен для машинно-ориентированного вывода (более того, это часто должен быть валидный код на Питоне), аstr()
предназначен для чтения людьми.__unicode__(self)
Определяет поведение функцииunicode()
, вызыванной для экземпляра вашего класса.unicode()
похож наstr()
, но возвращает строку в юникоде. Будте осторожны: если клиент вызываетstr()
на экземпляре вашего класса, а вы определили только__unicode__()
, то это не будет работать. Постарайтесь всегда определять__str__()
для случая, когда кто-то не имеет такой роскоши как юникод.__format__(self, formatstr)
Определяет поведение, когда экземпляр вашего класса используется в форматировании строк нового стиля. Например,"Hello, {0:abc}!".format(a)
приведёт к вызовуa.__format__("abc")
. Это может быть полезно для определения ваших собственных числовых или строковых типов, которым вы можете захотеть предоставить какие-нибудь специальные опции форматирования.__hash__(self)
Определяет поведение функцииhash()
, вызыванной для экземпляра вашего класса. Метод должен возвращать целочисленное значение, которое будет использоваться для быстрого сравнения ключей в словарях. Заметьте, что в таком случае обычно нужно определять и__eq__
тоже. Руководствуйтесь следующим правилом:a == b
подразумеваетhash(a) == hash(b)
.__nonzero__(self)
Определяет поведение функцииbool()
, вызванной для экземпляра вашего класса. Должна вернуть True или False, в зависимости от того, когда вы считаете экземпляр соответствующим True или False.__dir__(self)
Определяет поведение функцииdir()
, вызванной на экземпляре вашего класса. Этот метод должен возвращать пользователю список атрибутов. Обычно, определение__dir__
не требуется, но может быть жизненно важно для интерактивного использования вашего класса, если вы переопределили__getattr__
или__getattribute__
(с которыми вы встретитесь в следующей части), или каким-либо другим образом динамически создаёте атрибуты.__sizeof__(self)
Определяет поведение функцииsys.getsizeof()
, вызыванной на экземпляре вашего класса. Метод должен вернуть размер вашего объекта в байтах. Он главным образом полезен для классов, определённых в расширениях на C, но всё-равно полезно о нём знать.
Мы почти закончили со скучной (и лишённой примеров) частью руководства по магическим методам. Теперь, когда мы рассмотрели самые базовые магические методы, пришло время перейти к более продвинутому материалу.
Контроль доступа к атрибутам
Многие люди, пришедшие в Питон из других языков, жалуются на отсутствие настоящей инкапсуляции для классов (например, нет способа определить приватные атрибуты с публичными методами доступа). Это не совсем правда: просто многие вещи, связанные с инкапсуляцией, Питон реализует через «магию», а не явными модификаторами для методов и полей. Смотрите:
__getattr__(self, name)
Вы можете определить поведение для случая, когда пользователь пытается обратиться к атрибуту, который не существует (совсем или пока ещё). Это может быть полезным для перехвата и перенаправления частых опечаток, предупреждения об использовании устаревших атрибутов (вы можете всё-равно вычислить и вернуть этот атрибут, если хотите), или хитро возвращатьAttributeError
, когда это вам нужно. Правда, этот метод вызывается только когда пытаются получить доступ к несуществующему атрибуту, поэтому это не очень хорошее решение для инкапсуляции.__setattr__(self, name, value)
В отличии от__getattr__
,__setattr__
решение для инкапсуляции. Этот метод позволяет вам определить поведение для присвоения значения атрибуту, независимо от того существует атрибут или нет. То есть, вы можете определить любые правила для любых изменений значения атрибутов. Впрочем, вы должны быть осторожны с тем, как использовать__setattr__
, смотрите пример нехорошего случая в конце этого списка.__delattr__
Это то же, что и__setattr__
, но для удаления атрибутов, вместо установки значений. Здесь требуются те же меры предосторожности, что и в__setattr__
чтобы избежать бесконечной рекурсии (вызовdel self.name
в определении__delattr__
вызовет бесконечную рекурсию).__getattribute__(self, name)
__getattribute__
выглядит к месту среди своих коллег__setattr__
и__delattr__
, но я бы не рекомендовал вам его использовать.__getattribute__
может использоваться только с классами нового типа (в новых версиях Питона все классы нового типа, а в старых версиях вы можете получить такой класс унаследовавшись отobject
). Этот метод позволяет вам определить поведение для каждого случая доступа к атрибутам (а не только к несуществующим, как__getattr__(self, name)
). Он страдает от таких же проблем с бесконечной рекурсией, как и его коллеги (на этот раз вы можете вызывать__getattribute__
у базового класса, чтобы их предотвратить). Он, так же, главным образом устраняет необходимость в__getattr__
, который в случае реализации__getattribute__
может быть вызван только явным образом или в случае генерации исключенияAttributeError
. Вы конечно можете использовать этот метод (в конце концов, это ваш выбор), но я бы не рекомендовал, потому что случаев, когда он действительно полезен очень мало (намного реже нужно переопределять поведение при получении, а не при установке значения) и реализовать его без возможных ошибок очень сложно.
Вы можете запросто получить проблему при определении любого метогда, управляющего доступом к атрибутам. Рассмотрим пример:
def __setattr__(self, name, value): self.name = value # это рекурсия, так как всякий раз, когда любому атрибуту присваивается значение, # вызывается __setattr__(). # тоесть, на самом деле это равнозначно self.__setattr__('name', value). # Так как метод вызывает сам себя, рекурсия продолжится бесконечно, пока всё не упадёт def __setattr__(self, name, value): self.__dict__[name] = value # присваивание в словарь переменных класса # дальше определение произвольного поведения
Ещё раз, мощь магических методов в Питоне невероятна, а с большой силой приходит и большая ответственность. Важно знать, как правильно использовать магические методы, ничего не ломая.
Итак, что мы узнали об управлении доступом к атрибутам? Их не нужно использовать легкомысленно. На самом деле, они имеют склонность к чрезмерной мощи и нелогичности. Причина, по которой они всё-таки существуют, в удволетворении определённого желания: Питон склонен не запрещать плохие штуки полностью, а только усложнять их использование. Свобода первостепенна, поэтому вы на самом деле можете делать всё, что хотите. Вот пример использования методов контроля доступа (заметьте, что мы используем super
, так как не все классы имеют атрибут __dict__
):
class AccessCounter(object): '''Класс, содержащий атрибут value и реализующий счётчик доступа к нему. Счётчик увеличивается каждый раз, когда меняется value.''' def __init__(self, val): super(AccessCounter, self).__setattr__('counter', 0) super(AccessCounter, self).__setattr__('value', val) def __setattr__(self, name, value): if name == 'value': super(AccessCounter, self).__setattr__('counter', self.counter + 1) # Не будем делать здесь никаких условий. # Если вы хотите предотвратить изменение других атрибутов, # выбросьте исключение AttributeError(name) super(AccessCounter, self).__setattr__(name, value) def __delattr__(self, name): if name == 'value': super(AccessCounter, self).__setattr__('counter', self.counter + 1) super(AccessCounter, self).__delattr__(name)]
Создание произвольных последовательностей
В Питоне существует множество способов заставить ваши классы вести себя как встроенные последовательности (словари, кортежи, списки, строки и так далее). Это, безусловно, мои любимые магические методы, из-за до абсурда высокой степени контроля, которую они дают и той магии, от которой с экземплярами ваших классов вдруг начинает прекрасно работать целое множество глобальных функций. Но, до того как мы перейдём ко всяким хорошим вещам, мы должны знать о протоколах.
Протоколы
Теперь, когда речь зашла о создании собственных последовательностей в Питоне, пришло время поговорить о протоколах. Протоколы немного похожи на интерфейсы в других языках тем, что они предоставляют набор методов, которые вы должны реализовать. Однако, в Питоне протоколы абсолютно ни к чему не обязывают и не требуют обязательно реализовать какое-либо объявление. Наверное, они больше похожи на руководящие указания.
Почему мы заговорили о протоколах? Потому, что реализация произвольных контейнерных типов в Питоне влечёт за собой использование некоторых из них. Во-первых, протокол для определения неизменяемых контейнеров: чтобы создать неизменяемый контейнер, вы должны только определить __len__
и __getitem__
(продробнее о них дальше). Протокол изменяемого контейнера требует того же, что и неизменяемого контейнера, плюс __setitem__
и __delitem__
. И, наконец, если вы хотите, чтобы ваши объекты можно было перебирать итерацией, вы должны определить __iter__
, который возвращает итератор. Этот итератор должен соответствовать протоколу итератора, который требует методов __iter__
(возвращает самого себя) и next
.
Магия контейнеров
Без дальнейшего промедления, вот магические методы, используемые контейнерами:
__len__(self)
Возвращает количество элементов в контейнере. Часть протоколов для изменяемого и неизменяемого контейнеров.__getitem__(self, key)
Определяет поведение при доступе к элементу, используя синтаксисself[key]
. Тоже относится и к протоколу изменяемых и к протоколу неизменяемых контейнеров. Должен выбрасывать соответствующие исключения:TypeError
если неправильный тип ключа иKeyError
если ключу не соответствует никакого значения.__setitem__(self, key, value)
Определяет поведение при присваивании значения элементу, используя синтаксисself[nkey] = value
. Часть протокола изменяемого контейнера. Опять же, вы должны выбрасыватьKeyError
иTypeError
в соответсвующих случаях.__delitem__(self, key)
Определяет поведение при удалении элемента (то естьdel self[key]
). Это часть только протокола для изменяемого контейнера. Вы должны выбрасывать соответствующее исключение, если ключ некорректен.__iter__(self)
Должен вернуть итератор для контейнера. Итераторы возвращаются в множестве ситуаций, главным образом для встроенной функцииiter()
и в случае перебора элементов контейнера выражениемfor x in container:
. Итераторы сами по себе объекты и они тоже должны определять метод__iter__
, который возвращаетself
.__reversed__(self)
Вызывается чтобы определить поведения для встроенной функцииreversed()
. Должен вернуть обратную версию последовательности. Реализуйте метод только если класс упорядоченный, как список или кортеж.__contains__(self, item)
__contains__
предназначен для проверки принадлежности элемента с помощьюin
иnot in
. Вы спросите, почему же это не часть протокола последовательности? Потому что когда__contains__
не определён, Питон просто перебирает всю последовательность элемент за элементом и возвращаетTrue
если находит нужный.__missing__(self, key)
__missing__
используется при наследовании отdict
. Определяет поведение для для каждого случая, когда пытаются получить элемент по несуществующему ключу (так, например, если у меня есть словарьd
и я пишуd["george"]
когда"george"
не является ключом в словаре, вызываетсяd.__missing__("george")
).
Пример
Для примера, давайте посмотрим на список, который реализует некоторые функциональные конструкции, которые вы могли встретить в других языках (Хаскеле, например).
class FunctionalList: '''Класс-обёртка над списком с добавлением некоторой функциональной магии: head, tail, init, last, drop, take.''' def __init__(self, values=None): if values is None: self.values = [] else: self.values = values def __len__(self): return len(self.values) def __getitem__(self, key): # если значение или тип ключа некорректны, list выбросит исключение return self.values[key] def __setitem__(self, key, value): self.values[key] = value def __delitem__(self, key): del self.values[key] def __iter__(self): return iter(self.values) def __reversed__(self): return FunctionalList(reversed(self.values)) def append(self, value): self.values.append(value) def head(self): # получить первый элемент return self.values[0] def tail(self): # получить все элементы после первого return self.values[1:] def init(self): # получить все элементы кроме последнего return self.values[:-1] def last(self): # получить последний элемент return self.values[-1] def drop(self, n): # все элементы кроме первых n return self.values[n:] def take(self, n): # первые n элементов return self.values[:n]
Теперь у вас есть полезный (относительно) пример реализации своей собственной последовательности. Существуют, конечно, и куда более практичные реализации произвольных последовательностей, но большое их число уже реализовано в стандартной библиотеке (с батарейками в комплекте, да?), такие как Counter
, OrderedDict
, NamedTuple
.
Отражение
Вы можете контролировать и отражение, использующее встроенные функции isinstance()
и issubclass()
, определив некоторые магические методы. Вот они:
__instancecheck__(self, instance)
Проверяет, является ли экземлпяр членом вашего класса (isinstance(instance, class)
, например.__subclasscheck__(self, subclass)
Проверяет, является наследуется ли класс от вашего класса (issubclass(subclass, class)
).
Может показаться, что вариантов полезного использования этих магических методов немного и, возможно, это на самом деле так. Я не хочу тратить слишком много времени на магические методы отражения, не особо они и важные, но они отражают кое-что важное об объектно-ориентированном программировании в Питоне и о Питоне вообще: почти всегда существует простой способ что-либо сделать, даже если надобность в этом «что-либо» возникает очень редко. Эти магические методы могут не выглядеть полезными, но если они вам когда-нибудь понадобятся, вы будете рады вспомнить, что они есть (и для этого вы читаете настоящее руководство!).
Вызываемые объекты
Как вы наверное уже знаете, в Питоне функции являются объектами первого класса. Это означает, что они могут быть переданы в функции или методы так же, как любые другие объекты. Это невероятно мощная особенность.
Специальный магический метод позволяет экземплярам вашего класса вести себя так, как будто они функции, тоесть вы сможете «вызывать» их, передавать их в функции, которые принимают функции в качестве аргументов и так далее. Это другая удобная особенность, которая делает программирование на Питоне таким приятным.
__call__(self, [args...])
Позволяет любому экземпляру вашего класса быть вызванным как-будто он функция. Главным образом это означает, чтоx()
означает то же, что иx.__call__()
. Заметьте,__call__
принимает произвольное число аргументов; то есть, вы можете определить__call__
так же как любую другую функцию, принимающую столько аргументов, сколько вам нужно.
__call__
, в частности, может быть полезен в классах, чьи экземпляры часто изменяют своё состояние. «Вызвать» экземпляр может быть интуитивно понятным и элегантным способом изменить состояние объекта. Примером может быть класс, представляющий положение некоторого объекта на плоскости:
class Entity: '''Класс, описывающий объект на плоскости. "Вызываемый", чтобы обновить позицию объекта.''' def __init__(self, size, x, y): self.x, self.y = x, y self.size = size def __call__(self, x, y): '''Изменить положение объекта.''' self.x, self.y = x, y # чик...
Менеджеры контекста
В Питоне 2.5 было представлено новое ключевое слово вместе с новым способом повторно использовать код, ключевое слово with
. Концепция менеджеров контекста не являлась новой для Питона (она была реализована раньше как часть библиотеки), но в PEP 343 достигла статуса языковой конструкции. Вы могли уже видеть выражения с with
:
with open('foo.txt') as bar: # выполнение каких-нибудь действий с bar
Менеджеры контекста позволяют выполнить какие-то действия для настройки или очистки, когда создание объекта обёрнуто в оператор with
. Поведение менеджера контекста определяется двумя магическими методами:
__enter__(self)
Определяет, что должен сделать менеджер контекста в начале блока, созданного операторомwith
. Заметьте, что возвращаемое__enter__
значение и есть то значение, с которым производится работа внутриwith
.__exit__(self, exception_type, exception_value, traceback)
Определяет действия менеджера контекста после того, как блок будет выполнен (или прерван во время работы). Может использоваться для контроллирования исключений, чистки, любых действий которые должны быть выполнены незамедлительно после блока внутри with. Если блок выполнен успешно,exception_type
,exception_value
, иtraceback
будут установлены вNone
. В другом случае вы сами выбираете, перехватывать ли исключение или предоставить это пользователю; если вы решили перехватить исключение, убедитесь, что__exit__
возвращаетTrue
после того как всё сказано и сделано. Если вы не хотите, чтобы исключение было перехвачено менеджером контекста, просто позвольте ему случиться.
__enter__
и __exit__
могут быть полезны для специфичных классов с хорошо описанным и распространённым поведением для их настройки и очистки ресурсов. Вы можете использовать эти методы и для создания общих менеджеров контекста для разных объектов. Вот пример:
class Closer: '''Менеджер контекста для автоматического закрытия объекта вызовом метода close в with-выражении.''' def __init__(self, obj): self.obj = obj def __enter__(self): return self.obj # привязка к активному объекту with-блока def __exit__(self, exception_type, exception_val, trace): try: self.obj.close() except AttributeError: # у объекта нет метода close print 'Not closable.' return True # исключение перехвачено
Пример использования Closer
с FTP-соединением (сокет, имеющий метод close):
>>> from magicmethods import Closer >>> from ftplib import FTP >>> with Closer(FTP('ftp.somesite.com')) as conn: ... conn.dir() ... # output omitted for brevity >>> conn.dir() # long AttributeError message, can't use a connection that's closed >>> with Closer(int(5)) as i: ... i += 1 ... Not closable. >>> i 6
Видите, как наша обёртка изящно управляется и с правильными и с неподходящими объектами. В этом сила менеджеров контекста и магических методов. Заметьте, что стандартная библиотека Питона включает модуль contextlib, который включает в себя contextlib.closing()
— менеджер контекста, который делает приблизительно то же (без какой-либо обработки случая, когда объект не имеет метода close()
).
Абстрактные базовые классы
Смотри http://docs.python.org/2/library/abc.html.
Построение дескрипторов
Дескрипторы это такие классы, с помощью которых можно добавить свою логику к событиям доступа (получение, изменение, удаление) к атрибутам других объектов. Дескрипторы не подразумевается использовать сами по себе; скорее, предполагается, что ими будут владеть какие-нибудь связанные с ними классы. Дескрипторы могут быть полезны для построения объектно-ориентированных баз данных или классов, чьи атрибуты зависят друг от друга. В частности, дескрипторы полезны при представлении атрибутов в нескольких системах исчисления или каких-либо вычисляемых атрибутов (как расстояние от начальной точки до представленной атрибутом точки на сетке).
Чтобы класс стал дескриптором, он должен реализовать по крайней мере один метод из __get__
, __set__
или __delete__
. Давайте рассмотрим эти магические методы:
__get__(self, instance, instance_class)
Определяет поведение при возвращении значения из дескриптора.instance
это объект, для чьего атрибута-дескриптора вызывается метод.owner
это тип (класс) объекта.__set__(self, instance, value)
Определяет поведение при изменении значения из дескриптора.instance
это объект, для чьего атрибута-дескриптора вызывается метод.value
это значение для установки в дескриптор.__delete__(self, instance)
Определяет поведение для удаления значения из дескриптора.instance
это объект, владеющий дескриптором.
Теперь пример полезного использования дескрипторов: преобразование единиц измерения.
class Meter(object): '''Дескриптор для метра.''' def __init__(self, value=0.0): self.value = float(value) def __get__(self, instance, owner): return self.value def __set__(self, instance, value): self.value = float(value) class Foot(object): '''Дескриптор для фута.''' def __get__(self, instance, owner): return instance.meter * 3.2808 def __set__(self, instance, value): instance.meter = float(value) / 3.2808 class Distance(object): '''Класс, описывающий расстояние, содержит два дескриптора для футов и метров.''' meter = Meter() foot = Foot()
Копирование
В Питоне оператор присваивания не копирует объекты, а только добавляет ещё одну ссылку. Но для коллекций, содержащих изменяемые элементы, иногда необходимо полноценное копирование, чтобы можно было менять элементы одной последовательности, не затрагивая другую. Здесь в игру и вступает copy
. К счастью, модули в Питоне не обладают разумом, поэтому мы можем не беспокоиться что они вдруг начнут бесконтрольно копировать сами себя и вскоре линуксовые роботы заполонят всю планету, но мы должны сказать Питону как правильно копировать.
__copy__(self)
Определяет поведениеcopy.copy()
для экземпляра вашего класса.copy.copy()
возвращает поверхностную копию вашего объекта — это означает, что хоть сам объект и создан заново, все его данные ссылаются на данные оригинального объекта. И при изменении данных нового объекта, изменения будут происходить и в оригинальном.__deepcopy__(self, memodict={})
Определяет поведениеcopy.deepcopy()
для экземпляров вашего класса.copy.deepcopy()
возвращает глубокую копию вашего объекта — копируются и объект и его данные.memodict
это кэш предыдущих скопированных объектов, он предназначен для оптимизации копирования и предотвращения бесконечной рекурсии, когда копируются рекурсивные структуры данных. Когда вы хотите полностью скопировать какой-нибудь конкретный атрибут, вызовите на нёмcopy.deepcopy()
с первым параметромmemodict
.
Когда использовать эти магические методы? Как обычно — в любом случае, когда вам необходимо больше, чем стандартное поведение. Например, если вы пытаетесь скопировать объект, который содержит кэш как словарь (возможно, очень большой словарь), то может быть вам и не нужно копировать весь кэш, а обойтись всего одним в общей памяти объектов.
Использование модуля pickle на своих объектах
Pickle это модуль для сериализации структур данных Питона и он может быть невероятно полезен, когда вам нужно сохранить состояние какого-либо объекта и восстановить его позже (обычно, в целях кэширования). Кроме того, это ещё и отличный источник переживаний и путаницы.
Сериализация настолько важна, что кроме своего модуля (pickle
) имеет и свой собственный протокол и свои магические методы. Но для начала о том, как сериализовать с помощью pickle уже существующие типы данных (спокойно пропускайте, если вы уже знаете).
Вкратце про сериализацию
Давайте погрузимся в сериализацию. Допустим, у вас есть словарь, который вы хотите сохранить и восстановить позже. Вы должны записать его содержимое в файл, тщательно убедившись, что пишете с правильным синтаксисом, потом восстановить его, или выполнив exec()
, или прочитав файл. Но это в лучшем случае рискованно: если вы храните важные данные в тексте, он может быть повреждён или изменён множеством способов, с целью обрушить вашу программу или, вообще, запустить какой-нибудь опасный код на вашем компьютере. Лучше использовать pickle:
import pickle data = {'foo': [1, 2, 3], 'bar': ('Hello', 'world!'), 'baz': True} jar = open('data.pkl', 'wb') pickle.dump(data, jar) # записать сериализованные данные в jar jar.close()
И вот, спустя несколько часов, нам снова нужен наш словарь:
import pickle pkl_file = open('data.pkl', 'rb') # открываем data = pickle.load(pkl_file) # сохраняем в переменную print data pkl_file.close()
Что произошло? Точно то, что и ожидалось. data
как-будто всегда тут и была.
Теперь, немного об осторожности: pickle не идеален. Его файлы легко испортить случайно или преднамеренно. Pickle, может быть, безопаснее чем текстовые файлы, но он всё ещё может использоваться для запуска вредоносного кода. Кроме того, он несовместим между разными версиями Питона, поэтому если вы будете распространять свои объекты с помощью pickle, не ожидайте что все люди смогут их использовать. Тем не менее, модуль может быть мощным инструментом для кэширования и других распространённых задач с сериализацией.
Сериализация собственных объектов.
Модуль pickle не только для встроенных типов. Он может использоваться с каждым классом, реализующим его протокол. Этот протокол содержит четыре необязательных метода, позволяющих настроить то, как pickle будет с ними обращаться (есть некоторые различия для расширений на C, но это за рамками нашего руководства):
__getinitargs__(self)
Если вы хотите, чтобы после десериализации вашего класса был вызыван__init__
, вы можете определить__getinitargs__
, который должен вернуть кортеж аргументов, который будет отправлен в__init__
. Заметьте, что этот метод работает только с классами старого стиля.__getnewargs__(self)
Для классов нового стиля вы можете определить, какие параметры будут переданы в__new__
во время десериализации. Этот метод так же должен вернуть кортеж аргументов, которые будут отправлены в__new__
.__getstate__(self)
Вместо стандартного атрибута__dict__
, где хранятся атрибуты класса, вы можете вернуть произвольные данные для сериализации. Эти данные будут переданы в__setstate__
во время десериализации.__setstate__(self, state)
Если во время десериализации определён__setstate__
, то данные объекта будут переданы сюда, вместо того чтобы просто записать всё в__dict__
. Это парный метод для__getstate__
: когда оба определены, вы можете представлять состояние вашего объекта так, как вы только захотите.__reduce__(self)
Если вы определили свой тип (с помощью Python’s C API), вы должны сообщить Питону как его сериализовать, если вы хотите, чтобы он его сериализовал.__reduce__()
вызывается когда сериализуется объект, в котором этот метод был определён. Он должен вернуть или строку, содержащую имя глобальной переменной, содержимое которой сериализуется как обычно, или кортеж. Кортеж может содержать от 2 до 5 элементов: вызываемый объект, который будет вызван, чтобы создать десериализованный объект, кортеж аргументов для этого вызываемого объекта, данные, которые будут переданы в__setstate__
(опционально), итератор списка элементов для сериализации (опционально) и итератор словаря элементов для сериализации (опционально).__reduce_ex__(self, protocol)
Иногда полезно знать версию протокола, реализуя__reduce__
. И этого можно добиться, реализовав вместо него__reduce_ex__
. Если__reduce_ex__
реализован, то предпочтение при вызове отдаётся ему (вы всё-равно должны реализовать__reduce__
для обратной совместимости).
Пример
Для примера опишем грифельную доску (Slate
), которая запоминает что и когда было на ней записано. Впрочем, конкретно эта доска становится чистой каждый раз, когда она сериализуется: текущее значение не сохраняется.
import time class Slate: '''Класс, хранящий строку и лог изменений. И забывающий своё значение после сериализации.''' def __init__(self, value): self.value = value self.last_change = time.asctime() self.history = {} def change(self, new_value): # Изменить значение. Зафиксировать последнее значение в истории. self.history[self.last_change] = self.value self.value = new_value self.last_change = time.asctime() def print_changes(self): print 'Changelog for Slate object:' for k, v in self.history.items(): print '%s\t %s' % (k, v) def __getstate__(self): # Намеренно не возвращаем self.value or self.last_change. # Мы хотим "чистую доску" после десериализации. return self.history def __setstate__(self, state): self.history = state self.value, self.last_change = None, None
Заключение
Цель этого руководства донести что-нибудь до каждого, кто его читает, независимо от его опыта в Питоне или объектно-ориентированном программировании. Если вы новичок в Питоне, вы получили ценные знания об основах написания функциональных, элегантных и простых для использования классов. Если вы программист среднего уровня, то вы, возможно, нашли несколько новых приятных идей и стратегий, несколько хороших способов уменьшить количество кода, написанного вами и вашими клиентами. Если же вы Питонист-эксперт, то вы обновили некоторые свои, возможно, подзабытые знания, а может и нашли парочку новых трюков. Независимо от вашего уровня, я надеюсь, что это путешествие через специальные питоновские методы было поистине магическим (не смог удержаться).
Дополнение 1: Как вызывать магические методы
Некоторые из магических методов напрямую связаны со встроенными функциями; в этом случае совершенно очевидно как их вызывать. Однако, так бывает не всегда. Это дополнение посвящено тому, чтобы раскрыть неочевидный синтаксис, приводящий к вызову магических методов.
__new__(cls [,...]) |
instance = MyClass(arg1, arg2) |
__new__ вызывается при создании экземпляра |
__init__(self [,...]) |
instance = MyClass(arg1, arg2) |
__init__ вызывается при создании экземпляра |
__cmp__(self, other) |
self == other , self > other , etc. |
Вызывается для любого сравнения |
__pos__(self) |
+self |
Унарный знак плюса |
__neg__(self) |
-self |
Унарный знак минуса |
__invert__(self) |
~self |
Побитовая инверсия |
__index__(self) |
x[self] |
Преобразование, когда объект используется как индекс |
__nonzero__(self) |
bool(self) |
Булевое значение объекта |
__getattr__(self, name) |
self.name # name не определено |
Пытаются получить несуществующий атрибут |
__setattr__(self, name, val) |
self.name = val |
Присвоение любому атрибуту |
__delattr__(self, name) |
del self.name |
Удаление атрибута |
__getattribute__(self, name) |
self.name |
Получить любой атрибут |
__getitem__(self, key) |
self[key] |
Получение элемента через индекс |
__setitem__(self, key, val) |
self[key] = val |
Присвоение элементу через индекс |
__delitem__(self, key) |
del self[key] |
Удаление элемента через индекс |
__iter__(self) |
for x in self |
Итерация |
__contains__(self, value) |
value in self , value not in self |
Проверка принадлежности с помощью in |
__call__(self [,...]) |
self(args) |
«Вызов» экземпляра |
__enter__(self) |
with self as x: |
with оператор менеджеров контекста |
__exit__(self, exc, val, trace) |
with self as x: |
with оператор менеджеров контекста |
__getstate__(self) |
pickle.dump(pkl_file, self) |
Сериализация |
__setstate__(self) |
data = pickle.load(pkl_file) |
Сериализация |
Надеюсь, эта таблица избавит вас от любых вопросов о том, что за синтаксис вызова магических методов.
Дополнение 2: Изменения в Питоне 3
Опишем несколько главных случаев, когда Питон 3 отличается от 2.x в терминах его объектной модели:
- Так как в Питоне 3 различий между строкой и юникодом больше нет,
__unicode__
исчез, а появился__bytes__
(который ведёт себя так же как__str__
и__unicode__
в 2.7) для новых встроенных функций построения байтовых массивов. - Так как деление в Питоне 3 теперь по-умолчанию «правильное деление»,
__div__
больше нет. __coerce__
больше нет, из-за избыточности и странного поведения.__cmp__
больше нет, из-за избыточности.__nonzero__
было переименовано в__bool__
.
ссылка на оригинал статьи http://habrahabr.ru/post/186608/
Добавить комментарий