Получи случайную криптовалюту за регистрацию!

Python Заметки

Логотип телеграм канала @pythonotes — Python Заметки P
Логотип телеграм канала @pythonotes — Python Заметки
Адрес канала: @pythonotes
Категории: Технологии
Язык: Русский
Количество подписчиков: 2.71K
Описание канала:

Интересные заметки и обучающие материалы по Python
Контакт: @paulwinex
Хештеги для поиска:
#tricks
#libs
#pep
#basic
#regex
#qt
#django
#2to3
#source
#offtop

Рейтинги и Отзывы

3.00

3 отзыва

Оценить канал pythonotes и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

0

4 звезд

2

3 звезд

0

2 звезд

0

1 звезд

1


Последние сообщения 4

2021-09-20 12:00:21 Наверняка вы знаете что такое перегруженная функция в С++. Если нет, то всё просто.
В С++ можно создать несколько функций с одинаковым названием но разными типами аргументов. И это будут разные функции.
Во время вызова функции будет выбрана та её версия которая подходит по типам аргументов. Такая конструкция называется параметрический полиморфизм.
Это удобно, когда мы точно не знаем какого типа прилетит аргумент и хотим обработать разные ситуации.

Как мы это поведение можем повторить в Python? Обычно через проверку типов.

def func(value):
if isinstance(value, int):
return func_int(value)
elif isinstance(value, str):
return func_str(value)
else:
raise NotImplementedError

Не очень красиво
Начиная с версии 3.4 в Python добавили способ делать "перегруженные" функции более элегантно. Это декоратор singledispatch.

Создадим нашу исходную функцию которая по умолчанию выбрасывает ошибку.

@singledispatch
def func(value)
raise NotImplementedError

Декоратор добавил для объекта func новую функцию register() с помощью которой можем регистрировать перегруженные функции.
В качестве аргумента указывайте тип который данная функция обрабатывает

@func.register(int)
def func_int(x):
print("INT:", x)

Вместо указания типа в аргументах можно использовать аннотации аргумента функции

@func.register
def func_str(x: str):
print("STR:", x)

Если не указать тип одним из этих способов то получите ошибку TypeError.

Имя новой функции не имеет значения, часто её называют просто "_"

@func.register(list)
def _(x):
print("LIST", x)

Если одна функция должна обработать несколько типов, то просто наслаиваем декоратор

@func.register(float)
@func.register(Decimal)
def _(x):
print(f'{type(x).__name__.upper()}:', x)

Теперь у нас есть 5 отдельных функций которые вызываются в зависимости от типа передаваемого аргумента. При этом всё выглядит логично и компактно. Обработка каждого случая находится в своей отдельной функции!

>>> func(1)
INT: 1
>>> func('Python')
STR: Python
>>> func(1.2)
FLOAT: 1.2
>>> func({})
NotImplementedError

------
Данный способ работает только с первым аргументом. Все остальные аргументы будут переданы как есть и не участвуют в выборе нужной функции.
В версии 3.8 доступен декоратор singledispatchmethod с таким же функционалом но для методов класса.

#tricks #libs
563 viewsedited  09:00
Открыть/Комментировать
2021-08-30 13:00:15 Какой тип данных выбрать для оптимального хранения информации? Имеется в виду объем занимаемой памяти.
Можем создать 4 разных варианта объектов и сравнить сколько они занимают оперативки.
Будем создавать простой класс, класс со слотами, именованный кортеж и словарь.

from collections import namedtuple
from sys import getsizeof

NT = namedtuple('NT', 'v1 v2 v3')

class CLASS:
def init(self, x1, x2, x3):
self.v1 = x1
self.v2 = x2
self.v3 = x3

class SLOTS:
slots = ['x1', 'x2', 'x3']
def init(self, x1, x2, x3):
self.x1 = x1
self.x2 = x2
self.x3 = x3

d = dict(x1=1, x2=2, x3=3)
c = CLASS(1, 2, 3)
s = SLOTS(1, 2, 3)
t = NT(1, 2, 3)

Теперь распечатаем что там по памяти

print(' CLS\t\tSLT\t\tDCT\t\tTPL')
print(f'System: {getsizeof(c)}\t\t'
f'{getsizeof(s)}\t\t'
f'{getsizeof(d)}\t\t'
f'{getsizeof(t)}'
)

CLS SLT DCT TPL
System: 48 56 232 64

Хм, в этой статистике обычный класс самый экономный! Но что-то здесь не так. Неужели он экономичней класса со слотами, который рассчитан на скорость и оптимизацию?
Дело в том, что функция sys.getsizeof() показывает не совсем то что мы ожидаем.
Она берет результат метода __sizeof__ у объекта и добавляет кое-чего от gc.
__sizeof__ возвращает размер, занимаемый данными. Но не учитывает размер обвязки этих данных.
А еще он не гарантирует точность размера типов для third-party расширений.

Для точного измерения размера лучше использовать модуль pympler. Помимо данных он считает сколько места занимает вся структура классов и другая обвязка объекта.

from pympler import asizeof

print(f'Pympler: {asizeof.asizeof(c)}\t\t'
f'{asizeof.asizeof(s)}\t\t'
f'{asizeof.asizeof(d)}\t\t'
f'{asizeof.asizeof(t)}'
)

CLS SLT DCT TPL
Pympler: 416 152 496 160

И вот тут класс со слотами оказывается самым оптимальным решением! И это правильно.
А словарь в этом тесте оказался самый расточительный.

#tricks #libs
929 viewsedited  10:00
Открыть/Комментировать
2021-08-18 12:00:14 Что-то вы гоните насчет "привычного вида формата 755 и 644". Я вот вообще не понял что это!

Действительно, что означают цифры которые мы получили в прошлом посте?

Это кодировка, заключающая в себе режимы доступа к файлу.
Подробней можно почитать в статье про chmod.
Там можно увидеть альтернативное обозначение того же самого с помощью символов r w x, что значит чтение, запись, исполнение.

Чтобы преобразовать восьмеричное число в такое обозначение в Python есть готовая функция

>>> stat.filemode(0o755)
'?rwxr-xr-x'

Мы видим 3 группы по 3 символа, дающие 3 типа доступа для 3 типов юзеров.

А что за знак вопроса в начале?

Давайте передадим в эту функцию необрезанное значение от os.stat

>>> stat.filemode(os.stat(path).st_mode)
'drwxr-xr-x'

Это данные, которые мы безжалостно обрезали в прошлый раз
Первый символ обозначает тип объекта. Это может быть файл (-), директория (d) или симлинк (l).

Вот простая схема данной кодировки

[1][3][3][3]
│ │ │ │
│ │ │ └──> Others Permissions
│ │ └─────> Group Permissions
│ └────────> Owner Permissions
└───────────> File Type

(разверните экран если вы с телефона)

Если вы попробуете получить пермишены для симлинка то получите пермишены для файла

>>> path = '.venv/bin/python3'
>>> stat.filemode(os.stat(path).st_mode)
'-rwxr-xr-x'

Чтобы получить свойства именно симлинка, нужно это явно указать

>>> stat.filemode(os.stat(path, follow_symlinks=False).st_mode)
'lrwxrwxrwx'

#tricks #basic
668 views09:00
Открыть/Комментировать
2021-08-16 12:00:12 Как получить значение прав доступа к файлу в виде привычного формата записи 755 или 644?
В целом, способ вот такой:

>>> path = '...'
>>> print(oct(os.stat(path).st_mode & 0o777).split('o')[-1])
'755'

Теперь разберёмся что всё это значит.

До того как мы сделали split() строка была следующего вида: 0o755
Что это за тип данных? Это тип int в восмиричной системе исчисления. Для преобразования в такой формат есть builtin функция oct()

>>> oct(493)
'0o755'

Как видите, результат возвращается виде строки. Но это не мешает нам создавать переменные синтаксисом восьмеричных чисел, то есть с префиксом 0o. Хотя, при распечатке мы всё равно получим int.

>>> x = 0o777
>>> print(x)
511

Преобразовать эту строку в int можно функцией int(), указав базис 8

>>> int('0o755', 8)
493

Теперь посмотрим что нам возвращает os.stat

>>> perm = os.stat(path).st_mode
33261

Преобразуем в oct

>>> oct(perm)
'0o100755'

Уже почти то что надо. Чтобы оставить только нужное, отрезаем лишнее с помощью оператора & (AND).
Для этого последние 3 значения ставим максимальными, остальные нулевыми.

>>> perm & 0o777
493


Оператор работает с бинарным представлением чисел, то есть операция была вот такая:

0b100000111101101
& 0b111111111
= 0b111101101

Вспоминаем побитовые операторы

Остаётся преобразовать в восьмеричное представление и убрать префикс

>>> oct(493)
'0o755'

>>> oct(493).split('o')[-1]
'755'

Именно в таком виде пермишены файла в коде обычно не используются.
Хранить и использовать их удобно в виде восьмеричного int

os.chmod(path, 0o755)

или строки

os.chmod(path, int('0o755', 8))

А зачем в строке если достаточно в int? Наприрмер чтобы в json была удобочитаемая запись. Так как сериализатор запишет восьмеричное число как обычный десятичный int

>>> json.dumps(0o755)
'493'

Поэтому для удобства пишем его строкой а потом преобразуем в восьмеричный int.

#tricks
504 views09:00
Открыть/Комментировать
2021-08-13 12:00:16 Сегодня на Github закрывается доступ к git-операциям по паролю. Теперь доступ только по токену.
Для входа на сайт следует настроить двухфакторку.

#offtop
703 views09:00
Открыть/Комментировать
2021-08-07 09:00:09 Python и 1000 программ - канал для тех, кто программирует, или хочет научиться программировать на Python

В этом канале:

Книги по Python
Уроки для начинающих и продвинутых.
Классные программы.
Свежие новости из мира Python.

Переходи на канал, и учись новому!
Время двигаться вперёд!
399 views06:00
Открыть/Комментировать
2021-08-04 15:00:10 Часто новичкам трудно найти первую работу в айти. Море требований указанных в вакансиях кажется бездонным, а junior сейчас по комплектации навыков и знаниям - это senior 10 лет назад

Знакомые ребята рассказывают простым языком о навыках и технологиях без которых невозможно найти работу в айти.

Бесплатно прокачивают:
- умение успешно проходить собеседования для получения сочных офферов от топовых компаний
- навыки и понимание технологий, необходимых для успешного получения оффера

Подписывайся, учись и прокачивайся
https://t.me/voiti_it
559 views12:00
Открыть/Комментировать
2021-08-04 12:00:15
У Python есть очень удобная штука - стек вызовов.
Благодаря нему модуль traceback может показать где и что сломалось в момент выброса исключений.

Но иногда Python просто падает без какой-либо информации. Лично меня это регулярно настигает на Windows и очень бесит. Совершенно не понятно что где произошло и как искать причину. Ставить сишные дебаггеры?

Чтобы быстро понять в какой строке ошибка иногда достаточно использовать встроенный модуль faulthandler
Базовое использование очень простое:

python.exe -q -X faulthandler main.py

Если интерпретатор упадёт, то вы хотя бы узнаете какая строчка привела к такому событию.
Попробуйте уронить Python без faulthandler и с ним.

#libs #tricks
662 views09:00
Открыть/Комментировать
2021-08-02 12:00:18 А вы ждёте выхода Python 4? Ну зря ждёте
По словам Гвидо, ему хватило проблем с переходом со 2го на 3й)
Лучше постепенно развивать имеющийся функционал с полной совместимостью кодовой базы чем делать такие резкие изменения.
Велика вероятность что выше 3 мажорная версия более не поднимется.

А как же обещания про невероятные ускорения в Python 4? Очевидно, что теперь они все будут добавляться в 3ю ветку.
Вот здесь можно почитать про планы ускорения
где Гвидо обещает скорость уже в 3.11 и х5 через 4 года!

Здесь можно посмотреть следующие шаги по оптимизации.

#offtop #2to3
670 views09:00
Открыть/Комментировать
2021-07-30 12:00:22
Модуль objgraph позволяет нарисовать граф объектов со связями между ними.
По такому визуальному представлению иногда удобно дебажить архитектуру вашего кода. Особенно когда построение структуры происходит динамически.

Не ставьте слишком большую глубину прорисовки, я как-то поставил 50 и ждал пол часа пока движок отрисует мне 3к нод.
Вряд ли в таком графе можно что-то разобрать. К тому же рендер падает с ошибкой
dot: graph is too large for cairo-renderer bitmaps.
И просит уменьшить скейл до 0.2, а значит даже текста не разобрать.
Так что глубина 3-5 вполне достаточно.

#libs
927 views09:00
Открыть/Комментировать