Pan Meditat

Адрес канала:

Категории: Блоги , Познавательное

Язык: Русский

Страна: Россия

Количество подписчиков: 2.76K

Описание канала:

Личный блог Иеронима К. об искусстве, философии, медиа и технологии.

▲ Vote (1)

Рейтинги и Отзывы

4.33

3 отзыва

Оценить канал pan_meditat и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

4 звезд

3 звезд

2 звезд

1 звезд

Последние сообщения

2022-09-01 17:54:13 Есть, конечно, прочтения и подобного толка: машины победили, они все могут сами, теперь у ИИ есть справка, что он "рисует лучше нас".

Можно, в общем, продолжить циничную линию взгляда и сказать, что боятся нейросеток именно те художники, чей псевдокреативный труд легче всего заменить — различные рисователи однообразных фэнтезийных гоблинов и иконок с кричащими головами для мобильных игр. Но это все как бы генеральный подход немного мимо созданной проблемы.

Во-первых, Midjourney, конечно, действительно не умеет рисовать — нейронка собирает кусками картинки из интернета и делает коллаж. Ее преимущество перед человеком не в осмысленности коллажа, а в скорости обработки и единстве фактуры. Коллаж и рисование при этом — несколько разные вещи. Человек все же может интерпретировать то, что видит и мыслит.

Во-вторых, у Midjourney наблюдается серьезная предвзятость как в обработке запросов ("человек" и "азиат" дают практически непересекающиеся результаты), так и в способах, собственно, изображать. Да, первые раз двадцать сохраняется определенный вау-эффект за счет того, что машина хорошо подбирает цвета (это, допустим, история про математику) и ставит вот эти композиции с вертикальными вытянутыми фигурами на фоне чего-то Возвышенного, или рисует толпу в нижней части картинки, и какие-то большие объекты на их фоне; в конце концов, рисует классический портрет в анфас. С позиции закостенелого академика все это математически идеально; но как раз там, где все идеально по каким-то заложенным правилам типа золотого сечения, меньше всего интенциональности/субъектности художника. Чаще всего подобные вещи на традиционных fine arts-ивентах оцениваются по достаточно формальным критериям в первую очередь, без каких-либо эмоций. То, что у этих же судей пока еще не насмотрен глаз на арты Midjourney — дело времени. Для людей с минимальным вниманием эпохи TikTok и анимирующих картинки приложений, а также отсутствием хоть какой-то насмотренности Midjourney срабатывает безотказно. Но достаточно перевести взгляд хотя бы на несколько случайных "непроизводственных" артов не для портфолио в Artstation, и уже от одной перспективы с ракурсами возникнет ощущение укачивания с непривычки после трех вечных сюжетов Midjourney. К тому же, любой генеративный арт является максималистским по умолчанию, что еще сильнее отодвигает нейронку от интенциональности рисования в принципе. Заменить корейского художника-максималиста, рисующего аниме-девочек в космоброне сможет если не Midjourney, то Stable Diffusion; с заменой живописи, эстетически построенной на паре выразительных деталей, уже будет сложно. Нейронки очень зависимы от текста — чем его больше, тем лучше, но они же не умеют работать с тем, чего рисовать не нужно, где зритель должен прочувствовать дефицит в образе.

Можно, конечно, проводить здесь параллель с вещами типа протестного Салона отверженных с импрессионистами и Курбе, или даже с выходками Дюшана, но здесь речь не столько о границах искусства, сколько о достаточно банальном жульничестве — промт-инжиниринг с текстовыми заклинаниями и сам акт рисования как минимум технически слишком удалены друг от друга. Скорее здесь подойдет проблематика рисующих "на чистом холсте" против обрисовывающих фотографии. Возможно, здесь жюри из мира изящных искусств подводит и недостаточный опыт диджитала. Использовать ИИ в более благих целях возможно — очень круто (и открыто, что не менее важно) этим занимается один UI-дизайнер, который активно дорабатывает результаты машин. Но ставить между такой деятельностью и "справкой о том, что машина рисует лучше" знак тождества — наивно, по меньшей мере.

546 viewsedited 14:54

Открыть/Комментировать

2022-09-01 12:45:00 Почему мы верим во всякую чушь?

Несколькими постами ранее я писал об оверфиттинге алгоритмов, но вообще это проблема не только для машин. Мы склонны считать людей, верящих в различные теории заговора вроде QAnon или иллюминатов, недостаточно умными, неспособными критически воспринимать действительность. На самом деле, между сыном рыбака при феодальном строе, готовом поверить в любой рассказ авторитетной фигуры, и модным тиктокером в шапочке из фольги лежит огромная информационная пропасть. Средневековый человек жил в условиях дефицита информации и прозрачности материальных статусов — тогда встречать по одежке и титулу было значительно проще, чем сейчас. Сказал что-то грамотный человек, так оно, наверное, и есть. На эту же динамику отношений указывает опыт общения антропологов с некоторыми племенами, пережившими контакт с современной цивилизацией: я, конечно, сам уже не особо верю в богов моих предков, но мой дядя — еще как! Авторитетный человек, ну и я вроде бы за компанию участвую в ритуалах.

Люди фольги смотрят на мир несколько иначе хотя бы из-за информационного передоза. Понятно, что всегда есть какое-то расхождение между нашим восприятием и реальностью, особенно когда мы воспринимаем ее на глаз, когда смешиваем напитки, например. В принципе, весь наш процесс наблюдения каких-либо феноменов — это попытка отмерить на глаз связи между фактами и нащупать истину. Если видишь в небе хаотично рассыпанные звезды — значит, небо полно шума; различаешь созвездия — соединяешь разрозненные точки в осмысленные конфигурации. Интересное происходит, когда точки в небе начинают двигаться. Кто-то скажет, что это самолет, но тут человек в шапочке из фольги отбросит столь простую теорию: объект движется слишком быстро, слишком грациозно маневрирует.

Бритва Оккама в современном мире перестает быть настолько эффективной — мы все понимаем, что мир действительно сложнее представлений даже десятилетней давности. Простые теории, хоть и могут быть верными по существу, но не всегда точно соответствуют наблюдаемым данным (по любой возможной причине). Самолет — слишком просто, зонтично, и вообще не сходится с моими данными о них. А вот НЛО прекрасно охватывает наблюдаемый феномен. Короче говоря, там, где у одних людей возникает здоровая погрешность, незначительное количество шума ("это все еще самолет, просто быстрая модель"), у других в шуме наблюдаются точки, которые необходимо соединить ("я не видел таких самолетов, значит, это не самолет").

Интересно, что в контролируемых условиях мы сами способны отсекать современное магическое мышление. Например, большинство упертых конспирологов воспринимает шоу фокусников именно как шоу, а не магию. Мы можем понятия не иметь, как работают все эти распиливания "случайных" людей, но все же верим в том, что это все фокусы, а не часть сделки с дьяволом или экстрасенсорные способности. На сцене получаемые нами данные не столько наполнены шумом, сколько ощутимо и безопасно предвзяты — мы знаем, что пришли к фокуснику, поэтому вроде бы и удивляемся происходящему, но вроде не позволяем себя одурачить. Стоит убрать этот проговариваемый контекст, и мы можем получить телевизионных магов, заряжающих воду через экран.

В каком-то смысле проблема с фольгой заключается не в том, что верящие в безумные вещи люди исключительно глупы и испытывают интеллектуальный дефицит — скорее, они излишне внимательны к шуму, слыша в каждом шорохе одного и того же хищника. Остракизм или высмеивание таких людей в наше время скорее приводит к социальному кластерингу, когда искажения каждого участника группы многократно масштабируются. Занятно, что готовность "поверить в тигра" коррелирует с материальным положением человека, так что в целом бедно живущий народ можно легко дурить, выдвигая абсурдные и противоречащие друг другу версии происходящих событий.

682 views09:45

Открыть/Комментировать

2022-09-01 10:09:58

Картинка на злобу дня — на конкурсе изобразительного искусства в рамках мероприятия Colorado State Fair победил сгенерированный ИИ рисунок.

Картина Théåtre D'opéra Spatial была сгенерирована с помощью текстового запроса в Midjourney, пропущена через апскейл и распечатана на принтере.

Наступает если не GANизм (удивлен, что источник не вычислили сразу по характерным признакам), то как минимум какой-то Artstation Fantasy Movement. Вероятно, в будущем промт-инжиниринг станет важным навыком в креативной индустрии.

919 views07:09

Открыть/Комментировать

2022-08-31 16:10:00

Tech Insider показывает зеленые технологии из нашего грядущего и вынужденного соларпанка.

755 views13:10

Открыть/Комментировать

2022-08-31 12:00:51 В продолжение темы оверфиттинга и универсализации — в Индии и Филиппинах уже давно развита индустрия "нейтрализации акцента", основной функцией которой является переподготовка работников. Чтобы во время звонков они говорили примерно с таким же произношением, как у западных клиентов. На самом деле, помимо непосредственно говорения, там заставляют заучивать названия американских географических единиц типа "бульвара", штатов и их столиц. Еще работникам ломают режим дня, чтобы они работали по ночам — из-за разницы по времени с США, конечно.

И вот теперь у нас есть стартап Sanas, разрабатывающий для колл-центров технологию изменения голоса в реальном времени. Разумеется, в приоритете подгонка неамериканских акцентов под говор белых американцев. В рекламном слогане звучат слова про равенство и эмпатию. Сами филиппинцы и индусы, кстати, тоже рады такому новшеству — в колл-центры обычно звонят и без того раздосадованные американцы. Услышав такой акцент, они обычно лишь сильнее раздражаются.

Вопрос в том, помогает ли такая технология преодолеть такую предвзятость, или же в сущности лишь укрепляет ее? Как и в случае модерации контента, перенос колл-центров в такие страны создает множество рабочих мест, в сущности формируя то ли губку для негативных эмоций клиентов, то ли грушу для битья — можно ли здесь говорить о своего рода трудовом колониализме?

792 views09:00

Открыть/Комментировать

2022-08-30 15:01:43

Карта метаболизма человека. Полная версия здесь.

1.9K views12:01

Открыть/Комментировать

2022-08-30 11:37:41 Последние новости о творящих нейросетках и ИИ в целом заставляют в очередной раз задуматься о том, что цифровым технологиям нужна новая политическая философия, со своим понятийным аппаратом. Мыслительные рамки для описания приватности, применимые к ситуации паноптической слежки или частного подглядывания, нельзя просто перенести в среду децентрализованного взаимного слежения. Любой клик кормит темные паттерны, влияющие на наши потребительские привычки или желание голосовать за одно против другого. Любые оставленные в Сети "данные" (data) превращаются во "взятые" (capta), от текста до живописи.

Это раньше в дополнение к каким-то вещам присовокуплялся компьютер. В начале века сложная электроника уже переместилась в центр технокосма; теперь же этот центр занимают плеяды связанных и удаленных от человека машин, к которым он получает временный доступ, начиная с банковских приложений и заканчивая мессенджерами, хранящими данные на своих серверах. В условиях такой неотъемлемости в нашей жизни сложных систем любой "программный инженер" становится, хочет он того или нет, инженером социальным.

Актуальная проблема видится в том, что относительно справедливая система отношений должна реализовать как запрос на справедливость, так и запрос на возможность добиться внутри этой системы какого-то успеха или хотя бы поддержания адекватного уровня жизни. Фундамент конфликта между нами и Алгоритмом заключается в том, что для экономики всякая технология является инструментом сжатия времени, что делает человеческую экспертизу и активность слишком дорогими и медленными. Электронная почта быстрее голубиной, колесо быстрее ноги, двигатель быстрее сердца, Stable Diffusion быстрее художника.

Это напрямую влияет на рынок труда. Корпорации уже не рассматривают резюме соискателей глазами рекрутеров: примерно треть из ста лучших работодателей по версии Fortune использует один и тот же алгоритм отбора Hirevue. Человек в этой цепочке нужен скорее для обслуживания машины, с легкостью заменяющей тысячу эйчаров. На решение человека может повлиять какой-то произвольный фактор — интересный вкус в одежде, такой же свитер, необычная манера говорить. Алгоритмы тоже не лишены влияния таких факторов, ведь мы уже знаем, что при одинаковом наборе требуемых навыков одно и то же резюме может пройти, а может и не пройти порог, выставленный машиной. Если же все будут пользоваться одной вычислительной рамкой, то конкретный "человек в фиолетовом свитере" получит отказ не в одной компании, а во всех сразу. Разница между случайным отказом и возведением произвольных факторов в константу есть разница между мелкой прихотью и цифровым Левиафаном. Звучит парадоксально, но одно из возможных решений здесь — применение решений, снижающих системность или универсальность суждений алгоритмов. Суждения с учетом произвольных факторов не должны всегда возвращать один и тот же результат при оценке людей.

Произвольность решений всегда растет с увеличением масштаба системы, это распространенная проблема машинного обучения. Чрезмерно обученная модель страдает от "оверфиттинга" — она запоминает не столько обобщаемые шаблоны, сколько набор данных, как если бы мы запоминали по отдельности каждое дерево, но не смогли бы сказать, на какой лес мы смотрим, и лес ли это вообще. В противоположном случае модель не срабатывает тогда, когда должна это делать. Желание сделать глаз машины более острым приводит к включению этих самых произвольных факторов. Из популярного: мы хотим, чтобы нейронка различала на фотографиях волков. Волков статистически чаще фотографируют на фоне яркого белого снега, и одним из произвольных факторов может стать именно наличие снега на фотографиях. При достаточной неаккуратности машина может принимать решение, что если на фото нет снега, то нет и волка. Из относительно недавних случаев вспоминается диагностика пневмонии на снимках легких. В этой истории нейронка "научилась" определять наличие пневмонии по штампу на самих снимках — его ставили, если снимок делался портативным сканером. Дело было в том, что больных пневмонией чаще перевозили скорой, где и делали снимки.

813 views08:37

Открыть/Комментировать

2022-08-25 18:08:33 К слову о не/нарушении прав на интеллектуальную собственность. В данном твиттер-треде можно посмотреть на работы ИИ механизма под названием Stable Diffusion, который создан, как написано, в исследовательских целях, и его процесс очень простой: он создаёт копии чужих работ/чужого стиля, совмещая разные элементы в готовые арты. Он это делает намного лучше midjourney потому, что тупо копирует всё 1-в-1 (даже подписи художников он тоже автоматом копирует) и использует, видимо, какие-то фильтры.

Опять же, эта штука не сможет заменить живого художника в созидании живого произведения, но теперь каждый желающий может создавать работы, которые будут похожи на самых популярных художников, и делать на этом деньги, не умея при этом рисовать. Художника выделяет его стиль, он его кормит, и тут его уникальность полностью нивелируется засильем не очень хороших, но вполне узнаваемых копий. Это ИИ тренируется на конкретных художниках (нередко на оплаченных кем-то работах) без спроса.

Stable Diffusion is a text-to-image model that will empower billions of people to create stunning art within seconds. It is a breakthrough in speed and quality meaning that it can run on consumer GPUs.

С одной стороны мы делаем арт доступным всем, даже тем, кто рисовать не умеет, но с другой почему-то упускаем из виду тот факт, что возможным это стало только благодаря тому, что кто-то другой рисовать таки умеет и зарабатывает этим себе на кусок хлеба. Но ИИ, позволяющий без труда создать картинку на основании чужих работ, просто обесценивает этот труд. Мы не убираем в фотографировании ступень “навести камеру, выстроить кадр, поправить модель и щёлкнуть”, прежде чем фильтры ИИ сделают идеальную отретушированную обложку журнала, но почему-то убираем в рисовании ступень “взять в руки карандаш и нарисовать палку огуречик”. Мне вся эта тема напоминает дипфейки и абсолютную незащищённость живых людей от нерегулируемого ИИ.

В журнале Смитсониан вышла статья весной про то, что в США изображения, сгенерированные ИИ не будут подпадать под защиту интеллектуальной собственности, так как у них нет живого автора. То есть а) любая картинка, созданная вами с помощью бота может быть попизжена кем-то ещё и использована с целью наживы (я смотрю на NFT); б) в этом положении игнорируется тот факт, что живой автор стоит за кусками/элементами этих сгенерированных картинок, то есть бот будет создавать идеальные копии/имитации например Грега Рутковски, которые кто-то потом от его имени или как-то ещё спокойно будет продавать и нести за это ноль ответственности (я смотрю на NFT). В Австралии наоборот считают, что сгенерированные картинки можно защищать патентами.

Грустная история. Работы у художников меньше не станет, а вот платить за неё больше точно не будут.

#бытие

1.3K views15:08

Открыть/Комментировать

2022-08-25 18:08:33 Также по теме.

1.2K views15:08

Открыть/Комментировать