Получи случайную криптовалюту за регистрацию!

Системный Блокъ

Логотип телеграм канала @sysblok — Системный Блокъ С
Логотип телеграм канала @sysblok — Системный Блокъ
Адрес канала: @sysblok
Категории: Технологии
Язык: Русский
Количество подписчиков: 5.67K
Описание канала:

«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе.
Финалист премии «Просветитель»
sysblok.ru
vk.com/sysblok
fb.com/sysblok
instagram.com/sysblok/
Присоединяйтесь к команде: goo.gl/qbPJuK

Рейтинги и Отзывы

3.50

2 отзыва

Оценить канал sysblok и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

0

4 звезд

1

3 звезд

1

2 звезд

0

1 звезд

0


Последние сообщения 9

2021-05-10 17:15:00 ​​Программирование для филологов и нейропоэзия: интервью с Борисом Ореховым
#interview

Борис Валерьевич Орехов — цифровой филолог, кандидат филологических наук, доцент школы лингвистики факультета гуманитарных наук НИУ ВШЭ. С помощью компьютерных методов Борис Орехов решает разнообразные филологические задачи. Например, исследует устройство башкирского стиха или сопоставляет русские переводы «Илиады».

О чем мы поговорили с Борисом

• Для чего филологу учиться программировать;
• Как стилометрия помогла оценить стилизацию перевода «Илиады»;
• Как затягивание исследований портит имидж Digital Humanities;
• Можно ли посчитать сюжет и смысл произведения;
• Какие схемы формализации сюжета придумала наука;
• Зачем нужны корпуса разных языков;
• Как получилось, что первые поэтические корпуса возникли для русского, башкирского, чешского и персидского;
• Зачем учить нейросети писать стихи;
• Чему мировые Digital Humanities могут научиться у российских.

https://sysblok.ru/interviews/intervju-s-borisom-orehovym/

Дарья Балуева, Варвара Гузий, Даниил Скоринкин
1.6K views14:15
Открыть/Комментировать
2021-05-09 20:44:21
1.6K views17:44
Открыть/Комментировать
2021-05-09 20:43:43 Данные победы: подборка материалов «Системного Блока», посвященных исследованию Великой Отечественной войны
#best #research #visualisation

Каждый год перед 9 мая возрастает посещаемость сайтов ОБД «Мемориал», «Память народа» и «Подвиг народа». Это оцифрованные военные архивы с десятками миллионов записей об участниках Великой Отечественной — выживших или погибших на фронтах войны. В прошлом году «Системный Блокъ» поговорил с техническим руководителем этих проектов — Виктором Тумаркиным: https://sysblok.ru/interviews/my-vytaskivaem-ljudej-iz-nebytija/

У нас есть собственное исследование данных Великой Отечественной войны. В прошлом году мы обработали 26 млн карточек военно-пересыльных пунктов, с которых солдат отправляли на фронт, и таким образом посмотрели на историю ВОВ через историю призыва: https://sysblok.ru/history/neizvestnyj-soldat/

Теперь мы выпустили видеоверсию этого data-исследования:



Динамика призыва в годы войны в РСФСР

Также мы подготовили инфографику по нашему исследованию, прикрепляем ее ниже.

Самый большой подъем призыва ожидаемо совпадает с началом Великой Отечественной войны, он значительно превышает плановые призывы. Призыв начинается за несколько месяцев до июня, хотя плановый призыв должен был проходить ближе к осени. В РСФСР призывная кампания продолжалась до самого конца войны и ослабла только с июня 1945.

Четыре крупных пика связаны призывами на фронт новобранцев, родившихся в 1924, 1925, 1926 и 1927 году. Эти пики выделяются возрастным составом — они почти полностью состоят из молодежи.
1.7K views17:43
Открыть/Комментировать
2021-05-02 16:20:00 ​​История в лицах: как могли бы выглядеть римские императоры
#history #news

Дизайнер виртуальной реальности Даниэль Воршат опубликовал изображения 54 римских императоров. Цель проекта — создать у зрителя ощущение, что перед ним не вселяющий ужас Калигула, а всего лишь человек.

Фотографии создали с помощью нейросети Artbreeder. В начале художник загрузил в ИИ 800 фотографий бюстов римских императоров, снятых под разным углом. Затем все загруженные данные синтезировались в единый портрет.

Если бюстов не было, Воршат опирался на изображения с древних монет или на письменные источники. Сгенерированные картины дизайнер раскрасил вручную: на каждую ушло по 15—16 часов. В процессе он использовал информацию из исторических документов, содержащих описание внешности императоров.

Невозможно узнать, насколько точны изображения Воршата. Однако интерпретации художника пользуются успехом: плакаты с римскими императорами можно купить в интернет-магазине Etsy.

https://sysblok.ru/history/vr-dizajner-ozhivil-54-rimskih-imperatora/

Мария Черных
1.1K views13:20
Открыть/Комментировать
2021-05-01 14:50:00 ​​Виден ли конец «нейронного блицкрига»: компьютерные лингвисты между вычислением и теорией

Восьмой выпуск подкаста Неопознанный искусственный интеллект — с Денисом Кирьяновым
#podcasts

Денис работает в SberDevices, он — один из создателей семейства голосовых помощников «Салют».

В этом выпуске:

01:33 — как делали голосовых помощников «Салют»
03:25 — чем машина все еще хуже человека: проблема целеполагания
06:53 — «писули» от «волшебной машины»: почему GPT-3 генерирует фейковые факты и выдуманные названия рок-групп
10:50 — как сделать персональных помощников более человекоподобными: проактивные ИИ-зануды
14:22 — как машине научиться делать то, чего она никогда не видела
16:55 — конец нейронного блицкрига: «забрасывать железом» компьютерно-лингвистические задачи больше не модно
17:59 — применение лингвистики в разработке голосовых помощников
19:07 — вычислительная лингвистика versus лингвистическая теория
24:30 — лингвисты между двумя стульями: преодолим ли разрыв между теоретиками и компьютерщиками
28:24 — что могут дать компьютерные модели теоретическим лингвистам
31:22 — когда нейросети начнут создавать новые теории
39:31 — ИИ будущего и межкультурные различия
40:54 — как должно быть устроено образование в области автоматической обработки языка
43:42 — Data Science в курятнике и кибер-village

Хайлайты выпуска

1. О «волшебстве» GPT-3

GPT-3 позиционируется как машина, которая может решать много разных задач. Если написать начало стихотворения — модель может продолжить в стихах. Если подать пары фраз на русском и английском — GPT-3 продолжит переводить. А если показать, как превращать длинный текст в короткий, модель научится делать и это.

Поэтому GPT-3 часто называют «универсальным решателем задач». Однако, качество работы GPT-3 пока отстает от человеческого на десятки процентов. Она может иногда сгенерировать хороший и правдивый текст, но в любой момент может породить и фейк. Поэтому GPT-3 сложно считать по-настоящему умной моделью.

2. Об обучении языковых моделей

Исследователи пришли к выводу, что для дальнейшего развития нейросетевых моделей недостаточно только количественных изменений — увеличения мощности серверов или размера корпуса, на котором обучается модель.

Нужно привносить что-то новое в архитектуру — искать способы передать машине больше знаний о реальном мире в каком-либо формальном представлении. Например, с помощью «графов знаний» (knowledge graphs).

3. О взаимосвязи между теоретической и компьютерной лингвистикой

Вопрос о том, как лингвистика поможет NLP, стоит давно, и им занимается много людей. А вот обратный вопрос — как NLP поможет понять что-то фундаментально новое о языке — пока менее популярен.

Сейчас ученые пытаются расшифровать «черные ящики» внтури языковых моделей: появляются статьи о том, что на одном из слоев BERTа находится нечто, похожее на синтаксис, на другом — нечто, похожее на морфологию, и т. д. Вероятно, векторные представления значений, с таким успехом применяемые в NLP, также могли бы обогатить такую область лингвистики, как семантика.

Где нас слушать или читать

Слушайте выпуск на Яндекс. Музыке, Apple Podcasts, Google Podcasts или в подкастах ВК.

Расшифровка и дополнительные материалы — на странице подкаста на сайте «Системного Блока».
1.2K views11:50
Открыть/Комментировать
2021-04-25 14:30:01 ​​Подборка интерактивных карт по истории
#history

Интерактивный палеоглобус — проект, похожий на Google Earth, но показывающий не только современность, но и прошлое. Иллюстрирует, как меняется распределение суши и моря за последние 750 млн лет. Автор — Ian Webster, в основу легли работы геолога Christopher R. Scotese.

Интерактивный атлас поможет разобраться где, когда и какие государства существовали. В легенде карты можно выбрать год — с 3000 лет до н.э. до нашего времени — и увидеть политическую карту того времени. Автор — Luis Muzquiz.

Pangea Politica — карта материка Пангеи, на которой Massimo Pietrobon отметил границы современных государств. Пангея существовала 300 млн лет назад и с течение времени распалась на современные материки.

World Population History — карта, которая показывает, как росло население с 1 г. н.э. до нашего времени, а также прогнозирует дальнейший рост до 2050 года. Один кружок на карте — миллион человек, проживающих в этом регионе. В легенде карты отмечены переломные для развития цивилизации события.

Платформа Orbis рассчитает, сколько времени и денег потребовалось бы вам, чтобы добраться из одного города в другой — во времена, когда не было ни машин, ни поездов, ни самолетов. Можно выставить в приоритет скорость, цену или расстояние, а также указать время года и вид транспорта. Проект создан при Кембриджском университете.

Географический справочник Pleiades — крупнейшая база данных античных мест: это и поселения, и конкретные сооружения, и географические объекты. Каждое памятное место четко привязано к координатам. Всего в базе 37 500 записей. Пользователи могут исправлять неточности и предлагать новые места.

https://sysblok.ru/history/podborka-interaktivnyh-kart-po-istorii/

Светлана Филатова
1.1K views11:30
Открыть/Комментировать
2021-04-23 15:10:00 ​​Как нейросеть заменяет нецензурную лексику на эвфемизмы
#knowhow #nlp

Машинное обучение разрешает менять стилистику текста без изменения содержания. Например, нейросеть сгенерировала песни в стиле Егора Летова, а также ведет аккаунт Neural Meduza в Twitter`е. Однако методы генерации и стилизации текстов приносят и практическую пользу.

ВКонтакте фильтрует комментарии

ВКонтакте тестирует новые функции: сервис учится фильтровать оскорбительные комментарии в сообществах, а также предупреждать пользователей о неприемлемом тоне высказываний. Так как диаметральная смена окраски комментариев — это нарушение свободы слова, нашли полумеру: нецензурная лексика будет заменяться эвфемизмами, а остальные высказывания — «сглаживаться».

Перенос стиля: как это работает

Перенос стиля основан на изменении векторных представлений текстов. Мы уже рассказывали, как создаются такие вектора.

Чтобы научиться переносить стиль текста, потребуется:
1. два корпуса текстов с противоположными стилями: положительный и отрицательный, токсичный и обычный и т.д.
2. автокодировщик, который нужно обучить тому, как представлять тексты в виде векторов

Алгоритм следующий:
1. обучаем кодировщик на обоих корпусах
2. получаем векторные представления текстов стиля 1
3. изменяем полученные вектора в соответствии с векторами текста стиля 2
4. подаем измененные вектора на вход декодировщику
5. получаем тексты стиля 2

Основная задача — изменить векторы так, чтобы на выходе получился текст нужного стиля. Для этого берем векторные представления текстов для обоих корпусов и обучаем на них новую нейронную сеть определять стиль текста. После обучения пытаемся её обмануть: берём вектор текста стиля 1 и добавляем шум. Шум подбираем таким образом, чтобы нейросеть перепутала стиль и на выходе мы получили текст стиля 2.

Альтернативное решение

Есть более сложный и продвинутый метод, который позволяет менять стиль и содержание текста независимо друг от друга. В этом случае вся информация о стиле содержится в одной части вектора, а информация о содержании — в другой.

https://sysblok.ru/knowhow/v-prostranstve-tekstov-detoksikacija-kommentariev-poddelka-otzyvov-i-nejrocenzura/

Михаил Ким
1.2K views12:10
Открыть/Комментировать
2021-04-22 16:30:02 ​​Пообедать у Канта: калининградские ученые воссоздают дом философа в 3D
#digitalheritage

Иммануил Кант — основоположник немецкой классической философии, автор знаменитых «Критик» — проживал в Кенигсберге с 1783 по 1804 год. Кант также известен легендарными застольными вечеринками — обедами, на которые он приглашал своих друзей. Однако дом, в котором он жил, не сохранился: его снесли и построили на его месте новое здание.

К 300-летию философа команда Центра социально-гуманитарной информатики Балтийского федерального университета создает «Виртуальный дом Канта». Проект 3D-реконструкции предполагает визуализацию внешнего вида и помещений особняка, объединённых в интерактивную панораму.

На что опирались при реконструкции

Основной источник — работа Вальтера Курке, служащего муниципального строительного управления Кенигсберга. В 1917 году он воссоздал внешний и внутренний облик дома на основе земельных книг и воспоминаний владельца дома профессора Доббелина.

Также использовали гравюры, открытки, картины этого периода, работы зарубежных и отечественных кантоведов и фотографии вещей Канта из музея в Кенигсберге — треуголки, трости, секретера и пуговицы. При воссоздании столовой опирались на картину Эмиля Дерстлинга «Кант и его сотрапезники».

Как ведется реконструкция

Работа началась с составления чертежей и планировок дома. Дом был двухэтажный, с пристройкой и сводчатым подвалом. На нижнем этаже находились лекционный зал и комната повара, на верхнем — столовая, библиотека, спальня, гостиная и кабинет; на маленьком чердаке жил слуга. Для моделирования выбрали программу 3ds MAX.

В процессе работы выявили и исправили неточности в реконструкции внешнего облика дома: изменили количество люкарн, сделали скатные крыши к каждой их них, создали крышу ангарного типа.

Следующий шаг — поэтапная реконструкция столовой и лекционной комнаты, в которых отразили все предметы быта, декор и даже еду. Сначала создали экстерьер, затем наполнили модель предметами интерьера.

Сейчас команда восстанавливает библиотеку Канта — ведет розыск и оцифровку книг. Это наиболее сложная часть проекта, так как на момент смерти владельца библиотека состояла из пятисот книг и брошюр. В планах — реализовать интерактивный функционал, который позволит «брать» книги с полок и листать их в 3D-формате, а также переходить в режим электронного чтения.

https://sysblok.ru/digital-heritage/poobedat-u-kanta-kaliningradskie-uchenye-vossozdajut-dom-filosofa-v-3d/

Е. В. Баранова, В. А. Верещагин, В. Н. Маслов, М. М. Лопатин
1.2K views13:30
Открыть/Комментировать
2021-04-14 19:21:27 ​Сегодня утром к нашим коллегам из журнала DOXA пришли силовики. Обыски прошли в офисе редакции и домах сотрудников журнала — Армена Арамяна, Наталии Тышкевич, Владимира Метелкина и Аллы Гутниковой. У них изъяли телефоны и компьютеры, а затем всех четверых отвезли на допрос в Следственный комитет.

Причина обысков — видеообращение редакции «Им не победить молодость». В нём DOXA рассказывала о незаконности отчисления студентов за участие в январских митингах. В конце января это видео внесли в реестр запрещенных материалов. Роскомнадзор увидел в ролике призыв несовершеннолетних к участию в несанкционированных митингах. После этого DOXA удалила материал.

Теперь, спустя почти три месяца, против редакторов возбудили уголовное дело по статье 151.2 УК РФ («Вовлечение несовершеннолетнего в совершение действий, представляющих опасность для жизни несовершеннолетнего»). Максимальное наказание по этой статье — до 3 лет лишения свободы.

Мы считаем недопустимым давление на независимые медиа. В знак солидарности с DOXA мы публикуем подборку их материалов, посвященных близким нам темам — гендерному неравенству в науке, цифровизации образования, правам студентов, а также осмыслению феномена соцсетей:

— Исследование гендерного неравенства в академической среде стран СНГ: почему в науке так мало женщин
— Как вузовские общежития (не) соблюдают коронавирусные рекомендации
— Фоторепортаж о жизни и учёбе на самоизоляции
— Перевод выдержки из книги «Что есть социальное в социальных медиа?» медиа-активиста Герта Ловинка
— Об опыте российских и зарубежных вузов сдачи выпускных экзаменов в дистанционном формате
— Почему студентам важно защищать свои права и как это сделать
— Перевод статьи журналиста Пола Эдвардса об исследовании инфраструктуры, технологий и капитализма, и о том, что значит «быть модерным»

Редакция Системного Блока уверена, что DOXA продолжит работу, несмотря на давление. Поддержать журнал можно, оформив разовое или регулярное пожертвование.

#мы_тоже_DOXA
761 views16:21
Открыть/Комментировать
2021-04-13 16:10:00 ​​Исследователи лавин смоделировали гибель группы Дятлова
#news

Некоторые эксперты считают, что смерть девяти туристов из группы Игоря Дятлова в 1959 году — результат схода лавины. Ученые из Швейцарии создали компьютерную модель, которая демонстрирует, как могли развиваться события.

Выяснили, что между размещением группы в лагере и возможным сходом снега прошло 9 часов. Компьютерная программа показала, что длина лавины на склоне горы Холатчахль была около 5 метров. Скользкая поверхность, крутой наклон в 30 градусов, сильные потоковые ветры и большое количество снега перед лагерем, — все это стало причиной гибели туристов.

Создатели проекта разработали модель движения снега, получив данные о силе и давлении на человеческое тело из тестов General Motors. По словам директора Лаборатории снега и лавин, симуляция демонстрирует ночь гибели группы с новой точностью. Однако команда подчеркивает, что представила только вероятную версию событий.

https://sysblok.ru/news/gibel-gruppy-djatlova-smodelirovali-v-laboratorii-lavin/

Варвара Гузий
809 views13:10
Открыть/Комментировать