2020-08-28 14:29:16
По русскому телеграму пронеслась волна рофлов и недовольств по поводу наличия своего канала в "ультраправом списке". Многие критикуют методологию исследования. Ощущение, что сначала была создана сеть по неоднозначным критериям, и только потом стали придумывать гипотезы, которые можно этим доказать. Как результат, исследование не нашло ничего нового, что еще не было бы доказано.
Если бы я был левачком, жаждущим пересажать всех правачков, вот какие изменения я бы сделал в проект, чтобы он был полезнее:
- Чтобы избежать эффекта снежного кома, исследователи ограничили уровень вложенности репостов. То есть от канала, который взяли за корневой, новонайденные каналы могут отходить по цепочке репостов не дальше, чем на какое-то число N. Такой ход вполне обоснован, в сеть и так попало крайне много неправых каналов. Но уже на готовом пуле каналов не были найдены всевозможные связи-репосты пар каналов.
Исследование называет свою получившуюся сеть плотной, но она скорее похожа на дерево. На ~50000 нод-каналов в сети всего лишь ~200000 граней-репостов (это взвешенные грани, но все равно). Из-за этой ошибки только горсть нод-каналов в графе имеет существенный вес. А ведь мы хотим выявить именно самые влиятельные каналы.
- Никак не учитывается количество подписчиков канала. Это число можно использовать как в формуле для веса ноды канала в графе, а также его можно прикрутить к алгоритму поискового алгоритма. Например, если количество подписчиков очень велико, но лимит вложенности почти достигнут, то его стоит обнулить. Без такой фичи многие большие каналы остались без особого внимания. Помимо самого обнаружения, из них можно было потенциально найти гораздо больше правых каналов.
Это также решает проблему с определением корневых каналов. Так как для русского сегмента корневыми были взяты "двач", то самыми крупными "правыми" каналами в русской телеге алгоритм определил мейнстримовые мемные каналы.
- Это уже выходит за рамки исследования социальной сети телеграма, но кроме самого телеграма можно было еще изучить входные точки в правый телеграм. То есть узнать, откуда приходит больше всего новой крови — с ссылок в фейсбуке, инстагргаме или твиттера? И из каких профилей/пабликов? Больше всего, предполагаю, идет с 4chan. Результат такого расследования можно было бы использовать для антиправой модерации этих сервисов.
2.5K viewsedited 11:29