2024-01-04 11:59:49
LIDA — инструмент для визуализации данных и создания инфографикиПополняем копилку полезных open source-проектов инструментом для тех, кто занимается визуализацией данных: LIDA от Microsoft.
Это библиотека Python из 4 модулей: SUMMARIZER создает описание загруженных в него данных.
GOAL EXPLORER задает цели — что надо визуализировать — сам или с подачи пользователя.
VISGENERATOR создает, модифицирует и исполняет код для визуализации данных.
INFOGRAPHER генерирует на их основе инфографики. Эта функция еще в бете.
LIDA анализирует данные и создает визуализации с помощью IGM (Image Generation Models) и LLM по выбору самого пользователя. Работает с OpenAI, Azure OpenAI, PaLM, Cohere и Huggingface. Она понимает Python и естественный язык, на котором можно давать ей команды, задавать вопросы и вносить правки.
Есть два режима работы: Автоматический. Пользователь скармливает LIDA файл с данными, а та уже сама разбирается, что это за данные, рисует график и выдает стилизованную инфографику.
Полуавтоматический. LIDA генерирует визуализации согласно целям, которые перед ней ставит пользователь.
Как это выглядит, можно увидеть в ролике на странице проекта. Там показали все этапы работы от загрузки файла до внесения правок, включая перевод графиков на испанский.
Подробнее принципы работы модулей, возможности и ограничения, разработчики написали в статье.
Главными преимуществами LIDA они называют:
гибкость и возможность модифицировать каждый модуль под свой запрос;
простоту и универсальность — пользователь решает все свои задачи с помощью одного инструмента, и ему не нужно искать и прикручивать что-то дополнительно;
масштабируемость. Эволюционируют LLM — эволюционирует и LIDA вместе с ними.
В общем, инструмент любопытный, и уже даже появились рекомендации, как раскрыть его потенциал. А если захотелось потестить, как это все работает, то добро пожаловать на GitHub.
25.5K views08:59