Микрооптимизации парсинга в промышленных масштабах Алексей Мер | Parsing Conf
Микрооптимизации парсинга в промышленных масштабах Алексей Меркулов
Парсинг нужно делить на разные итерации задач: краулинг, временное хранение данных (очереди), обработка данных, запись данных, прокси, контейнеры. Я расскажу о причинах такого разделения и как это все между собой связывать, как подбирать инструменты и языки под исполнения каждой задачи.