An open, billion-scale corpus of images interleaved with text. MultimodalC4 is a multimodal extension of c4 that interleaves millions of images with text. Открытый миллиардный корпус изображений, чередующихся с текстом. Github: https://github.com/allenai/mmc4 Paper: https://arxiv.org/abs/2304.06939v1 Dataset: https://paperswithcode.com/dataset/c4 ai_machinelearning_big_data 3.1K views10:18