Получи случайную криптовалюту за регистрацию!

An open, billion-scale corpus of images interleaved with text. | Machinelearning

An open, billion-scale corpus of images interleaved with text.

MultimodalC4 is a multimodal extension of c4 that interleaves millions of images with text.

Открытый миллиардный корпус изображений, чередующихся с текстом.

Github: https://github.com/allenai/mmc4

Paper: https://arxiv.org/abs/2304.06939v1

Dataset: https://paperswithcode.com/dataset/c4

ai_machinelearning_big_data