В рубрике больших открытых наборов данных стандарт сериализаци | Ivan Begtin
В рубрике больших открытых наборов данных стандарт сериализации данных HDT [1], используется для бинарной сериализации данных в формате RDF, используемом при разработке проектов в области семантического веба и онтологий. На сайте стандарта опубликовано множество датасетов [2] самый большой из них - набор данных Wikidata размером в 149GB.
Для работы с этим форматом есть библиотеки для C++ и Java, а также настольное приложение.
I write about Open Data, Data Engineering, Government Technologies, Privacy and Digital Preservation and other gov and tech stuff. Chat https://telegram.me/begtinchat. Facebook - https://facebook.com/...