Получи случайную криптовалюту за регистрацию!

Copilot - лучший напарник , чтобы получить иск? GitHub 29 июн | Законы Мура

Copilot - лучший напарник , чтобы получить иск?

GitHub 29 июня представили нейросетевой помощник программиста Copilot, работающий на базе OpenAI Codex. В основе обучения алгоритма лежал датасет из терабайтов программного кода, находящегося в общедоступных репозиториях. Сразу же после представления данной технологии по Интернету пронеслись тонны постов и сообщений с мемами и восторгами. Однако, после того как шум поутих, в сети начали всплывать уже не настолько доброжелательные посты.

В частности, можно отметить два случая. Во-первых, вместо строк кода Copilot иногда генерирует комментарии из проектов с открытым исходным кодом. Во-вторых, Copilot периодически выдает API ключи из open-source репозиториев нерадивых инженеров, которые оставляли их в публичном доступе.
Более того, возникают некоторые правовые вопросы, в частности может ли GitHub использовать код своих пользователей в каких-либо целях. Terms of Service GitHub указывает, что пользователь дает неисключительную лицензию на объект интеллектуальной собственности с правом хостить код и использовать его для "улучшения функционала и инструментов GitHub".

Но как быть с пермиссионными или копилефт лицензиями? GitHub признались, что использовали весь код без учета типа лицензии, а также подтвердили, что Copilot создает производные работы из ранее полученных входных данных, что может считаться производным продуктом программного обеспечения. Технически, использование кода происходит до какой-либо публикации произведения под одной из открытых лицензий. Однако такие аргументы не удовлетворят сообщество. Получается, что платформа может захватывать код без необходимости дальнейшего раскрытия кода как в случае с рядом вирусных лицензий семейства GPL.

GitHub в дополнении усиливает свою позицию заявлением о том, что обучение МL моделей на основе общедоступных данных считается fair use. В США еще не существует прецедентов подобного характера. Это подтверждают исследователи из Стэнфорда, которые также заявляют о том, что данный механизм применения данных должен признаваться fair use. При этом проводится аналогия с кейсом Google Books, когда Google скачали и проиндексировали более 20 миллионов книг для создания литературной поисковой базы данных. Тогда SCOTUS согласился с аргументами платформы.

Скорее всего данный кейс попадет прямиком в суд, так как уже назревают подвижки к судебному разбирательству. Ожидается, что поднимутся вопросы нарушения лицензий, IP на код пользователей GitHub. Более того, возможно решится вопрос о нарушении IP by AI и вообще положения AI в IP. Будем наблюдать.