Добавить новость
ru24.net
BusinessInsider.com
Октябрь
2024
1 2 3 4 5 6 7 8 9 10 11 12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

Why The New York Times' lawyers are inspecting OpenAI's code in a secretive room

0
OpenAI and Microsoft are defending lawsuits from publishers, authors, and other creators alleging they ripped off their work. They can reshape the generative AI industry.
  • Lawyers for The New York Times are poring through ChatGPT's source code and training material.
  • Copyright cases from publishers and authors are trying to figure out how AI trains on creative work.
  • The lawsuits could chart a path forward, much as Napster's legal morass did two decades ago.

Somewhere in the United States, in a secure room, on a computer unconnected to the internet, sits the source code for ChatGPT.

It is there to be inspected by lawyers for The New York Times.

By the order of a federal judge, the lawyers can only get into the room if they show a government-issued ID to a security guard. They are forbidden from bringing in their own phones, flash drives, or any other electronic devices. They're given a computer — also unconnected from the internet — with a word processing program. After each session, their notes can be downloaded to a different computer, and then the original note-taking computer may be wiped.

The Times' lawyers can share their notes with up to five outside consultants to help them understand what the code does. If one of the lawyers wants to show OpenAI CEO Sam Altman a snippet of the code to ask him questions about it for a deposition, that copy will be destroyed afterward.

OpenAI is worth $157 billion largely because of the success of ChatGPT. But to build the chatbot, the company trained its models on vast quantities of text it didn't pay a penny for.

That text includes stories from The New York Times, articles from other publications, and an untold number of copyrighted books.

The examination of the code for ChatGPT, as well as for Microsoft's artificial intelligence models built using OpenAI's technology, is crucial for the copyright infringement lawsuits against the two companies.

Publishers and artists have filed about two dozen major copyright lawsuits against generative AI companies. They are out for blood, demanding a slice of the economic pie that made OpenAI the dominant player in the industry and which pushed Microsoft's valuation beyond $3 trillion. Judges deciding those cases may carve out the legal parameters for how large language models are trained in the US.

"Developers should pay for the valuable publisher content that is used to create and operate their products," a Times spokesperson told BI. "The future success of this technology need not come at the expense of journalistic institutions."

For the lawsuit, the 173-year-old media company employed an elite law firm, Susman Godfrey, which recently won Dominion's mammoth $787.5 million settlement from Fox News. Other lawsuits from newsrooms, including The New York Daily News and Mother Jones, have latched on to the case.

Susman Godfrey is also representing a group of authors including George RR Martin, Jodi Picoult, and Jia Tolentino, who filed copyright claims months before the Times. If a judge certifies their class-action status, an eventual settlement or judgment could have ramifications for virtually every author and artist whose work has been used to train AI models.

On September 12, dozens of lawyers from the tech and journalism companies packed into a magistrate judge's courtroom in lower Manhattan to figure out the best way to divvy up the discovery process, including inspecting ChatGPT's code and training data. Along with the authors' lawyers, they are still deciding who they can depose and how to schedule the depositions.

"It's as thrilling as things get for law professors who work in copyright," said Kristelia García, an intellectual property law professor at Georgetown University Law.

Setting the rules

With Congress taking a backseat on AI regulation, the industry expects courts to set — or, they hope, not set — the rules.

Many publishers, including Business Insider owner Axel Springer, have struck deals with generative AI companies to share their content for LLM training.

The scope and resources of the Times' lawsuit make it a likely candidate for a precedent-setting Supreme Court. Lawyers are also looking at class action lawsuits from authors, as well a music industry case against Anthropic, as ones to watch.

"The New York Times is a journalistic juggernaut," García said. "It's big, it has a lot of content. More importantly, perhaps, it has a lot of market power behind that content."

The lawsuit argues OpenAI infringed on its intellectual property in two ways.

There is the "input" case — alleging that the LLM illegally hoovered up over 10 million New York Times articles to train ChatGPT and Microsoft Copilot without compensation. And the "output" case — arguing that when asked, ChatGPT can spit out a New York Times article that readers would otherwise pay a subscription for.

In court filings, lawyers have repeatedly cited Napster, which illegally copied millions of songs and made them available for free. OpenAI similarly used high-quality, well-researched, well-written, and fact-based New York Times articles to make ChatGPT so impressive, the Times argues.

If anything, OpenAI is worse, according to Justin Nelson, a Susman Godfrey attorney representing authors in a class action lawsuit running parallel to Times' case and in a similar case against Anthropic.

Napster was a project from college kids; OpenAI is backed by Microsoft and already worth billions.

"Instead of kids, it was a sophisticated company," Nelson told BI. "And instead of doing it for their own personal use, they were doing it for commercial gain.

Representatives for OpenAI and Microsoft didn't respond to requests for comment from Business Insider. In court, they argue the legal doctrine of "fair use" protects how their models ingest the articles. The ChatGPT outputs with near-verbatim copies of Times articles were "highly anomalous" results that aren't representative of how the app is used, they say.

Napster was sued out of existence, but it inspired the music industry to adopt MP3s and, eventually, streaming — now used for everything from video games to movies. Spotify cofounder Daniel Ek has cited Napster as an inspiration, and Napster cofounder Sean Parker has praised Spotify as a successor.

Copyright lawsuits from journalism organizations may set the pace for all AI generators, predicted García, who worked in the music industry for a decade. AI isn't particularly good at generating movies or doing reporting, but it can convincingly mimic journalism.

"Journalism is kind of the canary in the coal mine," García said. "In the same way that music was the canary back in the Napster days, because people could easily torrent an MP3. But you couldn't, at that time, easily torrent a film."

Given the sheer number of people involved, the authors' lawsuits could have an even more dramatic effect. A settlement or judgment could change business models.

"People get creative in class action settlements," said Matthew Sag, an Emory University law professor studying copyright law and artificial intelligence. "You could cut the authors of America in for a percentage of stock or something."

The source code

The nature of generative AI technology itself lies at the heart of the copyright disputes.

What actually happens when a large language model "learns" a book or news article? What about when ChatGPT digs through the model to answer a query? Does the process make a "copy" in any meaningful sense of the word? Or is the training data just part of a big slurry of ones and zeros that no longer meaningfully resemble specific works?

The lawyers and consultants poring through ChatGPT's code are trying to answer those questions. They are also examining the LLM training data and plan to ask key OpenAI executives and programmers — under oath — how the models are meant to work.

Once the code is read and depositions taken, the parties will be in a better position to argue about "fair use," a notoriously tricky legal doctrine that protects the use of "transformative" creations derived from copyrighted material.

If OpenAI really is making copies of books and news articles, Napster-style, then is its training process sufficiently transformative to be considered "fair use"? Judges across the country are "all over the map" in deciding fair use copyright cases, according to Christa Laser, an intellectual property law professor at Cleveland State University, setting up high and unpredictable stakes.

"I think that's going to be the big question at the end of the day that's going to go all the way up to the Supreme Court," Laser told BI. "That question of fair use around training data, ingesting and training."

A key "fair use" question is whether ChatGPT's creations compete with the original journalistic works — an urgent issue for news organizations.

"The news publishers are the first to bring these big suits because they have more on the line," García said.

To make a copyright claim, a plaintiff can't just point to a corpus of work used as inspiration. It needs to point to a specific work they say has been copied.

In its lawsuit, The New York Times attached tens of thousands of pages of exhibits tabulating 10,553,897 articles. It says OpenAI and Microsoft illegally violated the copyrights for each of them.

Among those articles is a 2001 story, shortly after an appellate court ruled against Napster, where a journalist asked users about what they'd do. They all agreed there was no going back.

''If Napster does shut down, there are more sites out there,'' one user told the reporter. ''And they may get a few, but they can't stop all of them.''

Correction: This story previously included Ta-Nehisi Coates among a list of named plaintiffs in a New York-based class action lawsuit brought against OpenAI and Microsoft. He is a named plaintiff in a different class action lawsuit in California.

Read the original article on Business Insider



Moscow.media
Частные объявления сегодня





Rss.plus



Гастроэнтеролог Садыков назвал 3 основные причины непреодолимой тяги к сладкому

Подмосковные росгвардейцы задержали подозреваемого в краже партии товаров из гипермаркета

Учебно-методический сбор гранатометчиков столичного главка Росгвардии завершился в Москве

Кинопоказ в ТРЦ «Нора»: фильм «Чудеса случаются»


Выиграй поездку на Like Party «ДЕВИЧНИК»

К ноябрю в Катунском заповеднике начнет работу музей меда

Как повысить эмоциональные показатели бренда за счет интеграции в детский конкурс

Кто вас только этому научил? Эти 7 пищевых привычек из детства портят вам жизнь


Single family residence sells for $2.4 million in San Jose

The Western auto industry is now locked in a 'Darwinian' make-or-break battle with China, the chiefs of 2 major automakers warn

Cyprus Business Now: high rents, financial support to wine industry, PwC’s Academy Business Professionals Certificate

NIN-SIM linkage of all phone numbers completed, says NCC


ТСД SAOTRON RT41 GUN: практичный, производительный, надёжный

DатаРу становится группой компаний

Осеннее утро в Пушкинских горах.

Поймайте его, если сможете: 17 октября в прокат выходит картина Дмитрия Клепацкого «Схватка»


Metaphor: ReFantazio стала одной из самых популярных игр ATLUS на релизе

Silent Hill 2 players are modding away the fog and freeing the camera to discover hidden detail in the remake

To mark the launch of Metaphor: ReFantazio, Sega is going to make someone a real-life noble, but there's a catch—you'll be joining the nobility of an illegitimate nation in the North Sea with only one resident

Free yourself from stick drift with a Hall effect 8Bitdo controller on sale for $40



EVITA BEAUTY STORE - интернет-магазин косметики премиум-класса!

Поймайте его, если сможете: 17 октября в прокат выходит картина Дмитрия Клепацкого «Схватка»

«Театр на Цветном» открывается оригинальной постановкой «12 клоунов в поисках счастья»

Поймайте его, если сможете: 17 октября в прокат выходит картина Дмитрия Клепацкого «Схватка»




Гастроэнтеролог Садыков назвал 3 основные причины непреодолимой тяги к сладкому

МЧС: в Москве потушили пожар в жилом доме на улице Ивановской

Массаж и лечебная физкультура: показания и противопоказания

Учебно-методический сбор гранатометчиков столичного главка Росгвардии завершился в Москве


Источник 360.ru: на Ивановской улице в Москве загорелся 22-й этаж дома

В Московской области пропала 5-летняя девочка, которую из детсада забрала незнакомка

Стреляли в помощника депутата. Есть ли связь с покушением на убийство Рамзана Кадырова?

Дети из Балашихи приняли участие в благотворительной акции «Добрые крышечки»


Арина Соболенко сместила Игу Швёнтек с первой строчки Чемпионской гонки WTA

Технологическая революция в теннисе: Уимблдон заменит линейных судей на искусственный интеллект с 2025 года

В тени победы Медведева над Циципасом: Эрика Андреева неожиданно выбила младшую сестру Мирру с турнира WTA в Ухани

Александрова победила Кенин и вышла в третий круг турнира WTA 1000 в Ухани


Пожар произошел на 22 этаже жилого дома в Москве

Посвященную творчеству Тютчева экскурсию посетили дети в Балашихе

Politico: НАТО хочет создать новую стратегию отношений с Россией

Евгения Медведева и Алексей Ягудин стали ведущими нового сезона шоу


Музыкальные новости

Анна Павлова и другие красавицы царской России в колоризированных архивных фото

Рок-группа The Doors готовится отмечать свое 60-летие

Со Снуп Догга сняли обвинение в убийстве спустя 28 лет

Народный артист РФ Олег Погудин выступит в Воронеже с программой в честь 100-летия Булата Окуджавы



Поймайте его, если сможете: 17 октября в прокат выходит картина Дмитрия Клепацкого «Схватка»

Поймайте его, если сможете: 17 октября в прокат выходит картина Дмитрия Клепацкого «Схватка»

EVITA BEAUTY STORE - интернет-магазин косметики премиум-класса!

Гастроэнтеролог Садыков назвал 3 основные причины непреодолимой тяги к сладкому


Прослушивания Яндекс Музыка. Увеличение прослушиваний в Яндекс Музыка. Лайки Яндекс Музыка. Подписка на артиста Яндекс Музыка.

Гандбольный «Зенит» уступил в Москве ЦСКА с разницей в 2 мяча в матче лидеров Суперлиги

ЦСКА — «Автомобилист». Видеообзор матча КХЛ с серией буллитов

Группа «Сезон дождей» приняла участие в проекте «Сила родной земли. Песни о вечном»


Продажа КПП и РКПП на автомобили Камаз от www.kamas16.ru: надежность и качество

Капитан «Трактора» Ткачёв оценил старт команды в КХЛ

Несколько улиц в центре Москвы станут пешеходными на два дня

Водитель «Лексуса» погиб после столкновения с автобусом на Рублевском шоссе


Президент Ирана назвал отношения Москвы и Тегерана искренними

Кинопарк "Москино" пригласил гостей на фестивальную программу

«У Запада нет комплексной стратегии в отношении Армении»

Владимир Путин начал первую встречу с Масудом Пезешкианом





Гастроэнтеролог Садыков назвал 3 основные причины непреодолимой тяги к сладкому

Эндоскопист Коршунов оценил риск получения перфорации во время колоноскопии

Мёд в чае — полезен или вреден? Объяснил гастроэнтеролог Садыков

Врач-стоматолог клиники «Мегастом» Наталья Тышкевич: на чем не стоит экономить при лечении зубов


Военный эксперт объяснил, почему после «миротворческих» заявлений Киева становится только хуже

Игорь Грецкий: Байден не примет важных решений в пользу Киева до выборов, чтобы ничто не «срикошетило» в кампанию Харрис

Зеленский в Берлине раскрыл тайну «плана перемоги» 

Роман Алехин: Коротко о важном:. Киев не обсуждает с западом возможное прекращение огня. Об этом заявил Зеленский во время...


Константин Ивлев — специальный гость матча «Динамо» — «Салават Юлаев»

Шахматные выходные в ТРЦ «Нора»

Анастасия Пивоварова стала ведущим экспертом эксклюзивного шоу про теннис на Betboom, в коллаборации с АТР

Ирина Винер соберет российских звезд и чемпионов в своем Дворце гимнастики на гала-концерте «Мы верим твердо в героев спорта»




Собянин: Москва продолжит оказывать помощь участникам СВО и членам их семей

Собянин сообщил о начале строительства нового делового центра в Москве

Собянин: Проект бюджета Москвы сформирован исходя из стратегии до 2030 года

Сергей Собянин. Главное за день


В кинотеатре «Октябрь» в центре Москвы покажут фильм Новгородского режиссёра

Земля сбрасывает лишнее: экстрасенс Миронова назвала дождь в Сахаре знамением апокалипсиса

Мир под угрозой: почему стремительно сократилась численность диких животных

Почти 80 000 туристов посетили Бузулукский бор в прошедшем сезоне


ЧТО ДЕЛАЮТ ПРЯМО НА ТЕННИСНОМ КОРТЕ! ВИДЕО. И очень важные данные для России, США, Европы и всего мира.

Politico: НАТО хочет создать новую стратегию отношений с Россией

Пожар произошел на 22 этаже жилого дома в Москве

Лидеры России и Ирана договорились активизировать реализацию совместных энергетических проектов


В Архангельске открыли аналог детского сада для пенсионеров

Сотрудники ООО «Газпром трансгаз Ухта» очистили берега рек России

Ледовое усиление: как в России развивается гражданское судостроение

Борис Розинг – изобретатель телевидения


Литературно-фольклорная программа «Хлебу – почтение вечное!»

Выставка классика-юбиляра «Все было подвластно ему...»

Литературный час «Время мое в грядущем...».

Прогноз погоды в Крыму на 11 октября


ЧТО ДЕЛАЮТ ПРЯМО НА ТЕННИСНОМ КОРТЕ! ВИДЕО. И очень важные данные для России, США, Европы и всего мира.

Суд арестовал денежные средства экс-мэра Сочи Копайгородского

Немецкие СМИ: в 2023 году в Россию из ФРГ было поставлено более 300 станков для производства боеприпасов

Посудомойку кадетского корпуса СК обвиняют в участии в терорганизации












Спорт в России и мире

Новости спорта


Новости тенниса
ATP

Шанхай (ATP). 1/2 финала. Синнер поборется с Махачем, Джокович – с Фрицем






Источник 360.ru: на Ивановской улице в Москве загорелся 22-й этаж дома

Вильфанд: на юге России произойдет взрыв тепла

Politico: НАТО хочет создать новую стратегию отношений с Россией

В Москве прошла торжественная церемония открытия фестиваля «Наука 0+»