Добавить новость
ru24.net
Game24.pro
Август
2024
1 2 3 4 5 6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

GeForce GPU giant has been data scraping 80 years' worth of videos every day for AI training to 'unlock various downstream applications critical to Nvidia'

0
 GeForce GPU giant has been data scraping 80 years' worth of videos every day for AI training to 'unlock various downstream applications critical to Nvidia'

"Full compliance with the letter and the spirit of copyright law,” says Nvidia.

Leaked documents, including spreadsheets, emails, and chat messages, show that Nvidia has been using millions of YouTube videos, Netflix, and other sources to train an AI model to be used in its Omniverse, autonomous vehicles, and digital avatar platforms.

The astonishing, but perhaps not surprising, scope of the data scraping was reported by 404 Media, who investigated the documents. It discovered that an internal project codenamed Cosmos (the same name but different to Nvidia's Cosmos Deep Learning service) had staff use dozens of virtual PCs on Amazon Web Service (AWS) to download so many videos per day that Nvidia accumulated over 30 million URLs in the space of one month.

Copyright laws and usage rights were repeatedly discussed by the employees, who found some creative ways to prevent any direct violation of them. For example, Nvidia employed the use of Google's cloud service to download the YouTube-8M dataset, as directly downloading the videos isn't permitted by the terms of service. 

In a leaked Slack channel discussion, one person remarked that "we cleared the download with Google/YouTube ahead of time and dangled as a carrot that we were going to do so using Google Cloud. After all, usually, for 8 million videos, they would get lots of ad impressions, revenue they lose out on when downloading for training, so they should get some money out of it."

404 Media asked Nvidia to comment on the legal and ethical aspects of using copyrighted material for AI training and the company replied that it was in "in full compliance with the letter and the spirit of copyright law."

With some datasets, their use is only permitted for academic purposes and although Nvidia does conduct a considerable amount of research (internally and with other institutions), the leaked materials clearly show that this data scraping was intended for commercial purposes.

Nvidia isn't the only firm to be doing this, of course—OpenAI and Runway have both been accused of knowingly using copyrighted and protected material to train their AI models. Interestingly, one source of video content that you'd think Nvidia would have no problem using is gameplay footage from its GeForce Now service—but the leaked documents show that's not the case.

A senior research scientist at Nvidia explained why to other employees: "We don't yet have statistics or video files yet, because the infras is not yet set up to capture lots of live game videos & actions. There're both engineering & regulatory hurdles to hop through."

AI models have to be trained on billions of data points and there's no way around this. Some datasets have very clear rules for their use, whereas others have fairly loose restrictions, but when it comes to laws on the use of copyrighted materials, it's very clear what can and can't be done, even if the application of it to AI training isn't 100% transparent.

AI, explained

OpenAI logo displayed on a phone screen and ChatGPT website displayed on a laptop screen are seen in this illustration photo taken in Krakow, Poland on December 5, 2022.

(Image credit: Jakub Porzycki/NurPhoto via Getty Images)

What is artificial general intelligence?: We dive into the lingo of AI and what the terms actually mean.

It's not just about copyright, either, as video content often contains personal data. While there isn't a single, overriding federal law in the US that is directly applicable here, there are plenty of regulations concerning collecting and using personal data. In the EU, the General Data Protection Regulation (GPDR) is a law that is expressly clear on how such data can be used, even outside of the EU.

One might also wonder what would happen if a company such as Nvidia is found to have breached various regulations whilst training its AI models—if that system is being used across the globe, would it then be blocked in specific countries? Would the likes of Nvidia be willing to make a new model, trained with all permissions granted, just for those locations? Is it even possible to 'untrain' a system and start afresh with legally compliant data?

Whatever one feels about AI, it's clear that there needs to be a more urgent push for transparency, especially when it concerns the use of copyrighted and personal data for commercial purposes. Because if tech companies aren't held accountable, then data scraping will continue ad hoc.




Moscow.media
Частные объявления сегодня





Rss.plus



Итоги в цифрах

Обращение иерея Александра Туховского

Росгвардейцы устроили участникам летнего лагеря настоящий урок мужества

Филиал № 4 ОСФР по Москве и Московской области информирует: В Московском регионе свыше 11,3 тыс. неработающих родителей получают пособие по уходу за ребенком до 1,5 лет


Спортмастер запустил новую рекламную кампанию

8 опасных насекомых и членистоногих, с которыми лучше не сталкиваться

Появились насекомые, которые залезают под кожу российских туристов и откладывают там личинки: на популярном курорте началась паника

Лучших сотрудников филиала «Красноярский» компании «ЛокоТех-Сервис» поощрили накануне празднования Дня железнодорожника


Transform Your Car with Tintex: A Comprehensive Guide

Pole vaulter Mondo Duplantis pays tribute to viral pistol shooter Yusuf Dikec after setting Olympic record

President assures there will be no cover-up in Vasiliko contract failure

Man Utd 0 Liverpool 3: Red Devils will hope £36.5m Joshua Zirkzee will have an impact as Prem rivals run riot in US


Военные следователи провели рейд по бывшим мигрантам в Феодосии

После атаки БПЛА на микрорайон Болховский в Орле есть один пострадавший

Филиал № 4 ОСФР по Москве и Московской области информирует: Пенсии работающих пенсионеров начнут индексироваться с 2025 года

Суд пересмотрит приговор по делу экс-губергатора Хабаровского края Сергея Фургала


Новый трейлер Titan Quest 2 и страница в Steam

Don't expect Dragon Age: The Veilguard before October at the absolute earliest

Diablo 4 players finally unearth a secret ring they've been looking for since it launched over a year ago—and it's utter trash

Мафия-НН: Большой город всегда долго собирается.



Филиал № 4 ОСФР по Москве и Московской области информирует: Пенсии работающих пенсионеров начнут индексироваться с 2025 года

Филиал № 4 ОСФР по Москве и Московской области информирует: В Московском регионе свыше 11,3 тыс. неработающих родителей получают пособие по уходу за ребенком до 1,5 лет

Росгвардия обеспечила безопасность во время матча «Спартак» - «Крылья Советов»

Итоги в цифрах




Филиал № 4 ОСФР по Москве и Московской области информирует: Пенсии работающих пенсионеров начнут индексироваться с 2025 года

Читатели выберут лучший рассказ школьников из России и стран СНГ

Итоги в цифрах

РЕПОРТАЖ: Территория будущего


В доме на западе Москвы взорвалась граната. Погиб военный пенсионер

Кириленко: желаю «Спартаку» занять первое место в РПЛ

С 1 сентября финансирование школ и детсадов в Москве будет увеличено — Собянин

Кратковременные дожди и грозы обрушатся на Москву 6 августа


Российские теннисистки Мирра Андреева и Диана Шнайдер проиграли финал Олимпиады, у мужчин золото взял серб Новак Джокович

Олимпиада в Париже. Новак Джокович впервые в карьере выигрывает золото Игр

Парижский прииск Новака Джоковича // Он выиграл золото на своей пятой Олимпиаде

Алькарас расплакался после поражения в финале Олимпийских игр в Париже


Приложение «VK Видео» стало самым скачиваемым у россиян

Курская область заняла 17 место по уровню цифровой трансформации в России

Геннадий Онищенко: Чукотка – один из самых пьющих регионов России

Раскидало мебель, выбило стекла: москвич погиб при взрыве в квартире


Музыкальные новости

Игорь Бутман: у музыкантов должно быть братство вне политики

«Мне стало обидно, что он говорит плохо про меня и мою страну». Марину Кравец обидели слова незнакомца в Америке

«Врет»: основательница WB Бакальчук процитировала Алсу, объясняя причины развода

Цой — жив: на винтажном маркете отмечают день памяти культового певца



Футболисты "Спартака" разгромили "Крылья Советов" в матче МИР РПЛ

Росгвардия обеспечила безопасность во время матча «Спартак» - «Крылья Советов»

Итоги в цифрах

Филиал № 4 ОСФР по Москве и Московской области информирует: Пенсии работающих пенсионеров начнут индексироваться с 2025 года


Туляки вышли в финал XII летней Спартакиады учащихся России по шахматам

Пассажир перебежал из одного самолёта в другой прямо по лётному полю во Внуково

Юлия Пересильд показала редкое фото с дочерьми в Казахстане

Нереальный конфуз или подстроено? Захарова раскрыла промахи охраны при покушении на Трампа


РОСГВАРДЕЙЦЫ ЭВАКУИРОВАЛИ МУЖЧИНУ ИЗ ГОРЯЩЕГО АВТОМОБИЛЯ САРАТОВСКОЙ ОБЛАСТИ

«Другое Дело» и BelkaCar проверят молодых водителей на знание правил каршеринга

РОСГВАРДЕЙЦЫ ЭВАКУИРОВАЛИ МУЖЧИНУ ИЗ ГОРЯЩЕГО АВТОМОБИЛЯ САРАТОВСКОЙ ОБЛАСТИ

Росгвардейцы спасли пострадавших в ДТП в Запорожской области


Плюсы Новосибирска для переезда госкорпораций назвал доцент НГУЭУ Эдуард Коложвари

Ким Чен Ын не исключил обращения к Москве за помощью из-за наводнения

В годовщину трагедии Хиросимы в Японии обвинили Москву в угрозе применения ядерного оружия

Чибис предложил построить в Мурманске кампус для среднего профобразования


Свыше 2,5 тыс. случаев заболевания коронавируса выявили в столице за неделю

За последнюю неделю в столице выявили более 2,5 тысяч случаев заболевания COVID-19




Врач дерматолог-косметолог Мадина Байрамукова: какие бьюти-процедуры сегодня самые востребованные

Ракова: Онкологические стационары Москвы перешли на безбумажный формат работы

Актуальные данные о донорстве крови опубликовали в Подмосковье

Врач-стоматолог Татьяна Сумцова: почему нужно быть осторожным при покупке зубной пасты из Индии


Стало известно, где находится тайное убежище Зеленского

Может ли Киев готовиться к переговорам


Футболисты "Спартака" разгромили "Крылья Советов" в матче МИР РПЛ

Росгвардия обеспечила безопасность во время матча «Спартак» - «Крылья Советов»

Звезды Детского радио выступили на празднике для всей семьи «Достигая цели!»

Игрок Медиалиги Бозаджи: все живы, помогаем следствию




С 1 сентября финансирование школ и детсадов в Москве будет увеличено — Собянин

Собянин рассказал о культурных мероприятиях в московских усадьбах

Собянин: На северо-западе Москвы появятся новые школы, детсады и спорткомплексы

Собянин: Популярность московских усадеб растет благодаря городским фестивалям


Владимир Ефимов: В поселке Завода «Мосрентген» построили ливневые очистные сооружения

В Москве пройдет неделя финансовой грамотности

«Группа компаний «ДАФ» подарила Кашире десять контейнеров для раздельного сбора мусора

Кресла с массажем, «амфибии» и спорткар от Xiaomi: что удивило на Chinese Motor Show 2024


Раскидало мебель, выбило стекла: москвич погиб при взрыве в квартире

РЕПОРТАЖ: Кукурузный квест

Курская область заняла 17 место по уровню цифровой трансформации в России

Ночь в кино: жителям столицы анонсировали кинопоказы


«Водник» проводит сборы перед юбилейным сезоном

Пропавшую под Архангельском двухлетнюю девочку нашли живой в болоте

Премьера пространственной симфонии состоялась в Архангельской области

Пять наград завоевали юные туристы из Кемерова на Всероссийском слёте


В путь-дорогу: подборка полезных мобильных приложений для водителей

Жизнь замечательных людей Крыма. Евгений Веремеенко

Вечер любимого сатирика «Снова хочется сказать что-нибудь хорошее»

Выставка-портрет «Мастер исторического и портретного жанра»


Проект «Московское долголетие» запускает телевизионное шоу

Жители Люберец пожаловались на извращенцев-мастурбаторов в электричках МЦД-3

Суд отклонил жалобу на арест экс-главы Департамента культуры Москвы Кибовского

Росгвардия обеспечила безопасность во время матча «Спартак» - «Крылья Советов»












Спорт в России и мире

Новости спорта


Новости тенниса
ATP

ATP частично удовлетворила апелляцию Шаповалова. Его оштрафовали, но сохранили призовые и очки






Этой осенью на MITEX впервые покажут инструмент для ландшафтного дизайна

Жители Люберец пожаловались на извращенцев-мастурбаторов в электричках МЦД-3

С 1 сентября финансирование школ и детсадов в Москве будет увеличено — Собянин

Повышение транспортной связанности страны