Добавить новость
ru24.net
World News in Spanish
Июль
2024
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
26
27
28
29
30
31

Llama 3.1: Comprendiendo el potencial y las limitaciones

0

Meta* ha lanzado Llama 3.1 405B, un modelo de inteligencia artificial que marca un importante avance en el campo de los modelos de lenguaje grande (LLM). Este modelo no solo demuestra capacidades de última generación, sino que también refuerza la importancia de fomentar una cultura de Open Source en el desarrollo de tecnologías avanzadas.

El Open Source (Open Source) es un modelo de desarrollo de software en el que el código fuente del programa es accesible, disponible y puede ser modificado y distribuido libremente por cualquier persona. Este enfoque fomenta la colaboración y la transparencia, permitiendo a desarrolladores de todo el mundo contribuir, mejorar y adaptar el software a sus necesidades específicas. Los proyectos de Open Source a menudo se desarrollan de manera comunitaria, y los usuarios pueden usar, estudiar, cambiar y compartir el software de forma gratuita.

El nombre “Llama 3.1″ refleja la versión y la evolución del modelo. “Llama” es el nombre dado a esta serie de modelos de lenguaje desarrollados por Meta. El número “3.1″ indica que esta es la tercera generación del modelo con una actualización menor, lo cual sugiere mejoras y refinamientos respecto a versiones anteriores. La cifra “405B” se refiere al tamaño del modelo en términos de parámetros, específicamente 405 mil millones de parámetros. Para darnos una idea de la dimensión, LeNet, uno de los primeros y más influyentes modelos de redes neuronales convolucionales (CNN) desarrollado por Yann LeCun en la década de 1990, tenía aproximadamente 60 mil parámetros.

En el contexto de los modelos de lenguaje, los parámetros son valores que el modelo ajusta durante el entrenamiento para aprender patrones y realizar predicciones. Un mayor número de parámetros generalmente implica un modelo más complejo y capaz de capturar relaciones más sutiles en los datos, lo que resulta en un mejor desempeño en diversas tareas de procesamiento de lenguaje natural.

Llama 3.1 405B está construido sobre una arquitectura de Transformer, una estructura común en muchos modelos de lenguaje exitosos. Aunque mantiene la estructura central, Meta ha realizado adaptaciones menores para mejorar la estabilidad y el rendimiento durante el entrenamiento. Un aspecto clave es la exclusión de la arquitectura Mixture-of-Experts (MoE), lo que prioriza la estabilidad y escalabilidad del modelo.

El proceso de Llama 3.1 comienza con el texto de entrada dividido en tokens, que luego se convierten en representaciones numéricas llamadas token embeddings. Estas representaciones se procesan a través de múltiples capas de self-attention (autoatención) para analizar las relaciones entre tokens y entender su significado y contexto. Los Transformers con self-attention pueden procesar múltiples palabras simultáneamente. Este paralelismo acelera significativamente los tiempos de entrenamiento e inferencia, haciendo que el modelo sea más eficiente. Posteriormente, la información se pasa a través de una red, combinando y refinando los datos para derivar un significado. Este proceso se repite varias veces, permitiendo al modelo generar respuestas coherentes y relevantes de manera iterativa.

El desarrollo de Llama 3.1 405B implicó un entrenamiento multifase. Inicialmente, el modelo se sometió a un preentrenamiento con una vasta colección de datos que abarcan trillones de tokens. Este preentrenamiento permite al modelo aprender gramática, hechos y habilidades de razonamiento a partir de los patrones y estructuras encontrados en los datos.

Tras el preentrenamiento, el modelo pasa por rondas de ajuste fino supervisado (SFT) y optimización de preferencia directa (DPO). SFT implica entrenar el modelo en tareas específicas con retroalimentación humana, mientras que DPO se centra en refinar las respuestas del modelo basándose en las preferencias de evaluadores humanos. Meta ha puesto un fuerte énfasis en la calidad y cantidad de los datos de entrenamiento. El proceso de preparación de datos incluyó filtrado y limpieza extensivos para mejorar la calidad de los conjuntos de datos. Además, el propio modelo 405B se utiliza para generar datos sintéticos, que se incorporan en el proceso de entrenamiento para refinar aún más sus capacidades.

Entrenar un modelo tan complejo como Llama 3.1 405B requiere una enorme cantidad de poder computacional. Meta utilizó más de 16 mil GPUs NVIDIA H100 (o tres mil 491 Jetson AGX Orin de NVIDIA como la computadora que uso diariamente) para entrenar este modelo eficientemente. Además, aplicaron una técnica llamada cuantización, que reduce la precisión de los pesos del modelo de 16 bits a 8 bits, simplificando los cálculos internos y mejorando la eficiencia del modelo en aplicaciones del mundo real.

Llama 3.1 405B ofrece diversas aplicaciones potenciales gracias a su naturaleza de Open Source. Entre estas aplicaciones se incluyen la generación de datos sintéticos, la destilación de modelos para crear versiones más pequeñas y eficientes, y el desarrollo de soluciones específicas para diversas industrias como la salud, las finanzas y la educación. El compromiso de Meta con la accesibilidad y la transparencia en IA permite que la comunidad global participe plenamente en el desarrollo y aplicación de esta tecnología. Al proporcionar modelos descargables y personalizables, Meta fomenta la innovación y asegura una distribución equitativa de los beneficios de la inteligencia artificial.

Llama 3.1 405B representa un hito significativo en los modelos de lenguaje de Open Source. Con su enfoque en la accesibilidad, la innovación y la seguridad, Meta está allanando el camino para una nueva era en el desarrollo de la inteligencia artificial, donde la colaboración y la participación global son fundamentales para aprovechar plenamente el potencial de esta tecnología transformadora.

*Anuncio original de Mark Zuckenberg https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/

**Noticia de Meta en español al respecto del comunicado https://about.fb.com/ltam/news/2024/07/presentamos-llama-3-1-nuestro-modelo-de-lenguaje-a-gran-escala-mas-capaz-hasta-la-fecha/




Moscow.media
Частные объявления сегодня





Rss.plus



Филиал № 4 ОСФР по Москве и Московской области информирует: С начала 2024 года 140 тысяч женщин и новорожденных Московского региона получили услуги по родовым сертификатам

Филиал № 4 ОСФР по Москве и Московской области информирует: Родители 240,5 тыс. детей в Московской области получают единое пособие

Филиал № 4 ОСФР по Москве и Московской области информирует: За полгода 14,9 тысячи жителей Московского региона оформили страховую пенсию в автоматическом режиме на портале госуслуг

Спортивные игры в СЛД "Москва-Сортировочная" филиала "Московский"


Малинки – чудесный парк птиц в Ростовской области у трассы М4-Дон

22 июля Всемирный день мозга. Отвечаем на популярные вопросы о когнитивных расстройствах

"Кедровые острова" дали первые всходы

Молодеем при помощи прически и макияжа


Kim Cattrall says she won’t return to ‘Sex and the City’ sequel’s third season

Mikel Arteta demands more Arsenal signings as he gives cryptic update on Riccardo Calafiori transfer

Why you should buy physical copies of your favorite books

Kamala Harris’s Record on Israel Raises Questions About Support for Jewish State if Elected US President


Туманы начала июня на Ладоге

Каршеринг BelkaCar открыл новые зоны в регионах ближнего Подмосковья

Свечение Жеребцовой горы...

Quto: почему троит двигатель


D&D's new 2024 Player's Handbook will have 10 species to choose from including goliaths, and drow will be closer to their Baldur's Gate 3 version

Warner Bros acquires MultiVersus devs as it shifts focus to free-to-play

Conscript is an old school survival horror game where the horror is just that you're in World War 1

Игра Legend of Goddess: The Last War с откровенными скинами персонажей появилась на Android



Будут ли магнитные бури сегодня, 25 июля 2024 года?

Выпуск слушателей состоялся в Центре профподготовки Росгвардии в Москве

Более 40 тысяч семей в Москве и области получают ежемесячные выплаты из средств материнского капитала

Филиал № 4 ОСФР по Москве и Московской области информирует: С 1 августа Соцфонд увеличит страховые пенсии россиян




Нежилое помещение свободного назначения можно приобрести в Ново-Переделкино

Филиал № 4 ОСФР по Москве и Московской области информирует: С начала 2024 года 140 тысяч женщин и новорожденных Московского региона получили услуги по родовым сертификатам

Лауреат конгресса REVERANS BEAUTY в номинации Best Business Consulting — Шультайс Виолетта

В Москве таксист поссорился с пассажиром, устроил аварию и выстрелил оппоненту в голову


Суд арестовал москвича за демонстрацию татуировки с нацистской символикой

Спасший младенца от похитителя в Москве курьер рассказал подробности инцидента

Роснефть разработала экологически безопасную технологию по переработке буровых отходов

До чего ж хорош русский капитализм!


В России "отдали" Рыбакиной медаль Олимпиады-2024

Названа причина поражения Хачанова во втором круге Уимблдона

Елена Веснина показала свой номер в Олимпийской деревне: видео

Синнер не смог вылететь на Олимпиаду в Париж из-за проблем со здоровьем


Дмитрий Песков: Кремль не может "влезать" в ситуацию с Wildberries

Аналог Belgee X50 (Geely Coolray), который не только адаптирован для России, но и выходит изначально у нас. Появились новые детали о Jetour X50

В Москве поймали террориста, разыскиваемого Интерполом

Коллегия во второй раз перенесла слушания по делу судьи Артема Матеты


Музыкальные новости

Суд обязал Сергея Шнурова и его агента вернуть 90 млн руб за сорванный концерт

Кухня – рай для бактерий: доктор Кутушов рассказал о скрытых рассадниках микробов

Джазовый оркестр Игоря Бутмана выступил в Твери в рамках юбилейного гастрольного тура

Актриса Лужина пожалела, что у нее не было романа с Высоцким



Жираф-долгожитель: чем был уникален Самсон Ленинградов из Московского зоопарка

Филиал № 4 ОСФР по Москве и Московской области информирует: С 1 августа Соцфонд увеличит страховые пенсии россиян

Более 40 тысяч семей в Москве и области получают ежемесячные выплаты из средств материнского капитала

Столичные росгвардейцы задержали мужчину, подозреваемого в грабеже


Песков: Россия надеется, что Армения не пойдет по пути киевского режима

Парк "Три вулкана" Группы "Интеррос" задает "зеленые" стандарты качества отечественного туризма

Москва ждет тепла // «Газпром энергохолдинг» может построить 510 МВт мощности в столице

Mash: в Ставропольском крае игроки «Зенита-2» спалили баню


РИА: брат Серебрякова заявил, что на фото в СМИ изображен не его родственник

Адвокат Сулим: Турция выдаст России подозреваемого в подрыве авто в Москве

Брат задержанного в Турции россиянина Серебрякова: на фото в СМИ другой человек

РИА: подозреваемый в подрыве авто в Москве Серебряков ездил в Прагу как студент


Госкомпаниям запланировали переезд // Штаб-квартиры каких корпораций могут покинуть Москву

Представитель Кремля Песков подтвердил встречу Путина и Лукашенко в Москве

Асад назвал доверительными отношения между Москвой и Дамаском

Офис Роскосмоса может переехать из Москвы в Амурскую область




Брат Евгения Серебрякова рассказал об участии своего родственника в протестах

Отличник, не любил Навального, имел проблемы со здоровьем: что известно об обвиняемом в подрыве машины офицера в Москве

Гособвинение запросило 4 года колонии для активиста Глеба Калинычева из Нижнего Новгорода за перевод денег ФБК


В Москве прошли фестиваль «Вкус лета» и Премия «Здоровое питание»

Будут ли магнитные бури сегодня, 25 июля 2024 года?

Объявлены компании-победители XII Премии «Здоровое питание-2024»

N1 Medical 2024 наградили лучших специалистов медицины и индустрии красоты !


В Кремле допустили мирные переговоры с Киевом при Зеленском, но при определенных условиях

В Киеве раскритиковали офис Зеленского за фото с саммита в Швейцарии

В офисе Зеленского заявили, что Киев "не имеет отношения" к подрыву авто в Москве

Вместо того, чтобы проголосовать закон о сохранении культурного наследия, "кнопки" от "слуг" имитируют обсуждение на ТСК против Киева, – Береза


Генерал-полковник Алексей Воробьев встретился c олимпийским чемпионом по боксу Александром Лебзяком

Концерты, лекции и игры: как бизнес участвует в главном летнем фестивале Москвы

Зрелищные трюки и акробатические номера на воде: при поддержке ENERGY в Москве пройдет HYDROFLY FEST 2024

Состоялась премьера документально-игрового блокбастера «Про_Честь»


Лукашенко объяснил, почему его не надо называть господином

На поле под Минском заметили Лукашенко

Лукашенко направился с рабочим визитом в Россию

Президент Белоруссии Лукашенко попросил не величать его господином



Сергей Собянин. Неделя мэра

Собянин: завершился первый этап реновации в Бабушкинском районе

Собянин сообщил о планах развития производства беспилотных авиасистем в Москве

Сергей Собянин: Научные команды медицинских организаций получат поддержку


TWSE стала первой биржей, получившей сертификат углеродной нейтральности ISO 14068-1

«Кинобус ПроЭко» разоблачает экологические мифы на VII Слете координаторов Чистых игр

Около 2 млрд рублей затрачено на охрану окружающей среды северским СХК

Развитие электромобилестроения обсудили на бизнес-завтраке в Москве


«Поругалась с родителями». Могла ли пропавшая в Омске Ева Алешкина сбежать?

Осы пелопеи, сколии-гиганты, крылатые муравьи. Кто кусает москвичей летом

В Москве поймали террориста, разыскиваемого Интерполом

Коллегия во второй раз перенесла слушания по делу судьи Артема Матеты


Сергей Собянин. Главное за день

Из Архангельска выйдет первый в этом году субсидируемый рейс по Севморпути

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

Сергей Собянин. Неделя мэра


К Международному дню тигра саранская телемачта «переоденется» в редкого хищника

Час памяти «Дети Донбасса, дети войны…»

Выставка-реклама «Галерея книжных новинок»

Выставка-признание «Человек. Писатель. Актер», к 95-летию со дня рождения В. М. Шукшина, писателя, кинорежиссера, сценариста, актера


До чего ж хорош русский капитализм!

Суд арестовал москвича за демонстрацию татуировки с нацистской символикой

Мужчина вырвал младенца из рук матери и ударил его об землю

Псковская прыгунья Наталья Спиридонова выступит на соревнованиях вместе с восстановившейся после травмы Марией Ласицкене












Спорт в России и мире

Новости спорта


Новости тенниса
WTA

Аванесян сыграет с Андреевой в финале турнира WTA в Румынии






Пропавшую в Омске школьницу нашли мёртвой

«Население бьёт рекорды». Анализ результатов жилищного строительства в Севастополе

Энергоконтракт запустил производство нового высокотехнологичного материала

N1 Medical 2024 наградили лучших специалистов медицины и индустрии красоты !