Добавить новость
ru24.net
SearchEngines.ru
Февраль
2025
1
2
3
4
5
6
7
8
9
10
11
12
13
14 15
16
17
18
19
20
21
22
23
24
25
26
27
28

Продолжаем писать вместе с AI

0

Я иногда задумываюсь, что слишком уж много вожусь с процессом прилаживания AI к ведению своего телеграм-канала, но на самом деле это для меня прекрасная тестовая площадка — много готового контента, причем с дополнительными материалами и черновиками, а на практической задаче всё новое изучается гораздо лучше.

На этой неделе мне попалась свежая статья исследователей из MIT, в которой они описывают свою новую систему Satori. Если упрощать, то существует несколько способов в обучении моделей рассуждениям — использование более мощной модели в качестве учителя, дистилляция модели, обучением с подкреплением на основе человеческих отзывов. Все это требует много ресурсов, поэтому исследователи решили пойти другим путем и попробовать научить модель самообучаться. Ученые придумали новый метод — Chain-of-Action-Though (COAT), то есть “Цепочка действий-мыслей”, чтобы помочь модели остановиться в рассуждениях, проверить себя и принять решение о продолжении.




Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
Андрей Рублёв

Рублев вышел в третий круг турнира в Монако






Анимированная 3D-панорама монумента «Покорителям космоса» появилась в мобильном приложении «Узнай Москву»

Часть освобожденных в Тунисе россиян прибыла в Москву

"Ъ" раскрыл, как живут в России беженцы из мест боевых действий

Команда из Карелии стала чемпионом России по фитнес-аэробике