Добавить новость
ru24.net
Technology Review
Август
2024
1 2
3
4
5 6 7 8 9
10
11
12
13
14 15 16
17
18
19 20 21 22 23 24
25
26 27 28 29 30
31

A new way to build neural networks could make AI more understandable

0

A tweak to the way artificial neurons work in neural networks could make AIs easier to decipher.

Artificial neurons—the fundamental building blocks of deep neural networks—have survived almost unchanged for decades. While these networks give modern artificial intelligence its power, they are also inscrutable. 

Existing artificial neurons, used in large language models like GPT4, work by taking in a large number of inputs, adding them together, and converting the sum into an output using another mathematical operation inside the neuron. Combinations of such neurons make up neural networks, and their combined workings can be difficult to decode.

But the new way to combine neurons works a little differently. Some of the complexity of the existing neurons is both simplified and moved outside the neurons. Inside, the new neurons simply sum up their inputs and produce an output, without the need for the extra hidden operation. Networks of such neurons are called Kolmogorov-Arnold Networks (KANs), after the Russian mathematicians who inspired them.

The simplification, studied in detail by a group led by researchers at MIT, could make it easier to understand why neural networks produce certain outputs, help verify their decisions, and even probe for bias. Preliminary evidence also suggests that as KANs are made bigger, their accuracy increases faster than networks built of traditional neurons.

“It’s interesting work,” says Andrew Wilson, who studies the foundations of machine learning at New York University. “It’s nice that people are trying to fundamentally rethink the design of these [networks].”

The basic elements of KANs were actually proposed in the 1990s, and researchers kept building simple versions of such networks. But the MIT-led team has taken the idea further, showing how to build and train bigger KANs, performing empirical tests on them, and analyzing some KANs to demonstrate how their problem-solving ability could be interpreted by humans. “We revitalized this idea,” said team member Ziming Liu, a PhD student in Max Tegmark’s lab at MIT. “And, hopefully, with the interpretability… we [may] no longer [have to] think neural networks are black boxes.”

While it’s still early days, the team’s work on KANs is attracting attention. GitHub pages have sprung up that show how to use KANs for myriad applications, such as image recognition and solving fluid dynamics problems. 

Finding the formula

The current advance came when Liu and colleagues at MIT, Caltech, and other institutes were trying to understand the inner workings of standard artificial neural networks. 

Today, almost all types of AI, including those used to build large language models and image recognition systems, include sub-networks known as a multilayer perceptron (MLP). In an MLP, artificial neurons are arranged in dense, interconnected “layers.” Each neuron has within it something called an “activation function”—a mathematical operation that takes in a bunch of inputs and transforms them in some pre-specified manner into an output. 

In an MLP, each artificial neuron receives inputs from all the neurons in the previous layer and multiplies each input with a corresponding “weight” (a number signifying the importance of that input). These weighted inputs are added together and fed to the activation function inside the neuron to generate an output, which is then passed on to neurons in the next layer. An MLP learns to distinguish between images of cats and dogs, for example, by choosing the correct values for the weights of the inputs for all the neurons. Crucially, the activation function is fixed and doesn’t change during training.

Once trained, all the neurons of an MLP and their connections taken together essentially act as another function that takes an input (say, tens of thousands of pixels in an image) and produces the desired output (say, 0 for cat and 1 for dog). Understanding what that function looks like, meaning its mathematical form, is an important part of being able to understand why it produces some output. For example, why does it tag someone as creditworthy given inputs about their financial status? But MLPs are black boxes. Reverse-engineering the network is nearly impossible for complex tasks such as image recognition.

And even when Liu and colleagues tried to reverse-engineer an MLP for simpler tasks that involved bespoke “synthetic” data, they struggled. 

“If we cannot even interpret these synthetic datasets from neural networks, then it’s hopeless to deal with real-world data sets,” says Liu. “We found it really hard to try to understand these neural networks. We wanted to change the architecture.”

Mapping the math

The main change was to remove the fixed activation function and introduce a much simpler learnable function to transform each incoming input before it enters the neuron. 

Unlike the activation function in an MLP neuron, which takes in numerous inputs, each simple function outside the KAN neuron takes in one number and spits out another number. Now, during training, instead of learning the individual weights, as happens in an MLP, the KAN just learns how to represent each simple function. In a paper posted this year on the preprint server ArXiv, Liu and colleagues showed that these simple functions outside the neurons are much easier to interpret, making it possible to reconstruct the mathematical form of the function being learned by the entire KAN.

The team, however, has only tested the interpretability of KANs on simple, synthetic data sets, not on real-world problems, such as image recognition, which are more complicated. “[We are] slowly pushing the boundary,” says Liu. “Interpretability can be a very challenging task.”

Liu and colleagues have also shown that KANs get more accurate at their tasks with increasing size faster than MLPs do. The team proved the result theoretically and showed it empirically for science-related tasks (such as learning to approximate functions relevant to physics). “It’s still unclear whether this observation will extend to standard machine learning tasks, but at least for science-related tasks, it seems promising,” Liu says.

Liu acknowledges that KANs come with one important downside: it takes more time and compute power to train a KAN, compared to an MLP.

“This limits the application efficiency of KANs on large-scale data sets and complex tasks,” says Di Zhang, of Xi’an Jiaotong-Liverpool University in Suzhou, China. But he suggests that more efficient algorithms and hardware accelerators could help.

Anil Ananthaswamy is a science journalist and author who writes about physics, computational neuroscience, and machine learning. His new book, WHY MACHINES LEARN: The Elegant Math Behind Modern AI, was published by Dutton (Penguin Random House US) in July.




Moscow.media
Частные объявления сегодня





Rss.plus



Мытищинское предприятие ООО «Водомер» получило Диплом победителя в региональном конкурсе «100 лучших товаров России»

Мытищинское предприятие ООО «Водомер» получило Диплом победителя в региональном конкурсе «100 лучших товаров России»

Радио Romantika рекомендует open-air «Легенды мирового рока»

Свыше 6,5 тысячи жителей Москвы и Московской области получили справки о статусе предпенсионера в клиентских службах регионального Отделения СФР и МФЦ


Прекрасной игры участникам теннисного турнира памяти Ю. М. Лужкова пожелала Елена Батурина

Как при помощи одежды оставаться молодой и привлекательной

Новые дисциплины и правила судейства представят на соревнованиях по фитнес-аэробике в Анапе

«Странные странности» из интервью российского историка – мой ответ армянину, «не помнящему» своего армянства…


‘We’ll be woken up at 4am every DAY’ slam locals over £200m expansion of major UK airport… but some can’t wait

Obesity makes people more likely to catch COVID, study suggests: ‘Indisputable relationship’

Former Jamaica ace hopes new guide for mums in football leads to better support for female players with children

League One side Birmingham make £10m bid for Premier League striker that will shatter division’s transfer record


Прогулки над облаками...

МВД: Количество нелегалов в России превысило 630 тысяч человек

В России разработали технологию 3D-печати протезов пальцев

StarLine на Международном Евразийском форуме «Такси»


10 tips to get started in Star Wars Outlaws

Asus ROG Zephyrus G16 (2024) GA605 review

The PC game releases we're most excited about in September

Мафия-НН: В уютном ресторанчике в центре города встретились девять одноклассников, чтобы отпраздновать Новый Год и провести веселый вечер


Як вибрати накладний замок

Як встановити ручки на планці для дверей


Российская певица Ольга Шультайс стала трижды титулованной королевой на Миссис Бизнес Москва’24

Прогулки по Москве

"Спартак" в меньшинстве вырвал победу в матче против "Рубина"

Metaratings: «Динамо» интересуется Тикнизяном




Олег Иванов назвал футболиста «Спартака», который выделяется своей игрой

Агентству ТАСС исполнилось 120 лет

Соцфонд проиндексирует пенсии работающим пенсионерам в феврале

Спорткомплексы и не только: какую надвижимость строят инвесторы в Зеленограде


Токсиколог Кутушов назвал привычку ставить много будильников опасной для здоровья

В Правительство Москвы направлены подписи за модернизацию культурных и социальных объектов САО

Московская художница подарила Ульяновску новый мурал

Поезд Деда Мороза покидает Сортавалу


Новак Джокович опустится минимум на четвёртую строчку рейтинга ATP

Рублев стал участником рекордного пятисетового матча на турнирах Большого шлема

Теннисист Рублев вышел в четвертый круг Открытого чемпионата США

Путинцева в матче с пятой ракеткой мира определила участницу 1/8 финала US Open


Сложность пожара на НПЗ в Капотне снизили с максимального до 2-го уровня

Художник из Подольска сделал граффити фрегата «Аврора» на Камчатке

МЧС: возгорание на Московском нефтеперерабатывающем заводе локализовано

В Правительство Москвы направлены подписи за модернизацию культурных и социальных объектов САО


Музыкальные новости

"Это меня глубоко ранит": Арбенина рассказала про домашнее насилие

Концерт «Интонации» и турнир по волейболу пройдут в Пскове в День знаний

Балерина Волочкова назвала бредом идею Госдумы о проверке звезд на алкоголь

Певец Мэнсон обвинил актрису Вуд в фальсификации письма ФБР против него



Теплую осень прогнозируют россиянам синоптики

Российская певица Ольга Шультайс стала трижды титулованной королевой на Миссис Бизнес Москва’24

"Спартак" в меньшинстве вырвал победу в матче против "Рубина"

Прогулки по Москве


Глава СК Бастрыкин заинтересовался доступностью для инвалидов центра Новосибирска

РПЛ. «Оренбург» — «Динамо» Москва. Прямая трансляция матча, смотреть онлайн

Собянин сообщил о ликвидации силами ПВО десяти БПЛА, летевших к Москве

«Неизбранный псевдосудья»: Маск прокомментировал блокировку Twitter в Бразилии


Определился соперник ЦСКА по финалу Кубка мэра Москвы

«Спартак» — «Автомобилист» — 4:3 Б. Видеообзор матча Кубка мэра Москвы

Источник 360.ru: Mercedes влетел в столб в Москве, пострадал один человек

Прогулки по Москве


Путин: Россия будет наращивать взаимовыгодные связи с Киргизией

Мэр Ландеты предложил Путину запустить образовательный курс

Путин назвал Узбекистан стратегическим союзником в День независимости республики





Токсиколог Кутушов назвал привычку ставить много будильников опасной для здоровья

Токсиколог Кутушов назвал привычку ставить много будильников опасной для здоровья

Здоровье школьника: как уберечь ребенка от инфекций в новом учебном году

Сладкий обман: Доктор Кутушов разоблачил популярные сахарозаменители



"Спартак" в меньшинстве вырвал победу в матче против "Рубина"

Прогулки по Москве

Metaratings: «Динамо» интересуется Тикнизяном

Определился соперник ЦСКА по финалу Кубка мэра Москвы


Лукашенко заявил о целях расширить сотрудничество с Киргизией



Сергей Собянин сообщил о ликвидации четвертого летевшего к Москве беспилотника

Собянин: БПЛА сбили на подлете к Москве в городском округе Подольск

Собянин: Еще один сбитый беспилотник при падении повредил техническое помещение МНПЗ

Собянин сообщил о ликвидации силами ПВО десяти БПЛА, летевших к Москве


В Греции произошла экологическая катастрофа: известный порт заполнился мёртвой рыбой

Реализацию Москвой целей устойчивого развития обсудили на международном муниципальном форуме БРИКС

Москва представила аналитическое исследование ...


Токсиколог Кутушов назвал привычку ставить много будильников опасной для здоровья

Открытие Московского медиафестиваля посетили более 22 тысяч человек

Художник из Подольска сделал граффити фрегата «Аврора» на Камчатке

Поезд Деда Мороза покидает Сортавалу


Портативный ТСД корпоративного класса Saotron RT-T70

Жители Архангельской области и других регионов России наслаждались редким северным сиянием

В Арктике разворачивается «гонка вооружений». США пытаются препятствовать сотрудничеству РФ и КНР

Близкая Арктика: что посмотреть в Архангельской области


Художник из Симферополя Виктор Нефедов создаст в Нальчике граффити на площади 260 квадратных метров

Книжная выставка «Без меня народ не полный…» к 125-летию со дня рождения А.П.Платонова, русского и советского писателя, поэта и публициста, драматурга.

В Симферополе устроят семейный фестиваль «До свидания, лето!»

В ДТП под Симферополем погибли два человека


Художник из Подольска сделал граффити фрегата «Аврора» на Камчатке

Поезд Деда Мороза покидает Сортавалу

МЧС: возгорание на Московском нефтеперерабатывающем заводе локализовано

Терпеть нельзя: Доктор Кутушов рассказал, почему нужно помочиться сразу же












Спорт в России и мире

Новости спорта


Новости тенниса
US Open

Рублев стал участником рекордного пятисетового матча на турнирах Большого шлема






В деле о теракте в "Крокусе" засветился мигрант из Екатеринбурга

Мэр Ландеты написал письмо Путину и предложил начать обучение политиков

Игрок "Рубина" Иванов оценил поражение в матче РПЛ со "Спартаком"

«Станция «Манеж»: погружение в транспорт будущего уже сегодня