Добавить новость
ru24.net
Technology Review
Август
2024
1 2
3
4
5 6 7 8 9
10
11
12
13
14 15 16
17
18
19 20 21 22 23 24
25
26 27 28 29 30
31

A new way to build neural networks could make AI more understandable

0

A tweak to the way artificial neurons work in neural networks could make AIs easier to decipher.

Artificial neurons—the fundamental building blocks of deep neural networks—have survived almost unchanged for decades. While these networks give modern artificial intelligence its power, they are also inscrutable. 

Existing artificial neurons, used in large language models like GPT4, work by taking in a large number of inputs, adding them together, and converting the sum into an output using another mathematical operation inside the neuron. Combinations of such neurons make up neural networks, and their combined workings can be difficult to decode.

But the new way to combine neurons works a little differently. Some of the complexity of the existing neurons is both simplified and moved outside the neurons. Inside, the new neurons simply sum up their inputs and produce an output, without the need for the extra hidden operation. Networks of such neurons are called Kolmogorov-Arnold Networks (KANs), after the Russian mathematicians who inspired them.

The simplification, studied in detail by a group led by researchers at MIT, could make it easier to understand why neural networks produce certain outputs, help verify their decisions, and even probe for bias. Preliminary evidence also suggests that as KANs are made bigger, their accuracy increases faster than networks built of traditional neurons.

“It’s interesting work,” says Andrew Wilson, who studies the foundations of machine learning at New York University. “It’s nice that people are trying to fundamentally rethink the design of these [networks].”

The basic elements of KANs were actually proposed in the 1990s, and researchers kept building simple versions of such networks. But the MIT-led team has taken the idea further, showing how to build and train bigger KANs, performing empirical tests on them, and analyzing some KANs to demonstrate how their problem-solving ability could be interpreted by humans. “We revitalized this idea,” said team member Ziming Liu, a PhD student in Max Tegmark’s lab at MIT. “And, hopefully, with the interpretability… we [may] no longer [have to] think neural networks are black boxes.”

While it’s still early days, the team’s work on KANs is attracting attention. GitHub pages have sprung up that show how to use KANs for myriad applications, such as image recognition and solving fluid dynamics problems. 

Finding the formula

The current advance came when Liu and colleagues at MIT, Caltech, and other institutes were trying to understand the inner workings of standard artificial neural networks. 

Today, almost all types of AI, including those used to build large language models and image recognition systems, include sub-networks known as a multilayer perceptron (MLP). In an MLP, artificial neurons are arranged in dense, interconnected “layers.” Each neuron has within it something called an “activation function”—a mathematical operation that takes in a bunch of inputs and transforms them in some pre-specified manner into an output. 

In an MLP, each artificial neuron receives inputs from all the neurons in the previous layer and multiplies each input with a corresponding “weight” (a number signifying the importance of that input). These weighted inputs are added together and fed to the activation function inside the neuron to generate an output, which is then passed on to neurons in the next layer. An MLP learns to distinguish between images of cats and dogs, for example, by choosing the correct values for the weights of the inputs for all the neurons. Crucially, the activation function is fixed and doesn’t change during training.

Once trained, all the neurons of an MLP and their connections taken together essentially act as another function that takes an input (say, tens of thousands of pixels in an image) and produces the desired output (say, 0 for cat and 1 for dog). Understanding what that function looks like, meaning its mathematical form, is an important part of being able to understand why it produces some output. For example, why does it tag someone as creditworthy given inputs about their financial status? But MLPs are black boxes. Reverse-engineering the network is nearly impossible for complex tasks such as image recognition.

And even when Liu and colleagues tried to reverse-engineer an MLP for simpler tasks that involved bespoke “synthetic” data, they struggled. 

“If we cannot even interpret these synthetic datasets from neural networks, then it’s hopeless to deal with real-world data sets,” says Liu. “We found it really hard to try to understand these neural networks. We wanted to change the architecture.”

Mapping the math

The main change was to remove the fixed activation function and introduce a much simpler learnable function to transform each incoming input before it enters the neuron. 

Unlike the activation function in an MLP neuron, which takes in numerous inputs, each simple function outside the KAN neuron takes in one number and spits out another number. Now, during training, instead of learning the individual weights, as happens in an MLP, the KAN just learns how to represent each simple function. In a paper posted this year on the preprint server ArXiv, Liu and colleagues showed that these simple functions outside the neurons are much easier to interpret, making it possible to reconstruct the mathematical form of the function being learned by the entire KAN.

The team, however, has only tested the interpretability of KANs on simple, synthetic data sets, not on real-world problems, such as image recognition, which are more complicated. “[We are] slowly pushing the boundary,” says Liu. “Interpretability can be a very challenging task.”

Liu and colleagues have also shown that KANs get more accurate at their tasks with increasing size faster than MLPs do. The team proved the result theoretically and showed it empirically for science-related tasks (such as learning to approximate functions relevant to physics). “It’s still unclear whether this observation will extend to standard machine learning tasks, but at least for science-related tasks, it seems promising,” Liu says.

Liu acknowledges that KANs come with one important downside: it takes more time and compute power to train a KAN, compared to an MLP.

“This limits the application efficiency of KANs on large-scale data sets and complex tasks,” says Di Zhang, of Xi’an Jiaotong-Liverpool University in Suzhou, China. But he suggests that more efficient algorithms and hardware accelerators could help.

Anil Ananthaswamy is a science journalist and author who writes about physics, computational neuroscience, and machine learning. His new book, WHY MACHINES LEARN: The Elegant Math Behind Modern AI, was published by Dutton (Penguin Random House US) in July.




Moscow.media
Частные объявления сегодня





Rss.plus




Аймед — лидер в микрохирургии: премия «I’M FAMOUS» отметила достижения

Аделина Панина: 10 заставок для телефона, которые зарядят вашу жизнь на успех и помогут найти любовь

Певица Алсу в свой день рождения исполнила давнюю мечту 8-летнего сына Рафаэля

В честь 13-летия компании «ЛокоТех» в сервисном локомотивном депо Сольвычегодск прошла праздничная лотерея


Edgbaston breached: India break duck in England’s storied fortress, win by 336 runs

Official: Torino purchase Anjorin from Empoli, with Chelsea making profit

At Hewlett Packard Enterprise, CEO Antonio Neri is facing off against an activist investor with a history of forcing out chief execs

Dive into these six summer reads, recommended by BI's editors


«Деловые Линии» открыли подразделение в Магадане

Киберпреступность эволюционировала, защита не может строиться только на поиске вредоносного кода

Нужно ли праздновать патриотические праздники в колониях-поселениях?

В Курской области глава райцентра осужден за должностные преступления


Arkane Studios founder slams Microsoft for its Game Pass focus: 'At some point reality has to hit'

Capcom cancels a presentation on Monster Hunter Wilds performance at CEDEC 2025 amid ongoing developer harassment

Ballz 2 Beat 1.1.9

100 Дверей - Побег из Тюрьмы 3.7.0



Искусство как память: в Театре Российской Армии прошел уникальный балетный марафон

Нужно ли праздновать патриотические праздники в колониях-поселениях?

Глобальное масштабирование: компания «Газинформсервис» участвует в обсуждении применения электронной транспортной накладной с ЕЭК ООН

Киберпреступность эволюционировала, защита не может строиться только на поиске вредоносного кода




В Самаре ценовой разрыв между новостройками и готовым жильем остается минимальным среди всех мегаполисов России

Гарбузов: Столичный завод расширит выпуск авиадвигателей при поддержке города

Хозяйка сгоревшего Zeekr увезли в больницу после пожара на парковке Москвы

Глобальное масштабирование: компания «Газинформсервис» участвует в обсуждении применения электронной транспортной накладной с ЕЭК ООН


В состав поезда №7/8 «Таврия» сообщением Санкт-Петербург – Севастополь включены новые вагоны СВ

Госдума поддержала законопроект о расширении оснований для лишения гражданства

Песков заявил, что смерть Старовойта не может не шокировать

Синоптики обещают в реках и озерах воду» как свежее молоко»


Теннисистка Павлюченкова заявили, что судьи на Уимблдоне украли у нее гейм

Теннисист Хачанов стал первым четвертьфиналистом Уимблдона

Теннисист Алькарас назвал Рублева одним из самых сильных игроков в туре

Павлюченкова о судейской ошибке: я бы просто сказала, что ненавижу Уимблдон


Примаков призвал определиться с отношением к странам СНГ

На Камчатке самолет Ан-2 выкатился за пределы взлетно-посадочной полосы

Схема движения транспорта временно изменится в трех округах Москвы

Госдума поддержала законопроект о расширении оснований для лишения гражданства


Музыкальные новости

Кабинет Артиста. Яндекс кабинет артиста.

Росгвардейцы обеспечили правопорядок во время летнего фестиваля Дениса Мацуева в Суздале

«Уколы от столбянка»: дочь Джигана и Самойловой оказалась в инвалидной коляске

Оззи Осборн и группа Black Sabbath провели прощальное шоу. Видео



Киберпреступность эволюционировала, защита не может строиться только на поиске вредоносного кода

Аймед — лидер в микрохирургии: премия «I’M FAMOUS» отметила достижения

Нужно ли праздновать патриотические праздники в колониях-поселениях?

Искусство как память: в Театре Российской Армии прошел уникальный балетный марафон


Росгвардейцы обеспечили правопорядок во время летнего фестиваля Дениса Мацуева в Суздале

«Там очень ждали»: Сергей Безруков об отмене гастролей в Азербайджане

Кабинет Артиста. Яндекс кабинет артиста.

"Просто какой-то ужас": Сестре певицы Жанны Фриске сделали срочную операцию


Память о монорельсе и трамваи будущего. Последние новости транспорта Москвы

Подмосковные новостройки на Дмитровском шоссе за год подорожали на 20%

Вероятная причина пожара восьми автомобилей на севере столицы

Новые китайские авто на механике: топ-5 по мнению экспертов


Алиев просит русских остановиться, но уже поздно: Идут аресты, депортация, бьют по экономике

Сергей Собянин рассказал, каким будет национальный центр «Россия» на Пресне

Путин подписал закон о новом порядке расчета компенсаций за нарушение интеллектуальных прав

Пособия и ранний выход на пенсию: Алексей Путин — о мерах поддержки семей с детьми





Кофе.net. Врач Клименко назвала напитки, которые запрещены в жару

В Грозном отметили 25-летие отдельного медико-санитарного батальона Росгвардии

Врач-косметолог Мадина Осман: можно ли справиться с гравитационным птозом без пластики

В Москве открыты еще шесть центров женского здоровья


В Раде поставили под сомнение стремление Киева к миру


Спортсмены Росгвардии стали победителями соревнований по стрельбе из пневматического оружия

Престижная награда в сфере IT-достижений досталась калининградскому тренеру

«Лето в Москве»: какие мероприятия для детей и родителей пройдут на этой неделе

Премия «Спорт и Россия»: объединяя бизнес, государство и спорт


Тихановский не набрал донатов на свержение Лукашенко. Жена зовет на помощь Трампа

Лукашенко потребовал к осени убрать в Белоруссии все бревна с лесных опушек



Собянин сообщил о лидерстве "Технополиса Москва" в рейтинге эффективности ОЭЗ

Собянин: 250 млрд рублей вложат в развитие рабочих мест у метро Москвы

Собянин рассказал, какие масштабные проекты реализуют рядом со станциями метро

Собянин: Технополис Москва вновь лидирует среди инновационных зон России


Бэби-бум: 200 редких животных родились в Московском зоопарке

Барнаул оказался в хвосте рейтинга российских городов по отраслевым зарплатам

Синоптик Ильин: Аномальная жара в Москве и МО может сохраниться до конца июля

360.ru: в период аномальной жары важно надевать светлую, свободную одежду


Песков заявил, что смерть Старовойта не может не шокировать

Школьник из Дмитровского победил на престижном турнире по кикбоксингу

Синоптики обещают в реках и озерах воду» как свежее молоко»

Примаков призвал определиться с отношением к странам СНГ


«Надо поднапрячься и тушить»: Глава Бурятии поручил увеличить силы для борьбы с огнем

Отключения коммунальных услуг в Архангельске 8 июля 2025 года

Владимир Ефимов: В столице благоустроят набережную Захарковского карьера

Заммэра Москвы Ефимов сообщил о благоустройстве набережной Захарковского карьера


Поезда из Москвы в Крым изменят расписание осенью

Какой сегодня праздник: 5 июля

Симферополь частично остался без света

Кто в Симферополе и Севастополе зарабатывает больше всех


Песков заявил, что смерть Старовойта не может не шокировать

Схема движения транспорта временно изменится в трех округах Москвы

«Лето-осень будут горячими. Зеленский нацелит ракеты на Москву» – прогноз

Госдума поддержала законопроект о расширении оснований для лишения гражданства












Спорт в России и мире

Новости спорта


Новости тенниса
Уимблдон

Павлюченкова о судейской ошибке: я бы просто сказала, что ненавижу Уимблдон






Песков заявил, что смерть Старовойта не может не шокировать

Собянин: Технополис Москва вновь лидирует среди инновационных зон России

В состав поезда №7/8 «Таврия» сообщением Санкт-Петербург – Севастополь включены новые вагоны СВ

Собянин: 250 млрд рублей вложат в развитие рабочих мест у метро Москвы