Многоцелевая модель улучшает прогнозирование в области эпидемий, энергетики и экономики

10.12.2024 15:45

Новая модель машинного обучения (МО) от Georgia Tech может одновременно защитить сообщества от болезней, лучше управлять потреблением электроэнергии в городах и способствовать росту бизнеса.

Исследователи из Школы вычислительной науки и техники (CSE) создали структуру Large Pre-Trained Time-Series Model (LPTM). LPTM — это единая базовая модель, которая выполняет задачи прогнозирования в широком спектре областей.

Наряду с производительностью, которая не хуже или лучше, чем у моделей, специально созданных для их приложений, LPTM требует на 40% меньше данных и на 50% меньше времени обучения, чем текущие базовые показатели. В некоторых случаях LPTM можно развернуть без каких-либо данных обучения.

Ключ к LPTM заключается в том, что он предварительно обучен на наборах данных из разных отраслей, таких как здравоохранение, транспорт и энергетика. Группа Georgia Tech создала модуль адаптивной сегментации для эффективного использования этих совершенно разных наборов данных.

Исследователи Georgia Tech представят LPTM в Ванкувере, Британская Колумбия, Канада, на конференции по нейронным системам обработки информации 2024 года ( NeurIPS 2024 ). Они также разместили свои исследования на сервере препринтов arXiv .

«Основная парадигма модели началась с текста и изображений, но люди ещё не исследовали задачи временных рядов, поскольку они считались слишком разнообразными в разных областях», — сказал Б. Адитья Пракаш, один из разработчиков LPTM.

«Наша работа является пионерской в ​​этой новой области исследований, где до сих пор было предпринято лишь несколько попыток».

Фундаментальные модели обучаются на данных из разных областей, что делает их мощными инструментами при назначении задач. Фундаментальные модели управляют GPT, DALL-E и другими популярными платформами генеративного ИИ, используемыми сегодня. LPTM отличается, поскольку он ориентирован на временные ряды, а не на генерацию текста и изображений.

Исследователи из Технологического института Джорджии обучили LPTM работе с различными данными: эпидемиями, макроэкономикой, энергопотреблением, дорожным движением и транспортом, фондовыми рынками, а также наборами данных о движении и поведении человека.

После обучения группа сравнила LPTM с 17 другими моделями, чтобы сделать прогнозы, максимально приближенные к девяти реальным эталонным показателям. LPTM показала наилучшие результаты на пяти наборах данных и заняла второе место на остальных четырёх.

Девять бенчмарков содержали данные из реальных коллекций. Они включали распространение гриппа в США и Японии, электроэнергию, трафик и спрос на такси в Нью-Йорке, а также финансовые рынки.

Модели конкурентов были специально созданы для своих областей. В то время как каждая модель показала хорошие результаты на одном или двух бенчмарках, наиболее близких к её целевому назначению, в других моделях они заняли средние или нижние позиции.

В другом эксперименте группа Georgia Tech протестировала LPTM против семи базовых моделей на тех же девяти бенчмарках в задаче прогнозирования с нулевым выстрелом. Нулевой выстрел означает, что модель используется сразу после установки и не получает никаких конкретных указаний во время обучения. LPTM превзошла каждую модель по всем бенчмаркам в этом испытании.

Модель LPTM стабильно занимала лидирующие позиции по всем девяти тестам, демонстрируя потенциал модели для достижения превосходных результатов прогнозирования в различных приложениях с меньшими ресурсами.

«Наша модель выходит за рамки прогнозирования и помогает решать другие задачи», — сказал Пракаш, доцент Школы CSE.

«Классификация — это полезная задача временного ряда, которая позволяет нам понять природу временного ряда и определить, является ли этот временной ряд чем-то понятным или новым».

Одна из причин, по которой традиционные модели разрабатываются индивидуально в соответствии со своими целями, заключается в том, что поля различаются по частоте отчетности и тенденциям.

Например, эпидемические данные часто сообщаются еженедельно и проходят через сезонные пики с редкими вспышками. Экономические данные собираются ежеквартально и обычно остаются последовательными и монотонными с течением времени.

Модуль адаптивной сегментации LPTM позволяет ему преодолевать эти временные различия между наборами данных. Когда LPTM получает набор данных, модуль разбивает данные на сегменты разных размеров. Затем он оценивает все возможные способы сегментации данных и выбирает самый простой сегмент, из которого можно узнать полезные закономерности.

Производительность LPTM, улучшенная за счёт инноваций в области адаптивной сегментации, обеспечила принятие модели на NeurIPS 2024 для презентации. NeurIPS — одна из трёх основных международных конференций по высокоэффективным исследованиям в области ИИ и МО. NeurIPS 2024 пройдёт с 10 по 15 декабря.

Аспирант Харшавардхан Камарти сотрудничал с Пракашем, своим руководителем, по LPTM. Дуэт входит в число 162 исследователей Georgia Tech, представляющих более 80 докладов на конференции.

Пракаш — один из 46 преподавателей Технологического института Джорджии, чьи исследования были приняты на NeurIPS 2024. Девять преподавателей Школы CSE, почти треть состава, являются авторами или соавторами 17 статей, принятых на конференции.

Помимо представления своих исследований на конференции NeurIPS 2024, Пракаш и Камарти выпустили на GitHub библиотеку с открытым исходным кодом основополагающих модулей временных рядов , которые специалисты по данным могут использовать в своих приложениях.

«Учитывая интерес к ИИ со стороны всех слоев общества, включая бизнес, социальную сферу, а также сектор исследований и разработок, была проделана большая работа и на основные конференции по ИИ представлены тысячи серьёзных докладов», — сказал Пракаш.

«Принятие нашей статьи говорит о качестве работы и её потенциале для продвижения фундаментальной методологии, и мы надеемся поделиться этим с более широкой аудиторией».


Мастер пера, обрабатывает новостную ленту.

Авторизуйтесь, чтобы получить возможность оставлять комментарии



Досье

«Преступная Россия» — одно из самых популярных российских изданий о преступности.  «Преступная Россия» публикует криминальные новости, касающиеся преступных авторитетов, сотрудников правоохранительных органов и чиновников. В среднем за три месяца аудитория crimerussia.info в России составила около 470 тыс. человек, а число просмотров страниц сайта превысило 1,8 млн, следует из статистики Liveinternet.

Во все времена, увы, преступность шла рука об руку с развитием общества – даже в самые незапамятные времена, даже тогда, когда никакого понятия о «преступности» еще и не существовало. Россия, конечно, не стала исключением, а, пожалуй, и наоборот, рухнула в эту скользкую яму, из которой до сих пор с трудом выбирается – все мы помним откровенно бандитские 90-ые, существенно повлиявшие на общественное мировоззрение. Поэтому  и криминал в России – чуть более важная и болезненная тема, чем в остальных государствах. Этот факт можно благополучно игнорировать и не замечать, но проще от этого не станет – так что если вы решили держать себя в курсе относительно того, что творится «за кулисами» дорогих кабинетов и больших дверей, то мы сейчас расскажем, где лучше всего это сделать.

Сайт «Преступная Россия» – это такое обширное СМИ о том, какой криминал происходит в нашей стране; издание часто цитируют и пересказывают, кроме того, работники портала нередко приносят эксклюзивы, которые потом наводят шороху в некоторых кругах.  Собственно, названия рубрик говорят за себя: есть «Коррупция», «Госструктуры», «Контрабанда», «Рейдерские захваты» и все в таком духе. Ни одна теневая сфера деятельности – обычных уголовников или высокопоставленных чиновников – не уйдет от внимания «Преступной России» и, соответственно, вашего.

Материалы на сайте, как правило, максимально разного характера: от обычных новостей до огромных эксклюзивных расследований, которые можно читать часами. Авторы явно сделали упор на всеобщий обхват, и каждый найдет для себя – можно бегло листать новости, а можно читать издание, как полноценную энциклопедию – пусть и посвященную не самой приятной отрасли. Из других интересных рубрик, которые зашиты в приложение – это «Громкие дела» и «Личности». Первое – целый альманах нашумевших преступлений, от самых известных и старых, до вполне себе неожиданных – но все равно в какой-то степени интересных. Второе – собственно, одна из причин регулярных блокировок сайта: в этом разделе вы можете прочитать относительно правдивую биографию многих известных чиновников, бизнесменов и политиков.

У многих, кто впервые слышит об изданиях такого рода, возникает логичный вопрос – а зачем вообще про такое читать? Зачем набивать себя негативом, которого и без того полно, стоит только высунуть голову из-под одеяла. Собственно, для этого и нужно – чтобы знать, что происходит на улицах и в кабинетах; чтобы знать правду, какой бы грустной она не была; чтобы, наконец, быть человеком – мы отличаемся от собратьев по животному миру преимущественно за счет желания развиваться и узнавать новое.

Читать все новости о криминале теперь можно на сайте Преступная Россиия crimerussia.info