ru
Назад к списку

Tether представила открытый набор данных для обучения ИИ

source-logo  forklog.com 2 ч
image

ИИ-отдел Tether Data — QVAC — значительно расширил «крупнейший в мире общедоступный синтетический набор данных» для обучения искусственного интеллекта.

В QVAC Genesis II добавлены 107 млрд новых токенов; показатель достиг 148 млрд в 19 образовательных областях. Это «существенно увеличивает» масштаб, глубину и качество рассуждений.

Вторая версия основана на фундаменте первой. Она охватывает 10 новых направлений, в том числе химию, информатику, статистику, машинное обучение, астрономию, географию, эконометрику и электротехнику.

QVAC Genesis II воссоздает физику университетского уровня и вместе с Genesis I образует «самый полный синтетический образовательный набор данных, когда-либо представленный для общественности».

В основе выпуска лежит новый подход к генерации информации — Option-Level Reasoning. Он разработан для извлечения структурированных рассуждений из ошибок модели и правильных ответов.

«Результатом являются обучающие данные, которые подчеркивают ясность, причинно-следственную связь и принятие решений, а не только поверхностную правильность», — говорится в блоге компании.

В Tether подчеркнули, что QVAC сфокусирован на обучение модели думать, рассуждать и объяснять, а не подражать.

«Сегодня большинство программ оптимизируются под беглость речи, а не понимание. С этим релизом мы выходим за рамки объема и переходим к структуре, рассуждениям и ясности», — заявил CEO фирмы Паоло Ардоино.

Напомним, в мае Tether анонсировала новую платформу QVAC для разработки «бесконечного и вездесущего интеллекта», которая предполагает «запуск и эволюцию» ИИ-агентов на пользовательских устройствах вместо дата-центров крупных компаний.

В июне Ардоино заявил, что в течение 15 лет появится триллион ИИ-агентов, которые будут использовать биткоин и USDT для расчетов и проведения транзакций.

forklog.com