Эстония предоставила медиаплатформе Meta почти 4 миллиарда слов

Материнская компания Facebook и Instagram, Meta, является второй по счету компанией, занимающейся разработкой крупных языковых моделей, которой были предоставлены открытые данные корпуса эстонского языка, содержащие почти 4 миллиарда слов. Это создает предпосылки для увеличения представительства эстонского языка и культуры в современных моделях искусственного интеллекта.

148

«Для устойчивости нашего языка и культуры крайне важно, чтобы открытые данные корпуса эстонского языка были доступны разработчикам языковых моделей», — заявила министр юстиции и цифровых технологий Лийза Пакоста.

Лийза-Ли Пакоста. Фото: Renee Altrov / Stenbocki maja

 

Обмен эстонскими данными создаёт предпосылку для того, чтобы крупные языковые модели понимали контекст эстонской культуры, а также стали более опытными в использовании эстонского языка. Одновременно это способствует развитию более качественного обслуживания эстонскоязычных пользователей в различных приложениях на основе искусственного интеллекта – чат-ботах, системах перевода и других решениях, основанных на языковых технологиях.

Министерство юстиции и цифровых технологий, а также Министерство образования и науки в сотрудничестве с Институтом эстонского языка работают над обеспечением доступности и находимости эстонскоязычных данных. Кроме того, уделяется внимание расширению качественных пакетов данных, чтобы эстонский язык был представлен на более высоком уровне в крупных языковых моделях.

Эстония открыта для сотрудничества и готова поделиться своим набором языковых данных с другими крупными разработчиками языковых моделей. Минюст призывает как государственный, так и частный сектор публиковать данные с целью увеличения объема высококачественных данных на эстонском языке. Это можно сделать в открытой информационной базе данных.

В Минкульте сомневаются в правильности решения

Однако, как заявил медиасоветник Министерства культуры Андрес Йыэсаар, сохранение эстонского языка и культуры зависит не от Meta или X, а от наших собственных возможностей в работе с ИИ и крупными языковыми моделями.

«Одно дело – просто поделиться словами, то есть языковым корпусом, это ещё можно рассмотреть. Но совершенно другое – передавать контент: статьи, книги, новости, фильмы и весь созданный на основе этих слов материал. Идея, что мы должны бесплатно отдать весь авторский контент крупным компаниям, звучит примерно так же, как требование Дональда Трампа, чтобы Украина передала США свои ценные природные ресурсы в обмен на свободу. Ни одна из этих сделок не является хорошей», – написал Йыэсаар на своей странице в Facebook.

Андрес Йыэсаар. Фото: Kultuuriministeerium

 

«Наши базы данных — это настоящий золотой ресурс. Мы не должны раздавать их легкомысленно. И если позволить себе риторическое отступление, то (материнская компания Facebook – прим. ред.) Meta ведет бизнес в нашей стране, не платя налоги. Нам следует учитывать этот факт», – заявила министр культуры Хейди Пурга на правительственной пресс-конференции в четверг, 6 февраля.

Хейди Пурга. Фото: Jürgen Randma

 

Читайте по теме:

Пакоста: Эстонский язык должен использоваться во всём мире

Правительство обсудило расширение сферы применения эстонского языка в эпоху ИИ

Лектор Оксфордского университета: Искусственный интеллект повышает эффективность государства, но отдаляет его от граждан

Комментарии закрыты.

Glastrennwände
blumen verschicken Blumenversand
blumen verschicken Blumenversand
Reinigungsservice Reinigungsservice Berlin
küchenrenovierung küchenfronten renovieren küchenfront erneuern