23 июля 2010 в 09:32 1475 0
Hi-Tech

Компьютер научили отличать вымысел от фактов

Ученые разработали алгоритм, который позволяет компьютеру отличать новостные сообщения от художественных текстов, а именно рассказов.

Статья исследователей пока не принята к публикации в рецензируемый научный журнал, но ее препринт доступен на сайте arXiv.org. Алгоритм, придуманный авторами этой научной работы, анализирует, сколько раз любое слово из текста встречается вместе с другими словами в рассказах и новостных сообщениях. Полученные данные впоследствии сравнивали. Оказалось, что для двух данных типов текстов этот показатель заметно отличается. Исследователи проверили созданную ими методику при помощи 400 новостных заметок, случайным образом выбранных с новостного сайта National Public Radio, и 400 случайных рассказов из базы электронной библиотеки проекта "Гутенберг". Чтобы исключить влияние исторических особенностей языка, авторы выбирали для анализа произведения писателей XX века.

Источник: www.don.ua
© ИА «Инфо-Сити»

Подписывайтесь на наш канал в Telegram и в Яндекс Дзен


Авторизуйтесь, чтобы оставить комментарий.


Популярные новости

Отзывы о ресторанах18+


Мы используем сервис „Яндекс.Метрика“, который использует файлы „cookie“. Подробнее здесь
Вход
Регистрация
Восстановление пароля

Пожаловаться