Сегодня среда, 24.04.2024, 07:29, ньюсмейкеров: 44175, сайтов: 1206, публикаций: 3428804
07.12.2004 18:28
Новости.
Просмотров всего: 8257; сегодня: 2.

Fact Extractor - новое слово в аналитической обработке текста на русском языке

Fact Extractor - новое слово в аналитической обработке текста на русском языке

Компания Гарант-Парк-Интернет объявляет о выходе первой версии программы RCO Fact Extractor - персонального приложения для Windows, которое предназначено для аналитической обработки текста на русском языке.

Основная сфера применения программы – это задачи из области компьютерной разведки, требующие высокоточного поиска информации, например, автоматический подбор материала к досье на целевой объект или же мониторинг определенных сторон его активности, освещаемых в СМИ.

Fact Extractor способен отыскать в тексте описания фактов различного типа, связанных с интересующими объектами - персонами и организациями, и классифицировать их. Программа позволяет не только найти фрагменты текста, в которых говорилось, например, о поездках персоны, ее встречах, заключении договоров, сделках купли-продажи, но и точно определить все места поездок, визави и контрагентов, наименования товаров и прочее.

Программа работает в среде Windows 2000 и выше и позволяет обрабатывать документы в популярных текстовых форматах из различных источников - файловой системы, заданных web-сайтов, базы данных.

Результат работы программы – таблица, которая содержит информацию о найденных фактах, связанных с объектами мониторинга, и может экспортироваться в html-формат для формирования отчета или для загрузки в стороннее приложение, работающее с уже структурированными данными.

Fact Extractor – это интеллектуальная программа для высокоточного избирательного анализа информации, поэтому она предполагает настройку шаблонов для поиска и классификации фактов самых различных типов. Такие специализированные шаблоны либо приобретаются отдельно, либо создаются пользователем самостоятельно при помощи дополнительной программы Fact Tuner. Тем не менее, даже стандартные шаблоны, включенные в комплект поставки Fact Extractor, позволяют распознавать огромное количество самых разнообразных фактов, но без детальной классификации, т.е., попросту находить события, в которых участвует целевой объект, и извлекать из текста всех прочих фигурантов этих событий, без детализации их ролей. С учетом уникальных механизмов выделения и отождествления различных обозначений объектов в тексте, даже эти стандартные возможности делают Fact Extractor незаменимым поисковым инструментом в тех случаях, когда поиск ведется по персонам и организациям.

Выпуск нового продукта прокомментировал руководитель направления RCO компании “Гарант-Парк-Интернет” Владимир Плешко:

“Наша компания уже около четырех лет занимается разработкой специализированного программного обеспечения в области компьютерной лингвистики. За это время лингво-аналитические компоненты были успешно введены в эксплуатацию в корпоративных системах ряда силовых ведомств и коммерческих структур. Почему мы решили создать персональную систему? Дело в том, что несмотря на интенсивное развитие ИТ-индустрии в России, подавляющее большинство аналитических, маркетинговых отделов и служб безопасности компаний осуществляют обработку текстовой информации, связанной с интересующими объектами, практически вручную. Они вводят запрос с элементами ФИО персоны или наименованием организации в поисковую машину, а затем разгребают вываленную “кучу мусора”, поскольку поисковик не способен точно распознать большинство фамилий и наименований, не говоря уже об отборе и структурировании связанной с ними информации. Нам бы хотелось заполнить такую брешь в сфере поисковых систем, для чего мы выводим на рынок принципиально новую систему, основанную не на документальном, а на фактографическом поиске.

Очень много реализовано нами в ядре программы, начиная от алгоритмов выделения наименований организаций и персон, отождествления их полных, кратких и косвенных наименований, местоимений, до механизмов синтаксического разбора и поиска изоморфизмов в семантических сетях. Тем не менее, пользовательский интерфейс программы выглядит достаточно просто – отчет в виде таблицы найденных фактов. Экспорт результатов также весьма примитивен. Но удобство, как говорится, дело наживное. Программа же выполняет главное – превращает “сырой” текст в структурированные и типизированные данные – разложенные по полочкам факты для таблиц БД. И на сегодняшний день сделать этого не способна ни одна другая программа!

Конечно же, мы планируем развивать функционал по просмотру, фильтрации и экспорту полученных фактов. Мы, безусловно, планируем интеграцию нашего продукта с системами обработки знаний других производителей, что позволило бы полноценно использовать математические методы для анализа найденных нами фактов в совокупности. Но, в первую очередь, при развитии продукта мы будем опираться на отзывы, пожелания и нарекания со стороны наших новых пользователей, появления которых мы ожидаем в ближайшее время”.

Тематические сайты: PublisherNews - портал системы продвижения публикаций, Вся Россия, Вся Россия онлайн, Маркетинг, Стандартизация, Экспорт
Сайты объединений стран: Евразийский экономический союз (ЕАЭС)

Ньюсмейкер: Гарант-Парк — 11 публикаций
Поделиться:

Интересно:

В России стартует проект, объединяющий русскую поэзию и музыку
23.04.2024 18:16 Мероприятия
В России стартует проект, объединяющий русскую поэзию и музыку
Проект "Поэт в России - больше, чем поэт", в рамках которого представят четыре концертные программы, объединяющие русскую поэзию и музыку, стартует в России. Программа первого сезона будет посвящена русским поэтам Александру Пушкину, Михаилу Лермонтову, Сергею Есенину и Сергею Михалкову, ее покажут...
Молодые предприниматели могут стать драйвером всей экономики
23.04.2024 16:46 Новости
Молодые предприниматели могут стать драйвером всей экономики
В Москве прошел форум молодых предпринимателей «Создай наше», организованный Корпорацией МСП и Агентством стратегических инициатив. В его рамках прошла пленарная дискуссия «Развитие и поддержка молодежного предпринимательства в России». Как отметил в начале обсуждения...
Бизнес-форум «Мир возможностей» проходит в ОАЭ
23.04.2024 15:33 Мероприятия
Бизнес-форум «Мир возможностей» проходит в ОАЭ
В Дубае стартовал Международный бизнес-форум «Мир возможностей». За 2 дня (23 и 24 апреля) масштабное деловое событие объединит в Дубае лидеров российского и международного бизнеса для обсуждения сотрудничества в новых глобальных условиях. Форум — событие номер 1 для компаний и инвесторов...
В Петербурге установят памятник незрячим бойцам ВОВ
23.04.2024 13:26 Новости
В Петербурге установят памятник незрячим бойцам ВОВ
На рабочем совещании губернатора Александра Беглова с членами городского правительства принято решение об установке памятника «Слепой слухач – защитник неба блокадного Ленинграда». Монумент призван увековечить память незрячих бойцов ленинградской противовоздушной обороны в годы Великой...
Какие направления предпочитают российские туристы на майские праздники
23.04.2024 9:40 Аналитика
Какие направления предпочитают российские туристы на майские праздники
По предварительным оценкам аналитиков АТОР, порядка 75% поездок на майские праздники туристы совершат по России, а 25% – за рубеж. В России, при сохраняющемся лидерстве курортов Краснодарского края, туристы расширяют географию поездок, а вот в выездном туризме часть спроса с других направлений...