Brave GNU World standard questions: ----------------------------------- ВВЕДЕНИЕ: Это стандартные вопросы для GNU World. Их можно получить на странице http://brave-gnu-world.org. ВОПРОСЫ: ********************************************************************** * Что это? SlovNet - это бесплатная программа с открытыми исходными текстами для поиска синонимов на русском языке на основе наборов синонимов словаря WordNet и англо-русского словаря Мюллера. Одно из главных достоинств (или недостатков) программы в том, что для каждого русского слова выдаётся большой список русских слов, которые имеют прямое или косвенное (т.е. через другие слова) синонимичное отношение к исходному слову. Слова в этом списке упорядочены по степени синонимичности. ********************************************************************** * Кто может использовать эту программу? Любой человек, которому понадобилось получить список синонимов для слова. Лингвист - для проведения экспериментов. Программист - для подключения SlovNet к своей программе. ********************************************************************** * Почему они должны использовать эту программу вместо сходных программ? * Достоинства и преимущества? Из документации: 1.1 Сравнение с другими системами, поддерживающими поиск синонимов. +-------------------------------------------------------+ | | SlovNet | WordNet | Lingvo | | | | | 8.0 | |------------------------+---------+---------+----------| | Открытый код | x | x | | |------------------------+---------+---------+----------| | Возможность использо- | x | x | | | вать в качестве библи- | | | | | отеки для других прог. | | | | |------------------------+---------+---------+----------| | Отношения синонимов | x | | | | построены автоматически| | | | |------------------------+---------+---------+----------| | Графический интерфейс | x | x | x | |------------------------+---------+---------+----------| | Поддержка русского | x | | x | +-------------------------------------------------------+ | Бесплатно | x | x | | +-------------------------------------------------------+ Для WordNet известно несколько графический интерфейсов. Это "WordNet 2.0 Browser" на TCL и WordWeb 2.1 (http://wordweb.info). Если у кого-то есть другая информация, которую стоило бы довабить в эту таблицу, пишите на easyjapan, который на mail ru. ********************************************************************** * Какой язык программирования использовался в этом проекте? Perl, v5.8.3 built for MSWin32-x86-multi-thread. Binary build 809 provided by ActiveState Corp. http://www.ActiveState.com. Perl/Tk для графического интерфейса. То есть программа должна работать на любой платформе, где есть Perl. ********************************************************************** * Особые проблемы? ********************************************************************** * Кто работает над этим проектом? Пока что только я :( ********************************************************************** * Причина создания проекта? Я познакомился и восхитился системой WordNet. В ходе проекта Knowledge Source Network. Меня доконала программа WordWeb, которая, на мой взляд, есть пример удобного интерфейса для WordNet. Правда, всё это для английского. Я стал регулярно пользоваться WordWeb и захотел иметь что-нибудь подобного рода для русского языка. ********************************************************************* * История проекта? Знаменательные даты: 2004-06 SlovNet 0.10 Первая версия появилась в июне 2004. И на конференции ( IX САНКТ-ПЕТЕРБУРГСКАЯ МЕЖДУНАРОДНАЯ КОНФЕРЕНЦИЯ «РЕГИОНАЛЬНАЯ ИНФОРМАТИКА - 2004» Санкт-Петербург, 22-24 июня 2004 г.) я о ней и рассказывал. Программа позволяет выполнять поиск для введенного слова на русском языке с выводом на экран: (i) наборов русских синонимов, которые содержат это слово; (ii) упорядоченный по частоте встречаемости набор синонимов; (iii) наборы синонимов WordNet, соотвествующие русским наборам; (iv) толкование набора синонимов (gloss) на английском языке из WordNet; (v) перевод из Мюллера. Прототип обладает следующими недостатками: на данный момент требуется большое количество оперативной памяти (180 MB); автоматически построенные наборы русских синонимов содержат часть слов, которые не являются синонимами исходного слова. ********************************************************************** * Планы на ближайшее и отдалённое будущее? Написать документацию. Улучшить интерфейс (shortcuts и т.д.). Ускорение за счёт загрузки предобработанного словаря Мюллера вместо парсинга (достаточно тяжёлого) на лету. Уточнение генерируемого наборов синонимов. За счёт использование дополнительных лингвистических ресурсов, словарей синонимов. Кроме существительных работать с другими частями речи. Кроме синонимии реализовать другие отношения WordNet. ********************************************************************** * Требуется помощь? Если да, то какого рода? На данном этапе - нет. ********************************************************************** * Интересные/забавные истории, которые оживят этот документ? Запросто ;) SlovNet загружается медленно. Пока что. В этой версии. Поэтому будет уместным, пожалуй, прекрасное стихотворение Бориса Слуцкого. Давайте устроим в жизни замедленное кино, медлительное, неторопливое, чтоб если путешествовать - сидеть под каждой оливою, давайте не торопиться, как делали это давно. Давайте отвинтим стрелки секундные и минутные, недаром их вовсе не было четыре века назад. Давайте прочтём, дочитаем все сочинения нудные, давайте возделывать сад. Давайте, если у бабушки было семь сыновей, заснимем отдельные фильмы, про каждую жизнь по серии. Давайте, если защёлкает за соловьём соловей, запомним: они не только талантливые, но серые. Растянем все удовольствия и главное - бытие. Задержимся на молодости, на зрелости и на старости. И если в самом деле каждому - своё, пусть каждый своё получит без спешки и без усталости. ********************************************************************** * Website/FTP адреса? http://whinger.narod.ru/soft/slovnet.html ********************************************************************** * Лицензия?! LGPL. Это значит, что данная программа может бесплатно использоваться для любого, в том числе и для коммерческого применения. При внесении модификаций в код программы, такой код (со всеми модификация) должен быть открытым. Более подробно о лицензии LGPL смотри в файле LGPL.txt ********************************************************************** * Стандарты рекомендуемые для ознакомления в данном контексте? Не знаю. Поскольку SlovNet непосредственно связан c WordNet, постольку рекомендую статью "Five Papers on WordNet". Её можно найти на сайте создателей WordNet http://www.cogsci.princeton.edu/~wn/ в разделе публикации. ********************************************************************** * Что ещё стоит упоминания? Если вам интересно, что вот отрывок из документации: 8. Как работает SlovNet Для работы SlovNet использует замечательную лексическую базу WordNet и англо-русский словарь Мюллера. Работа системы SlovNet состоит из двух этапов. Во-первых, это предварительный этап создания словаря SlovNet, где каждый набор синонимов имеет в соответствии ровно один набор синонимов из WordNet. Во-вторых, это поиск синонимов с помощью интерактивной графической оболочки SlovNet. ********************************************************************** * Ответ на вопрос: "Что я забыл сказать?" Как-будто ничего. ********************************************************************** ********************************************************************** * Уместная информация СЛОВАРЬ СИНОНИМОВ. Справочное пособие. Под ред. А.П. Евгеньевой. Л.: "Наука", 1975. Электронная версия synon.zip доступна по адресу http://www.irlras-cfrl.rema.ru:8100/synonyms/00-c.htm Я исправил несколько ошибок в этом файле со списком синонимов и выложил его здесь: http://whinger.narod.ru/soft/rsya/synon2.rar http://whinger.narod.ru/soft/rsya/rsya_changes.txt (Это описание ошибок) ********************************************************************** * http://whinger.narod.ru/soft/slovnet.html Данный сайт поддерживается мной, Крижановским Андреем (для связи easyjapan на mail который ru). Заходите на мою домашнюю страничку. [slovnetlogo]