электронная лекция 4
электронная лекция
Вопрос 4.1. Базы данных правовой информации
Одним из важных вопросов при решении задач в области юриспруденции является поиск нормативной и ненормативной документированной информации, связанной с решаемой проблемой.
Поиск нужных документов осложнен многими факторами.
1. Постоянно растет количество документов, т.к. они непрерывно образуются в результате правотворческой и правоприменительной деятельности.
2. Местные и ведомственные нормативные документы не печатаются в центральной прессе, поэтому трудно отследить их обновление или изменение.
3. Россия входит в международное информационное пространство, поэтому необходимо учитывать законодательства зарубежных стран и международные соглашения.
4. Позитивная избыточность правовой информации, которая используется законодателем для повышения эффективности восприятия нормативных актов. В этом случае одно и то же положение повторяется в нескольких нормативных правовых актах. Например, право на информацию встречается и в конституции РФ, и в законе «Об информации».
5. Негативная избыточность правовой информации, связанная с недоработкой правовых документов. Негативная избыточность возникает в тех случаях, когда в разных нормативных документах одинаковые термины описываются по-разному. Для выявления или использования подобных «дыр» в законодательной базе необходимо рассмотреть все нормативно-правовые акты, в которых упоминается данный термин.
6. Огромный объем ненормативной правовой информации, связанный с расследованием преступлений и антитеррористической деятельностью. Эта информация содержит не только текст, но и изображения, звук и др.
7. Часть правовых документов имеют ограниченный доступ.
Для компактного хранения, направленного поиска и защиты больших массивов информации используются базы данных (БД) . Выборку нужных документов можно получить по запросу. БД может храниться как на компьютере пользователя, так и на удаленном компьютере, связанном с пользователем по сети.
При разработке поисково-справочных систем по законодательству самой важной становится проблема индексации данных. Способ индексации определяет качество и скорость поиска, особенности построения запросов.
Рассмотрим основные понятия, касающиеся справочных правовых систем и работы с документами.
Индексация — обработка текста документа для осуществления полнотекстового поиска.
При индексации автоматически анализируется текст документа и создается таблица соответствия слов и их мест в документе. Обычно проводится морфологический анализ слова, чтобы объединить слова в разных падежах или формах. В результате индексации сокращается время поиска.
Информационно-поисковый язык (ИПЯ) — формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью их последующего хранения и поиска.
Информационный поисковый язык по законодательству должен обеспечивать:
• эффективную формализацию правовых норм и нормативных правовых актов;
• высокую скорость поиска на компьютере информации, необходимой для решения конкретных задач правотворчества; оптимальный (адекватный) перевод нормативного текста с юридического языка на язык, доступный ЭВМ;
• минимальный «шум» (т. е. сведение к минимуму выдачи компьютером излишней информации);
• полноту информационного поиска, т. е. получение всей необходимой информации для решения конкретных задач правотворчества.
Теория информационного поиска различает следующие типы ИПЯ.
Языки предметного типа — алфавитно-предметные указатели к сборникам и отдельным нормативным актам и широко распространенные алфавитно-предметные рубрикаторы . При использовании языка этого типа основная тема (предмет) документа выражается одним или несколькими типовыми словами — рубриками .
Язык классификационного типа представляет собой классификатор отраслей законодательства.
Языки дескрипторного типа — наиболее полно отражают смысл текста. Эти языки строятся на основе правового тезауруса.
Правовой тезаурус — собрание ключевых слов и дескрипторов, применяемых в качестве лингвистического обеспечения и использования автоматизированных информационно-поисковых системах правовой информации.
Ключевые слова наиболее полным образом описывают содержание правовых норм (актов), их самые существенные черты.
Дескриптор — выделенное ключевое слово, которое представляет целую группу ключевых слов, являющихся синонимами или уточнениями.
Поисковый образ правовой нормы (нормативно-правового акта) — формализованное представление структурных элементов НПА (нормы, статьи, акты в целом) в терминах информационно-поискового языка (ключевых слов, дескрипторов, индексов и т.п.). Поисковый образ правового акта (его части) служит для хранения данного документа в памяти компьютера.
Поиск документов происходит по запросу пользователя. В обычных поисковых системах существуют правила составления запроса (язык запросов). Естественный язык запроса — формулирование запроса к поисковой системе так же, как он был бы сформулирован при обращении к живому эксперту.
Самый легкий путь упрощения языка запроса — использование морфологического поиска. В этом случае на основе словаря или морфологического анализа определяется основа слова и возможные окончания. Поиск осуществляется по сочетанию основы и всех возможных окончаний.
При осуществлении семантического поиска определяется смысл вопроса. Для определения смысла текста используются базы знаний, формируемые системой автоматически, на основании словарей и справочников. Для этих целей применяются экспертные поисковые системы (ЭПС) .
Справочная правовая система (СПС) — информационная система, программно-информационный комплекс которой включает в себя информационные базы правовой информации и программные средства, позволяющие специалисту производить поиск, выборку и печать правовой информации.
Первая БД нормативных правовых актов была создана в СССР в 1975 г. в Научном центре правовой информации.
Задача построения Общенациональной системы правовой информации была провозглашена в указе Президента РФ от 28 июня 1993 г., утвердившего концепцию правовой информатизации России. Главным направлением создания Общенациональной системы правовой информации являются системы распределенной обработки информации, которые представляют собой совокупность территориально удаленных вычислительных средств, связанных друг с другом телекоммуникационными каналами связи.
Быстрое развитие и распространение справочных правовых информационных систем в России началось лишь в конце 80-х — начале 90-х гг. XX в.: (ЮСИС, «Гарант», «Консультант Плюс»).
В числе систем, созданных государственными предприятиями для обеспечения потребностей в правовой информации государственных ведомств, следует выделить:
• «Эталон» (НЦПИ при Министерстве юстиции РФ);
• «Система» (НТЦ «Система» при Научно-техническом центре правовой информации Федеральной службы охраны РФ).
Важно отметить, что «Система» является единственным официальным источником опубликования документов в машиночитаемом виде.
Среди негосударственных компаний-разработчиков СПС наиболее известны:
• «Гарант» (НПП «ГарантСервис»);
• «Консультант Плюс» (АО «Консультант Плюс»);
• «Кодекс» (ЦКР «Кодекс»).
Основным отличием СПС можно считать способ обновления информационного банка.
Компании, выпускающие СПС с обновляемой информационной базой, с самого начала своего развития сделали ставку на обеспечение высокого качества своей продукции и сервиса. Явными лидерами этой группы являются «Консультант Плюс» и «Гарант».
Компании, выпускающие СПС с автономной информационной базой, в качестве основной формы распространения правовой информации выбрали автономные правовые базы данных на CD. Такие СПС значительно дешевле, но они имеют менее развитый сервис и периодичность тиражирования дисков — один раз в месяц или один раз в квартал. К СПС второй группы относятся «Ваше право» (ИСТ), «Помощник бухгалтера» (ЦКР) и др.