Раз в неделю мы с заботой отбираем самые полезные новости для пользователя 1С!

Служба заботы ООО "Инженер-Центр" :)

Информационный поиск – это поиск объекта и его связей

Волжский

|

Волгоград

|

Камышин

(8442) 23-84-08 mail@ec-1c.ru
Мы на карте
(84457) 4-25-94 mail@ec-1c.ru
Мы на карте
Если вы хотите первыми получать наши новости, введите свой e-mail!

Перейти к заказу билетов
06.05.2014       Информационный поиск – это поиск объекта и его связей.

      С чего начинается поиск нужной информации? Обычно со слова или со словосочетания. Потом подбором других уточняющих словосочетаний клубок разматывается до нужного места. Так хорошо искать, когда знаешь предмет поиска хорошо. Когда знаешь предмет поиска плохо – так искать трудно.

     Если была бы возможность искать не слово, а сразу поднимать объект во всём его великолепии, во всех проявлениях, со всеми его возможными действиями. Чтобы взяв слово «камень» можно было бы сразу увидеть все варианты использования этого слова – все проявления и контакты «камня» в окружающей его среде. Дальше можно было бы выбрать нужное направление и углублять его туда куда направлен интерес.

      Начинать поиск информации не со слова, а с объекта. Чтобы сразу было видно, что стоит за этим словом. Или словосочетанием.

    Но тогда получается, что наша поисковая система должна заранее содержать внутри себя информацию об объектах поиска. Объект со всеми его связями уже должен сидеть внутри системы.

     Как объекты попадут внутрь такой поисковой системы? Мы должны их туда поместить.

     Можно это сделать аккуратно руками: взять нужный объект, проанализировать какие действия и другие объекты с ним связаны, нарисовать дерево этих связей и поместить оное дерево внутрь нашей поисковой системы. Время от времени поправлять накопленную информацию изменениями и новостями по объекту. Для узкоспециализированных информационных систем подход нормальный. Для персональной информационной системы такой подход так же подойдёт.

    Но автоматизация этой работы позволила бы сильно расширить область применения такого поиска. Можно было бы взять большой пакет текстов по нужной нам теме и на их основе построить деревья связей объектов со своими действиями и с другими объектами. Речь идёт об объектах информации, по которым содержится в пакете текстов. Вылавливать информацию о действиях объекта и его связей придётся из предложений. Это не очень легко и просто. Потому что надо решить ряд технологических задач по обработке текстов.

     1. Надо разобрать текст на абзацы. Абзацы на предложения. Предложения текста на слова. Это легко.

    2. Определить – какой частью речи является каждое слово и в каком склонении, спряжении оно употребляется. Это уже труднее. Надо строить словарь, по которому это можно сделать.

     3. После этого надо сделать синтаксический разбор предложения. Определить – каким членом предложения (подлежащее, сказуемое, определение и т.д.) является каждое слово и как эти члены предложения между собой связаны. Тоже непростая задача. Но именно её решение позволит нам выявить связи основных объектов друг с другом. Именно так мы можем выявить какие действия может предпринимать наш объект. Как его используют другие объекты.

      4. Дальше надо выявить связи между предложениями. То есть выявить связи объекта, которые уходят за пределы одного предложения.

      5. В итоге мы должны получить набор объектов. Каждый объект должен быть «обвешан» действиями, связями с другими объектами. И все эти наборы должны быть размещены в базе данных. Для удобства просмотра и анализа. Тут же должны храниться ссылки на источники информации – места откуда мы взяли нашу информацию.

      Такой подход позволит нам начать изучение и анализ имеющейся информации до начала поиска. Мы сразу начинаем работать с нужными объектами и изучать их свойства. Мы сразу видим всё что могут эти объекты сами и всё что с ними могут сделать другие объекты.
     
       При обработке новых текстов у объектов могут появляться новые связи и новые действия. Мы можем отслеживать появление этой новой информации по интересующему нас объекту и оперативно знакомиться с ней. Мы можем наблюдать за жизнью и развитием объектов.

      Работая по интересующей нас тематике мы можем «разбирать» сделанную нами информацию на объекты, действия, связи. Мы сразу будем видеть структуру нашей новой информации. Можем быстро передавать её другим. Нам самим будет легче в ней ориентироваться.

    Для конкретного пользователя можно выделить определённый круг интересующих его объектов. Передать пользователю описание этих объектов, их действий, их связей. И так же передавать пользователю всю новую информацию по этим объектам.

      Шилин А.Н., Зам. Директора ООО «Инженеры Информации»

Возврат к списку