Анализ и обработка информации в конкурентной разведке
Самообучающиеся алгоритмы (наиболее известный вариант – нейронные сети) это некое сильно упрощенное подобие организации человеческого мозга. Есть масса мини-объектов, между которыми можно построить неограниченное количество связей. Именно организация этих связей и есть описываемая модель. Работа с подобными системами сводится к тому, что мы вливаем в эту сеть историю изучаемого процесса. Система выбирает закономерности и формирует модель процесса. Постепенно, методом проб и ошибок, эта модель оттачивается и получается необходимый инструмент.
Самообучающиеся алгоритмы – наиболее приемлемый метод для построения моделей на основе неструктурированной информации (текстовой информации). Но данный метод имеет свои особенности и сложности. Перед внесением данных в нейросеть их нужно тщательно обработать, удалив «мусор». Иначе внеся «мусор» на входе – получите «мусор» и на выходе. В первую очередь необходимо выбрать основополагающие свойства оригинала. Те свойства, которые оказывают максимальное воздействие на интересующие нас стороны существования объекта изучения.
Приемы анализа:
1) Построение последовательности событий (Исторический метод).
Данный метод является одним из наиболее простых и позволяет быстро понять, что происходит. С него начинается изучение той или иной области, того или иного объекта. Суть его заключается в следующем – все поступающие данные выстраиваются по времени описываемых событий. После чего определяется что за чем следует, какой факт какое событие предопределяет, что чему сопутствует и т.п. Иначе говоря, восстанавливается хронология событий. Это один из наиболее эффективных и используемых приемов обработки информации.
При построении цепочки событий, особенно если аналогично рассматриваются и параллельные происшествия, становиться многое понятно. Используя данный метод можно выяснить, как развивались события, что зачем следует и что чему предшествует, можно выявить определенные закономерности.
Разновидности данного метода используются для исследования потоков товаров – откуда, куда, через кого и когда проходил товар (или груз, или информация). Результатом такого исследования становится диаграмма событий. Сами события располагаются вдоль выбранной оси (горизонтальной или вертикальной), на которой есть разметка времени. А от предшествующего события к последующему ведет стрелка. С помощью такой визуализации удобно отображать большие объемы информации, выявлять аномалии и отклонения, находить «скопления» событий и т.п.
2) Выявление связей.
Этот метод можно охарактеризовать как определение всего, что так или иначе связано с изучаемым объектом или событием. Такие связи могут быть явными и неявными. К явным относятся прямо установленные. К неявным относятся те связи, которые нельзя доказать фактами, но которые могут существовать. Например, один юридический адрес у нескольких организаций может указывать на то, что они созданы одной юридической конторой, а на основе этого можно предположить и более значимую связь, которая, безусловно, требует дополнительной проверки. Неявные связи не являются фактами, но они указывают на то, в каком направлении нужно вести поиск. А это уже задание оперативникам.
Оптимальным представлением выявленных связей является визуальная форма – диаграмма связей. Объекты, между которыми выявлены связи, обозначаются разными геометрическими фигурами – в зависимости от принятых условностей. Например, человек – круг, а организация – прямоугольник. А связи – линиями. Если исследовать таким образом телефонные контакты или почту, можно учитывать направление связи используя для обозначения связи стрелки, а не линии. В центре такой диаграммы удобнее всего располагать объект с наибольшим количеством связей с другими объектами.
3) Выявление силы связей.
Данный прием хорошо иллюстрируется анализом телефонных контактов. Все контакты (связи) между объектами сортируются в зависимости от того, между кем они возникают. Затем оцениваются по частоте возникновения либо по продолжительности действия. На основе данных о силе связей строятся гипотезы и вырабатываются рекомендации для дальнейшего поиска.