Болезни Военный билет Призыв

Преимущества визуальной формы представления информации. Представление пространственных характеристик. Зачем использовать визуализацию данных

"Говорят, один рисунок стоит тысячи слов, и это действительно так, но при условии, что рисунок хороший." Боумена

С возрастанием количества накапливаемых данных, даже при использовании сколь угодно мощных и разносторонних алгоритмов Data Mining, становится все сложнее "переваривать" и интерпретировать полученные результаты. А, как известно, одно из положений Data Mining - поиск практически полезных закономерностей. Закономерность может стать практически полезной, только если ее можно осмыслить и понять.

В 1987 году по инициативе ACM SIGGRAPH IEEE Computer Society Technical Committee of Computer Graphics, в связи с необходимостью использования новых методов, средств и технологий данных, были сформулированы соответствующие задачи направления визуализации.

К способам визуального или графического представления данных относят графики, диаграммы, таблицы, отчеты, списки, структурные схемы, карты и т.д.

Визуализация традиционно рассматривалась как вспомогательное средство при анализе данных, однако сейчас все больше исследований говорит о ее самостоятельной роли.

Традиционные методы визуализации могут находить следующее применение:

представлять пользователю информацию в наглядном виде;

компактно описывать закономерности, присущие исходному набору данных;

снижать размерность или сжимать информацию;

восстанавливать пробелы в наборе данных;

находить шумы и выбросы в наборе данных.

Визуализация инструментов Data Mining

Каждый из алгоритмов Data Mining использует определенный подход к визуализации. В предыдущих лекциях мы рассмотрели ряд методов Data Mining. В ходе использования каждого из методов, а точнее, его программной реализации, мы получали некие визуализаторы, при помощи которых нам удавалось интерпретировать результаты, полученные в результате работы соответствующих методов и алгоритмов.

Для деревьев решений это визуализатор дерева решений, список правил, таблица сопряженности.

Для нейронных сетей в зависимости от инструмента это может быть топология сети, график изменения величины ошибки, демонстрирующий процесс обучения.

Для карт Кохонена: карты входов, выходов, другие специфические карты.

Для линейной регрессии в качестве визуализатора выступает линия регрессии.

Для кластеризации: дендрограммы, диаграммы рассеивания.

Диаграммы и графики рассеивания часто используются для оценки качества работы того или иного метода.

Все эти способы визуального представления или отображения данных могут выполнять одну из функций:

являются иллюстрацией построения модели (например, представление структуры (графа) нейронной сети);

помогают интерпретировать полученный результат;

являются средством оценки качества построенной модели;

сочетают перечисленные выше функции (дерево решений, дендрограмма).

Визуализация Data Mining моделей

Первая функция (иллюстрация построения модели), по сути, является визуализацией Data Mining модели. Существует много различных способов представления моделей, но графическое ее представление дает пользователю максимальную "ценность". Пользователь, в большинстве случаев, не является специалистом в моделировании, чаще всего он эксперт в своей предметной области. Поэтому модель Data Mining должна быть представлена на наиболее естественном для него языке или, хотя бы, содержать минимальное количество различных математических и технических элементов.

Таким образом, доступность является одной из основных характеристик модели Data Mining. Несмотря на это, существует и такой распространенный и наиболее простой способ представления модели, как "черный ящик". В этом случае пользователь не понимает поведения той модели, которой пользуется. Однако, несмотря на непонимание, он получает результат - выявленные закономерности. Классическим примером такой модели является модель нейронной сети.

Другой способ представления модели - представление ее в интуитивном, понятном виде. В этом случае пользователь действительно может понимать то, что происходит "внутри" модели. Таким образом, можно обеспечить его непосредственное участие в процессе.

Такие модели обеспечивают пользователю возможность обсуждать ее логику с коллегами, клиентами и другими пользователями, или объяснять ее.

Понимание модели ведет к пониманию ее содержания. В результате понимания возрастает доверие к модели. Классическим примером является дерево решений. Построенное дерево решений действительно улучшает понимание модели, т.е. используемого инструмента Data Mining.

Кроме понимания, такие модели обеспечивают пользователя возможностью взаимодействовать с моделью, задавать ей вопросы и получать ответы. Примером такого взаимодействия является средство "что, если". При помощи диалога "системапользователь" пользователь может получить понимание модели.

Теперь перейдем к функциям, которые помогают интерпретировать и оценить результаты построения Data Mining моделей. Это всевозможные графики, диаграммы, таблицы, списки и т.д.

Примерами средств визуализации, при помощи которых можно оценить качество модели, являются диаграмма рассеивания, таблица сопряженности, график изменения величины ошибки.

Диаграмма рассеивания представляет собой график отклонения значений, прогнозируемых при помощи модели, от реальных. Эти диаграммы используют для непрерывных величин. Визуальная оценка качества построенной модели возможна только по окончанию процесса построения модели.

Таблица сопряженности используется для оценки результатов классификации. Такие таблицы применяются для различных методов классификации. Они уже использовались нами в предыдущих лекциях. Оценка качества построенной модели возможно только по окончанию процесса построения модели.

График изменения величины ошибки . График демонстрирует изменение величины ошибки в процессе работы модели. Например, в процессе работы нейронных сетей пользователь может наблюдать за изменением ошибки на обучающем и тестовом множествах и остановить обучение для недопущения "переобучения" сети. Здесь оценка качества модели и его изменения может оцениваться непосредственно в процессе построения модели.

Примерами средств визуализации, которые помогают интерпретировать результат, являются: линия тренда в линейной регрессии, карты Кохонена, диаграмма рассеивания в кластерном анализе.

Методы визуализации

Методы визуализации, в зависимости от количества используемых измерений, принято классифицировать на две группы :

представление данных в одном, двух и трех измерениях;

представление данных в четырех и более измерениях.

Представление данных в одном, двух и трех измерениях

К этой группе методов относятся хорошо известные способы отображения информации, которые доступны для восприятия человеческим воображением. Практически любой современный инструмент Data Mining включает способы визуального представления из этой группы.

В соответствии с количеством измерений представления это могут быть следующие способы:

одномерное (univariate) измерение, или 1-D;

двумерное (bivariate) измерение, или 2-D;

трехмерное или проекционное (projection) измерение, или 3-D.

Следует заметить, что наиболее естественно человеческий глаз воспринимает двухмерные представления информации.

При использовании двух- и трехмерного представления информации пользователь имеет возможность увидеть закономерности набора данных:

его кластерную структуру и распределение объектов на классы (например, на диаграмме рассеивания);

топологические особенности;

наличие трендов;

информацию о взаимном расположении данных;

существование других зависимостей, присущих исследуемому набору данных.

Если набор данных имеет более трех измерений, то возможны такие варианты:

использование многомерных методов представления информации (они рассмотрены ниже);

снижение размерности до одно-, двухили трехмерного представления. Существуют различные способы снижения размерности, один из них - факторный анализ - был рассмотрен в одной из предыдущих лекций. Для снижения размерности и одновременного визуального представления информации на двумерной карте используются самоорганизующиеся карты Кохонена.

Представление данных в 4 + измерениях

Представления информации в четырехмерном и более измерениях недоступны для человеческого восприятия. Однако разработаны специальные методы для возможности отображения и восприятия человеком такой информации.

Наиболее известные способы многомерного представления информации:

параллельные координаты;

∙ "лица Чернова";

лепестковые диаграммы.

Параллельные координаты

В параллельных координатах переменные кодируются по горизонтали, вертикальная линия определяет значение переменной. Пример набора данных, представленного в декартовых координатах и параллельных координатах, дан на рис. 16.1 . Этот метод представления многомерных данных был изобретен Альфредом Инселбергом (Alfred Inselberg) в 1985 году.

Само по себе понятие является достаточно многогранным, существует несколько определений в зависимости от того, о каком поле деятельности идет речь. Целью визуализации является Это означает, что данные должны исходить от чего-то абстрактного или, по крайней мере, не быть очевидными сразу. Визуализация объектов исключает фотосъемку и это превращение из невидимого в видимое.

Визуализация данных

Визуализация информации - это процесс представления абстрактных деловых или научных данных в виде изображений, которые могут помочь в понимании смысла данных. Что такое визуализация информации? Это понятие можно определить как сопоставление дискретных данных и их визуальное представление. Это определение не охватывает все аспекты визуализации информации, такие как статическая, динамичесая (анимация) и наиболее актуальная на сегодняшний день интерактивная визуализация. Помимо различий между интерактивной визуализацией и анимацией, самая полезная категоризация основывается на научной визуализации, которая обычно осуществляется при помощи специализированного программного обеспечения. Важная роль отводится наглядности в образовательной сфере. Это очень полезно, когда речь идет о преподавании тем, которые трудно представить без конкретных примеров, например, строение атомов, которые слишком малы, чтобы можно было их изучить без дорогостоящего и сложного в использовании научного оборудования. Визуализация позволяет проникнуть в любой мир и представить себе то, что, казалось бы, представить невозможно.

3D-визуализация

Программное обеспечение помогает конструкторам и специалистам цифрового маркетинга создавать визуальное изображение продукта, проекта или виртуальных прототипов в формате 3D. Визуализация предоставляет разработчикам инструменты, которые могут расширить передовые Визуализация с помощью визуальных образов является эффективным способом общения. Зрительное представления является одним из лучших способов коммуникации с потенциальными клиентами. Эффективное общение позволяет тратить больше времени на улучшение своих проектов и продуктивное взаимодействие. Визуализация 3D представляет собой технику создания объемных изображений, диаграмм или анимации.

Использование визуализации в науке

Сегодня визуализация имеет постоянно расширяющийся ассортимент приложений в области науки, образования, техники, интерактивных мультимедиа, медицины и многих других. Свое применение нашла визуализация также в области компьютерной графики, наверное, одном из самых важных событий компьютерного мира. Развитие анимации также способствует продвижению визуализации. Использование визуализации для представления информации - это не новое явление. Она была использована в картах, научных рисунках на протяжении более тысячи лет. Компьютерная графика с самого начала использовалась для изучения научных проблем. Большинство людей знакомы с цифровой анимацией, например, в виде представления метеорологических данных во время сводки погоды по телевидению. Телевизор также предлагает версию научной визуализации, когда он показывает прорисованные с помощью компьютерных программ и анимированных реконструкций дорог или аварий самолета. Некоторые из самых интересных примеров, созданных компьютером, включают изображение реального космического корабля в действии, в пустоте далеко за пределами Земли или на других планетах. Динамические формы визуализации, такие как образовательные анимации или графики, имеют потенциал для повышения качества обучения, так как системы визуализации меняются с течением времени.

Ключ к достижению поставленных целей

Что такое важный инструмент личностного развития. Подобно тому как мотивирующие аффирмации могут помочь сосредоточиться на достижении своих целей, то же самое можно сделать и с помощью визуализации или мысленных образов. Хотя методы визуализации в этом смысле стали очень популярны в качестве средства для развития личности с конца семидесятых и в начале восьмидесятых, люди использовали ментальные образы для осуществления своих желаний еще в древности.

Творческий инструмент

Что такое визуализация? Это использование воображения для создания ментальных образов того, чего мы хотим в нашей жизни. Вместе с фокусированием и эмоциями она становится сильным творческим инструментом, который помогает в достижении желаемой цели. При правильном использовании это может привести к самосовершенствованию, хорошему здоровью и различным достижениям, например, в карьере. В спорте ментальные образы как средства визуализации часто используются спортсменами для повышения своих навыков. Использование визуализации как техники неизменно приводит к гораздо лучшей производительности и результатам. Это также справедливо и в бизнесе, и в жизни.

Как это работает?

Визуализация, или воображение, работает на физиологическом уровне. Нейронные связи, возникающие в мозгу, иначе говоря, мысли, могут стимулировать нервную систему точно так же, как реальное событие. Такого рода "репетиции", или прогонка определенных событий в голове, создают нейронные колебания, которые заставят мышцы делать то, что от них требуется. Взять, например, тех же спортсменов. На время спортивных соревнований важным является не только исключительные физические навыки, но и четкое понимание игры и определенный психологический и эмоциональный настрой. Для большей эффективности, как и любой другой навык, воображение необходимо регулярно тренировать. Без чего является невозможной визуализация? Уроки развития воображения включают в себя важные элементы, а именно ментальные образы релаксации, реалистичность и систематичность.

Когда использовать визуализацию?

Зрительное наблюдение успешных результатов своей деятельности можно проводить абсолютно по любому поводу. Многие используют визуализацию для оживления своих целей. Многие спортсмены, актеры и певцы достигают чего-то сначала в своих умах, а затем только в реальности. Это помогает сосредоточиться и устранить некоторые предварительные страхи и сомнения. Это своеобразная разминка или репециция, которую можно проводить перед важным и волнительным событием. Визуализация - это прекрасный инструмент для подготовки, который неизменно приводит к повышению уровня производительности.

Как осуществляется процесс визуализации?

Можно пойти куда-нибудь в тихое и уединенное место, где вас никто не побеспокоит, закрыть глаза и думать о цели, настрое, поведении или навыках, которые вы хотите приобрести. Сделайте несколько глубоких вдохов и расслабьтесь. Старайтесь визуализировать предмет или ситуацию так четко и во всех подробностях, как это возможно. Эмоции и чувства при этом также играют большую роль, старайтесь прочувствовать то, чего хочется больше всего на свете. Практиковать упражнение стоит, по крайней мере, дважды в день примерно по 10 минут каждый раз и упорствовать до тех пор, пока не добьетесь успеха. Немаловажно также поддерживать и хорошее настроение на протяжении всего процесса.

Преимущества визуализации

Систематическая визуализация модели своего желания поможет лучше ориентироваться на пути достижения поставленных целей, будет вдохновлять и мотивировать, повысит настроение с помощью позитивных, приятных изображений и избавит от негативных эмоций. В жизни и в работе успех начинается с цели. Это может быть потеря веса, повышение по службе, избавление от вредных привычек, начало собственного бизнеса. Большие или маленькие цели дают важный ориентир. Они как компас - помогают двигаться в правильном направлении. Визуализация была описана еще Аристотелем более 2000 лет тому назад. Великий мыслитель своего времени описал этот процесс такими словами: "Во-первых, должен быть определенный, ясный, практический идеал, цель или задача. Во-вторых, есть необходимые средства для их достижения: мудрость, деньги, средства и методы. В-третьих, самое главное - это научиться управлять всеми необходимыми средствами для достижения желаемого результата".

Видеть - значит верить

Обычно происходит так: не поверю, пока не увижу. Прежде чем поверить в достижимость цели, сначала нужно иметь об этом визуальное представление. Техника создания мысленного образа будущего события дает возможность представить желаемые результаты и прочувствовать радость от их достижения. Когда это происходит, человек мотивируется и приобретает готовность добиваться своей цели.
Стоит помнить, что это не хитрый трюк, не просто мечты и надежды на будущее. Скорее, визуализация - это хорошо разработанный метод повышения эффективности, которым пользуются успешные люди в самых разных областях. Исследования показывают, что визуализация повышает спортивные показатели за счет улучшения мотивации, координации и концентрации. Это также помогает в релаксации и позволяет уменьшить страх и тревогу.

Почему визуализация работает?

По данным исследований, в которых использовались снимки мозга, запечатлевшие работу визуализации, можно сделать вывод о том, что нейроны в мозгу, эти электрически возбудимые клетки, которые передают информацию, интерпретируют образы в качестве эквивалента реальных жизненных действий. Мозг генерирует импульс, это создает новые нейронные пути — скопления клеток в нашем мозге, которые работают вместе, чтобы воссоздать воспоминания или поведенческие шаблоны. Все это происходит без физической активности, но таким образом мозг как бы программирует сам себя на успех. Огромным плюсом силы визуализации является то, что она доступна абсолютно для всех людей.

Неразрывная связь между умом и телом

Визуализация является психической практикой. С ее помощью мощно задействуются естественные силы разума. Мы можем использовать силу разума, чтобы стать успешными во всех сферах нашей жизни. Психологические методики учат нас, как использовать воображение, чтобы представить себе конкретные вещи, которые мы хотим иметь в нашей жизни. Весьма замечательно то, что наши мысли влияют на нашу реальность.

Ученые доказали, что мы используем всего 10% от общего потенциала нашего мозга, и это в лучшем случае. Можно ли научиться более эффективно использовать наши природные способности? Системы визуализации представляют собой неразрывные биологические связи между умом и телом, а также связь между умом и реальностью. Если мы научимся использовать воображение и визуализацию в правильном направлении, то она может стать чрезвычайно мощным средством для получения того, что мы хотим в нашей жизни. Важно научиться использовать силу нашего разума совместно с творческими подходом, который помогает раскрыть и развить скрытые таланты и возможности.

С возрастанием количества накапливаемых данных, даже при использовании сколь угодно мощных и разносторонних алгоритмов Data Mining, становится все сложнее "переваривать" и интерпретировать полученные результаты. А, как известно, одно из положений DM - поиск практически полезных закономерностей. Закономерность может стать практически полезной, только если ее можно осмыслить и понять.

К способам визуального или графического представления данных относят графики, диаграммы, таблицы, отчеты, списки, структурные схемы, карты и т.д.

Визуализация традиционно рассматривалась как вспомогательное средство при анализе данных, однако сейчас все больше исследований говорит о ее самостоятельной роли.

Традиционные методы визуализации могут находить следующее применение:

представлять пользователю информацию в наглядном виде;

компактно описывать закономерности, присущие исходному набору данных;

снижать размерность или сжимать информацию;

восстанавливать пробелы в наборе данных;

находить шумы и выбросы в наборе данных.

Методы визуализации

Методы визуализации, в зависимости от количества используемых измерений, принято

классифицировать на две группы :

представление данных в одном, двух и трех измерениях;

представление данных в четырех и более измерениях.

Представление данных в 4 + измерениях

Представления информации в четырехмерном и более измерениях недоступны для человеческого восприятия. Однако разработаны специальные методы для возможности отображения и восприятия человеком такой информации.

Наиболее известные способы многомерного представления информации:

параллельные координаты;

"лица Чернова";

лепестковые диаграммы.

Представление пространственных характеристик

Отдельным направлением визуализации является наглядное представление

пространственных характеристик объектов. В большинстве случаев такие средства выделяют на карте отдельные регионы и обозначают их различными цветами в зависимости от значения анализируемого показателя.



Карта представлена в видеграфического интерфейса, отображающего данные в виде трехмерного ландшафтапроизвольно определенных и позиционированных форм (столбчатых диаграмм, каждая синдивидуальными высотой и цветом). Такой способ позволяет наглядно показыватьколичественные и реляционные характеристики пространственно-ориентированных

данных и быстро идентифицировать в них тренды.

Процесс Data Mining. Анализ предметной области. Постановка задачи. Подготовка данных.

Процесс Data Mining. Начальные этапы

Процесс DM является своего рода исследованием. Как любое исследование, этот процесс состоит из определенных этапов, включающих элементы сравнения, типизации, классификации, обобщения, абстрагирования, повторения.

Процесс DM неразрывно связан с процессом принятия решений.

Процесс DM строит модель, а в процессе принятия решений эта модель эксплуатируется.

Рассмотрим традиционный процесс DM. Он включает следующие этапы:

анализ предметной области;

постановка задачи;

подготовка данных;

построение моделей;

проверка и оценка моделей;

выбор модели;

применение модели;

коррекция и обновление модели.

В этой лекции мы подробно рассмотрим первые три этапа процесса Data Mining,

остальные этапы будут рассмотрены в следующей лекции.

Этап 1. Анализ предметной области

Исследование - это процесс познания определенной предметной области, объекта или явления с определенной целью.

Процесс исследования заключается в наблюдении свойств объектов с целью выявления и оценки важных, с точки зрения субъекта-исследователя, закономерных отношений между показателями данных свойств.

Решение любой задачи в сфере разработки программного обеспечения должно начинаться с изучения предметной области.

Предметная область - это мысленно ограниченная область реальной действительности, подлежащая описанию или моделированию и исследованию.

Предметная область состоит из объектов, различаемых по свойствам и находящихся в определенных отношениях между собой или взаимодействующих каким-либо образом.

Предметная область - это часть реального мира, она бесконечна и содержит как

существенные, так и не значащие данные, с точки зрения проводимого исследования.

Исследователю необходимо уметь выделить существенную их часть. Например, при решении задачи "Выдавать ли кредит?" важными являются все данные про частную жизнь клиента, вплоть до того, имеет ли работу супруг, есть ли у клиента несовершеннолетние дети, каков уровень его образования и т.д. Для решения другой задачи банковской деятельности эти данные будут абсолютно неважны. Существенность данных, таким образом, зависит от выбора предметной области.

принятия решений . В связи с этим возникает необходимость перехода средств визуализации на более качественный уровень, который характеризуется появлением абсолютно новых средств визуализации и взглядов на ее функции, а также развитием ряда тенденций в этой области.

Среди основных тенденций в области визуализации Филип Рассом (Philip Russom) выделяет :

  1. Разработка сложных видов диаграмм.

    Большинство визуализаций данных построено на основе диаграмм стандартного типа (секторные диаграммы, графики рассеяния и.т.д.). Эти способы являются одновременно старейшими, наиболее элементарными и распространенными. В последние годы перечень видов диаграмм, поддерживаемых инструментальными средствами визуализации, существенно расширился. Поскольку потребности пользователей весьма многообразны, инструменты визуализации поддерживают самые различные типы диаграмм. Например, известно, что бизнес-пользователи предпочитают секторные диаграммы и гистограммы, тогда как ученых больше устраивают визуализации в виде графиков рассеяния и диаграмм констелляции. Пользователи, работающие с геопространственными данными, сильнее заинтересованы в картах и прочих трехмерных представлениях данных. Электронные инструментальные панели, в свою очередь, более популярны среди руководителей, использующих бизнес-аналитические технологии для контроля за показателями работы компании. Такие пользователи нуждаются в наглядной визуализации в виде "спидометров", "термометров" и "светофоров".

    Средства создания диаграмм и презентационной графики предназначены главным образом для визуализации данных. Однако возможности такой визуализации обычно встроены и во множество различных других программ и систем - в инструменты репортинга и OLAP, средства для Text Mining и Data Mining , а также в CRM-приложения и приложения для управления бизнесом. Для создания встроенной визуализации многие поставщики реализуют визуализационную функциональность в виде компонент, встраиваемых в различные инструменты, приложения, программы и web-страницы (в том числе инструментальные панели и персонализированные страницы порталов).

  2. Повышение уровня взаимодействия с визуализацией пользователя.

    Еще совсем недавно большая часть средств визуализации представляла собой статичные диаграммы, предназначенные исключительно для просмотра. Сейчас широко используются динамические диаграммы, уже сами по себе являющиеся пользовательским интерфейсом, в котором пользователь может напрямую и интерактивно манипулировать визуализацией, подбирая новое представление информации.

    Например, базовое взаимодействие позволяет пользователю вращать диаграмму или изменять ее тип в поисках наиболее полного представления данных. Кроме того, пользователь может менять визуальные свойства - к примеру, шрифты, цвета и рамки. В визуализациях сложного типа (графиках рассеяния или диаграммах констелляции) пользователь может выбирать информационные точки с помощью мыши и перемещать их, облегчая тем самым понимание представления данных.

    Более совершенные методы визуализации данных часто включают в себя диаграмму или любую другую визуализацию как составной уровень. Пользователь может углубляться (drill down) в визуализацию, исследуя подробности обобщенных ею данных, или углубляться в OLAP, Data Mining или другие сложные технологии.

    Сложное взаимодействие позволяет пользователю изменять визуализацию для нахождения альтернативных интерпретаций данных. Взаимодействие с визуализацией подразумевает минимальный по своей сложности пользовательский интерфейс, в котором пользователь может управлять представлением данных, просто "кликая" на элементы визуализации, перетаскивая и помещая представления объектов данных или выбирая пункты меню. Инструменты OLAP или Data Mining превращают непосредственное взаимодействие с визуализацией в один из этапов итерационного анализа данных. Средства Text Mining или управления документами придают такому непосредственному взаимодействию характер навигационного механизма, помогающего пользователю исследовать библиотеки документов.

    Визуальный запрос является наиболее современной формой сложного взаимодействия пользователя с данными. В нем пользователь может, например, видеть крайние информационные точки графика рассеяния, выбирать их мышкой и получать новые визуализации, представляющие именно эти точки. Приложение визуализации данных генерирует соответствующий язык запроса, управляет принятием запроса базой данных и визуально представляет результирующее множество. Пользователь может сфокусироваться на анализе, не отвлекаясь на составление запроса.

  3. Увеличение размеров и сложности структур данных, представляемых визуализацией.

    Элементарная секторная диаграмма или гистограмма визуализирует простые последовательности числовых информационных точек. Однако новые усовершенствованные типы диаграмм способны визуализировать тысячи таких точек и даже сложные структуры данных - например, нейронные сети.

    Скажем, средства OLAP (а также инструменты генерации запросов и выпуска отчетов) уже давно поддерживают диаграммы для своих онлайновых отчетов. Новые визуализационные программы обновляют контент за счет периодически повторяющегося считывания данных. Фактически пользователи визуализационных программ, отслеживающие линейные процессы (колебания фондового рынка, показатели работы компьютерных систем, сейсмограммы, сетки полезности и др.), нуждаются в загрузке данных в режиме реального времени или близком к нему режиме.

    Пользователи инструментов Data Mining обычно анализируют очень большие наборы численных данных. Традиционные типы диаграмм для бизнеса (секторные диаграммы и гистограммы) плохо справляются с представлением тысяч информационных точек. Поэтому инструменты Data Mining почти всегда поддерживают некую форму визуализации данных, способную отражать структуры и закономерности исследуемых наборов данных, в соответствии с тем аналитическим подходом, который используется в инструменте.

    Помимо того, что визуализация поддерживает обработку структурированных данных, она также является ключевым средством представления схем так называемых неструктурированных данных, например текстовых документов, т.е. Text Mining. В частности, средства Text Mining могут осуществлять парсинг больших пакетов документов и формировать предметные указатели понятий и тем, освещенных в этих документах. Когда предметные указатели созданы с помощью нейросетевой технологии, пользователю непросто продемонстрировать их без некоторой формы визуализации данных. Визуализация в таком случае преследует две цели:

    • визуальное представление контента библиотеки документов;
    • навигационный механизм, который пользователь может применять при исследовании документов и их тем.

Выводы

Как показывают многие исследования, визуализация является одним из наиболее перспективных направлений анализа данных, в т.ч. Data Mining . Однако в этом направлении можно выделить проблемы, такие как сложность ориентации среди огромного количества инструментов, предлагающих решения по визуализации, а также непризнание рядом специалистов методов визуализации как полноценных средств анализа и навязывание им вспомогательной роли при использовании других методов. Однако у визуализации есть неоспоримые преимущества: она может служить источником информации для пользователя, не требуя теоретических знаний и специальных навыков работы, может выступить тем языком, который объединит профессионалов из различных проблемных областей, может превратить исходный набор данных в изображение, благодаря которому у исследователя могут появиться абсолютно новые, неожиданные решения.

Методы мысленного отображения и визуального представления часто являются основой стратегии ориентирования при интерпретации карты. Некоторым это дается легко, другим труднее, хотя с опытом навыки улучшаются. Описание картины в виде написанного текста, связанное с определенным видом спорта, часто используется, чтобы помочь участникам создать яркий образ. Это позволяет им построить соответствующие преодолевающие стратегии для потенциально трудных ситуаций окружающей среды. Описание местности часто используется в ориентировании как часть технической тренировки. Например, тренер или другой человек просит, чтобы oриентировщик представил, а затем устно описал местоположение КП или основные ориентиры маленького участка карты. Местоположение КП на вершине холмика, который имеет маленькие болота к северо-востоку и юго-западу. Длинный отрог тянется на запад, а меньшие холмики расположены к северо-востоку, востоку и юго-западу. На котором холмике стоит КП? Аналогично ориентировщик мог бы выслушать описание маленького участка карты или местоположения КП, а затем попробовать воспроизвести устное описание: Холм в виде сосиски имеет две вершины, по одной в каждом конце узкого горного хребта, расположенного в восточно-западном направлении. Горный хребет имеет два холмика, создающих седловину на равном расстоянии от вершин. К северо-западу от седловины круто спускается долина. Восточная вершина выше, чем западная и имеет крутой склон на востоке, большой широкий отрог, убегающий на север и пологий склон на юге. Западная вершина имеет пологий склон на севере и западе и длинный тонкий отрог, лежащий к югу. Оба эти способа помогают развить визуальное представление. Навыки визуального представления фундаментальны для ориентирования. Способность представить местоположение КП или определенную область карты должна улучшиться с опытом. Практика, однако, не должна ограничиваться тренировкой или участием в соревнованиях. Существуют другие возможности для практики, как в помещении, так и на улице. Например, постепенное изучение карт знакомых и незнакомых областей и затем визуальное представление местоположения КП, основанное на информации карты, может предшествовать фактическому посещению местности. Очень часто во время обсуждения местоположения КП или участка карты можно услышать от ориентировщика "это не было то, что я ожидал". Другой способ, используемый некоторыми oриентировщиками, заключается в том, чтобы, тренируясь на знакомом ландшафте, работать с картой другой территории и на бегу пытаться представить характерные черты незнакомого ландшафта. Это может показаться довольно причудливым, но это очень хорошее упражнение на концентрацию.