Универсальные пакеты, или пакеты общего назначения (например, SPSS, STATA, STATISTICA, S-PLUS, Stadia, STATGRAPHICS, SYSTAT, Minitab).

Описание:
Доступные действия
Введите защитный код для скачивания файла и нажмите "Скачать файл"
Защитный код
Введите защитный код

Нажмите на изображение для генерации защитного кода

Текст:

Обзор пакетов программ для обработки статистических данных

Потребность в средствах статистического анализа данных в различных областях деятельности, особенно в науке, очень велика, что и послужило причиной развития рынка компьютерных программ для статистической обработки данных. За последние 20 лет активное развитие получили компьютерные программы, позволяющие проводить статистический анализ больших объемов данных с целью выявления закономерностей, сравнения вероятных альтернатив выбора, построения прогнозов развития событий, обнаружения связей между явлениями и процессами и пр. Существующие программы постоянно совершенствуются в части ускорения работы с данными, улучшения представления результатов анализа данных, повышения удобства интерфейса, совершенствования справочной системы, увеличения числа встроенных в программу статистических процедур, средств обработки данных и пр.

Отрасль развивается стремительными темпами. На сегодняшний день на рынке представлено около тысячи компьютерных программ для статистической обработки данных (далее – статистические пакеты). Разнообразие статистических пакетов обусловлено многоплановостью задач обработки данных с применением различных типов статистических процедур анализа для поиска ответов на вопросы из различных областей человеческой деятельности.

Рынок компьютерных программ для статистического анализа данных характеризуется высокой конкуренцией, нередки случаи консолидации и поглощений компаний-разработчиков. Например, один из самых активных игроков на рынке компания SPSS Inc. в 1994 г. поглотила компанию SYSTAT Software Inc., а в 1996 г. – BMDP Statistical Software Inc. Эти приобретения позволили компании усовершенствовать собственные программные продукты. В частности, поглощение BMDP Software позволило усилить графические инструменты представления данных в SPSS, а поглощение SYSTAT – технологии обработки и анализа данных, полученных при биологических и медицинских исследованиях. В 2009 году компания IBM Inc. поглотила компанию SPSS Inc.

Перед пользователями различных категорий встает вопрос выбора оптимального статистического пакета для поиска верных ответов на существующие вопросы. Очевидно, что оптимальным является вариант, сочетающий в себе необходимые функциональные возможности, высокое качество работы и умеренную цену. При выборе пакета учитываются следующие параметры:

·         соответствие характеру решаемых задач;

·         объем обрабатываемых данных;

·         требования, предъявляемые к квалификации пользователя (уровень знаний в области статистики);

·         имеющееся в наличии компьютерное оборудование.

Статистические пакеты по признаку функциональности могут быть разделены на 3 основные группы.

1.     Универсальные пакеты, или пакеты общего назначения (например, SPSS, STATA, STATISTICA, S-PLUS, Stadia, STATGRAPHICS, SYSTAT, Minitab).

Эти пакеты не ориентированы на специфическую предметную область и могут применяться для анализа данных из различных областей деятельности. Как правило, они предлагают широкий диапазон статистических методов и имеют относительно простой интерфейс. С такими пакетами рекомендуется работать начинающим пользователям, владеющим лишь базовыми знаниями в области статистики, а также опытным пользователям на начальных этапах работы с данными, когда еще четко не определены статистические методы, которые будут применяться для решения того или иного вопроса. Многопрофильность универсального пакета позволяет провести пробный анализ различных типов данных с использованием широкого диапазона статистических методов. Большинство существующих универсальных пакетов имеют много пересечений по составу встроенных статистических процедур.

Для того чтобы статистический пакет считался универсальным, он должен удовлетворять ряду требований:

o    содержать достаточно широкий набор стандартных статистических методов;

o    быть достаточно простым для быстрого освоения и использования непрофессиональным пользователем;

o    работать с достаточно большими базами данных и отвечать высоким требованиям к вводу, преобразованию и организации хранения данных;

o    осуществлять обмен данными с широко распространенными пакетами и базами данных;

o    иметь обширный набор средств графического представления данных и результатов их анализа;

o    иметь подробное документационное сопровождение и справочную систему, позволяющую начинающему пользователю с легкостью находить ответы на вопросы, связанные с работой программы и возможностями применения средств анализа данных.

2.     Профессиональные пакеты (например, SAS, BMDP).

Профессиональные пакеты отличаются от универсальных тем, что позволяют работать со сверхбольшими объемами данных, применять узкоспециализированные методы анализа, создавать собственную систему обработки данных. Как правило, подобные пакеты сложны в освоении для непрофессионалов. В то же время подготовленным пользователям работа с профессиональным пакетом предоставит больше возможностей для глубокого и детального анализа данных, построения сложных моделей и адаптации системы к собственным потребностям. Профессиональные пакеты более дорогостоящи, чем универсальные. Например, стоимость покупки SAS Analytics Pro на один год для индивидуального пользования составляет 5 360 EUR. Эти факторы делают современные профессиональные статистические пакеты слишком тяжеловесными для массового применения в различных областях деятельности.

3.     Специализированные пакеты (например, BioStat, MESOSAUR, DATASCOPE).

В некоторых областях деятельности анализируемые данные настолько специфичны, что к ним следует применять особые методы статистического анализа, как правило, не представленные в универсальных пакетах.

Специализированные пакеты позволяют проводить анализ с использованием ограниченного числа специализированных статистических методов или применимы к использованию для решения вопросов, относящихся к отдельно взятой предметной области. Как правило, с подобными статистическими пакетами работают специалисты, хорошо знакомые с методами анализа данных в той области, на которую ориентирован пакет. Так, статистический пакет BioStat создан для анализа данных в области биологии и медицины и будет подробнее рассмотрен ниже. Российский статистический пакет MESOSAUR специализируется на анализе одномерных и многомерных временных рядов и построении регрессионных моделей. Еще один российский статистический пакет DATASCOPE специализируется на проведении анализа многомерных данных.

Целесообразно пользоваться соответствующими специализированными пакетами, когда требуется систематически решать задачи из конкретной области или применять ограниченный круг сложных статистических процедур для анализа данных из нескольких областей человеческой деятельности.

Большинство представленных на рынке статистических пакетов обладают гибкой модульной структурой, которая может пополняться и расширяться за счет пользовательских модулей, дополнительно закупаемых или находящихся в свободном доступе в Интернете. Подобная гибкость позволяет адаптировать большинство пакетов к потребностям конкретного пользователя.

По мнению профессионалов, статистический пакет должен удовлетворять следующему минимальному набору требований:

·         модульность;

·         ассистирование при выборе способа обработки данных;

·         использование простого проблемно-ориентированного языка для формулировки задания пользователя;

·         автоматическая организация процесса обработки данных;

·         ведение банка данных пользователя и составление отчета о результатах проделанного анализа;

·         диалоговый режим работы пользователя с пакетом;

·         совместимость с другим программным обеспечением.

Как правило, представленные на рынке статистические пакеты регулярно обновляются. При этом в новой версии сохраняются или совершенствуются возможности предыдущей, а также добавляются новые возможности работы с данными. В большинстве случаев обновленные версии пакета сохраняют исходное название, изменяется лишь порядковый номер, присваиваемый конкретной версии. Самые распространенные пакеты имеют русскоязычную версию.

Разработчики большинства статистических пакетов часто утверждают, что разработанная ими программа является наилучшей для обработки данных. Учитывая многообразие предложения, подчас бывает сложно сделать правильный выбор. По мнению М. Митчелла, имеющего 20-летний опыт работы со статистическими пакетами и 11-летний опыт работы в качестве консультанта по статистике в Калифорнийском университете в Лос-Анджелесе, статистический пакет – всего лишь инструмент в руках мастера. Если специалист не обладает достаточными знаниями и компетенциями, то даже самый совершенный программный продукт не позволит провести качественный анализ данных. В то же время неправильно подобранный пакет, не обладающий необходимыми для анализа техническими характеристиками, способен замедлить работу даже выдающегося ученого, затруднив выявление необходимых закономерностей и получение верных результатов анализа данных.

В этой главе представлен обзор наиболее известных программных продуктов, разработанных для статистической обработки данных на компьютере и относящихся к упомянутым ранее трем основным группам программ, перечислены их основные характеристики и возможности статистического анализа данных.

При рассмотрении каждого пакета отдельно будут отмечены возможности статистического анализа, которые он предоставляет пользователям. Необходимо отметить, что существует минимальный набор статистических методов анализа, который включен во все рассмотренные пакеты:

·         описательная статистика (базовые статистические методы, проверка нормальности распределения данных);

·         дисперсионный анализ;

·         непараметрическая статистика (анализ таблиц сопряженности, непараметрические сравнения, дисперсионный анализ);

·         контроль качества;

·         анализ выживаемости;

·         кластерный анализ;

·         факторный анализ;

·         дискриминантный анализ;

·         регрессионный анализ;

·         обработка данных (сортировка, отбор, трансформация данных).

1.2. Пакет SPSS

Пакет SРSS (Statistical Package for the Social Sciences) – универсальный статистический пакет компании SРSS Inc. Первая версия пакета была выпущена в 1968 г. В 2009 г. компания IBM поглотила SPSS Inc., поэтому новая версия пакета включает в свое название аббревиатуру IBM(IBM SPSS Statistics 19).

По мнению разработчиков пакета, SPSS является одним из лидирующих программных продуктов в области статистического анализа данных для решения вопросов в правительственной, академической и бизнессфере.

SРSS является модульной программой. Ее основу составляет базовый модуль (SPSS Base), позволяющий осуществлять управление даннымии содержащий наиболее распространенные методы статистического анализа данных: проведение описательной статистики; построение линейных и нелинейных моделей; осуществление преобразования данных; проведение факторного, кластерного, дисперсионного анализов; вычисление корреляций; построение графиков; подготовка отчетов и пр.

Для проведения расширенного и углубленного анализа данных могут быть установлены дополнительные модули пакета. Для пакета IBMSPSS Statistics 19 разработаны 16 различных модулей. Например, модуль IBM SPSS Advanced Statistics предназначен для проведения анализа сложных взаимосвязей при помощи процедур, учитывающих свойства исследуемых данных, что позволяет продвинуться за рамки базового анализа данных. В модуль встроены мощные инструменты построения моделей. Модуль IBM SPSS Bootstrapping ("Самогенерация") позволяет аналитикам проверять устойчивость построенных моделей, а модуль IBM SPSS Direct Marketing ("Прямой маркетинг") предоставляет возможность маркетологам самостоятельно выполнять основные виды анализа. Модуль IBM SPSS Data Entry автоматизирует процесс разработки анкеты и ввода результатов опросов.

Достоинства SPSS:

·         развитый аппарат статистического анализа;

·         универсальность (может быть использован для решения широкого круга вопросов из различных предметных областей, требующих проведения статистического анализа данных);

·         широкий набор статистических и графических процедур (более 50 типов диаграмм) анализа данных, а также процедур создания отчетов;

·         высокая скорость вычислений, простой и удобный интерфейс;

·         детальная контекстно-ориентированная справочная система, позволяющая неопытному пользователю с большей легкостью ориентироваться в программе;

·         возможность свободного скачивания демонстрационной версии продукта на официальном сайте компании, наличие версий продукта на различных языках;

·         совместимость с операционными системами Windows, Mac, Linux;

·         наличие значительного количества литературы по работе с пакетом.

Недостатки SPSS:

·         высокие требования к системе компьютера (требуется 1GB оперативной памяти, 800MB памяти на жестком диске и процессор с частотой 1GHz и выше);

·         высокая цена по сравнению со статистическими пакетами аналогичного уровня (стоимость покупки для индивидуального пользования сроком на год составляет около 1000 долл.).

Последняя версия SPSS включает в себя следующие новые возможности:

·         импорт данных из Excel и SAS;

·         экспорт результатов в MS Office, PDF; сохранение результатов в формате HTML;

·         одновременная работа с несколькими наборами данных;

·         построение диаграммы для переменных с множественными ответами;

·         построение диаграммы с двумя осями Y;

·         улучшенный редактор синтаксиса с поддержкой автозавершения и цветового кодирования команд;

·         быстрая подготовка данных к анализу посредством Автоматизированной подготовки данных (IBM SPSS Data Preparation), позволяющей облегчить процесс интеллектуального анализа данных, выявляя и исправляя ошибки в данных и объясняя пропущенные значения. Также посредством этой функции можно подготовить отчет с рекомендациями о возможности использования данных для анализа.

На рис.1.1 представлено окно редактора данных SPSS. В левом нижнем углу окна расположены две вкладки: Данные (Data View) и Переменные (Variable View), позволяющие переключаться с режима просмотра значений переменных в режим просмотра их характеристик.


Рис. 1.1. Окно редактора данных SPSS

Результаты статистического анализа приводятся в диалоговом окне под названием Вывод (Output) (рис.1.2).


Рис. 1.2. Окно вывода SPSS


1.3. Пакет Stata

Пакет Stata – универсальный статистический пакет компании StataCorp7. Первая версия пакета была выпущена в 1985 г. На сегодняшний день разработана 11-я версия пакета (Stata 11).

Пакет Stata позиционируется как инструмент анализа, предназначенный для специалистов, которые занимаются научными исследованиями. По мнению разработчиков, благодаря гибкой модульной структуре пакет применим для анализа данных из различных областей знаний: общественные науки (экономика, политология и пр.), медицина (биостатистика, эпидемиология и пр.) и т. д.

Stata предоставляет пользователям следующие возможности статистического анализа данных:

·         динамические факторные модели, линейные, обобщенные линейные модели и нелинейные модели, многоуровневые смешанные модели, модели выбытия;

·         обобщенные оценки уравнений (GEE);

·         непараметрические методы, методы повторных выборок и статистического эксперимента;

·         проверка гипотез и работа с оцененными моделями;

·         максимизация функций правдоподобия, заданных пользователем;

·         матричные команды.

Предлагаются четыре различных решения при установке Stata.

1.     Stata/IC (Intercooled) представляет собой стандартную версию пакета.

2.     Stata/SE позволяет работать с более обширными базами данных по сравнению со стандартной версией.

3.     Stata/MP представляет собой самую быструю и широкую версию Stata. Обладает продвинутыми многопроцессорными возможностями и работает быстрее, чем все другие версии пакета.

4.     Small Stata используется в образовательных целях.

В таблице 1.1. представлены возможности четырех версий пакета Stata в части объема анализируемых данных.

Таблица 1.1.

Версия статистического пакета Stata

Максимальное число переменных

Максимальное число наблюдений

Stata/MP

32 767

Ограничено лишь объемом оперативной памяти компьютера, на котором установлен пакет

Stata/SE

32 767

Stata/IC

2 047

Small Stata

99

1 200

Достоинства Stata:

·         широкий набор средств статистического анализа данных;

·         широкий спектр возможностей по управлению данными (возможности комбинирования и изменения наборов данных, управления переменными и пр.);

·         возможность программирования всей последовательности команд (начиная от загрузки данных до проведения всех этапов их анализа);

·         использование координатного указателя;

·         интерактивный справочник;

·         создание графики полиграфического качества;

·         возможность написания собственных программных модулей;

·         совместимость с операционными системами Windows, Macintosh и Unix (включая Linux);

·         полное документационное сопровождение ("Базовое справочное руководство" с более чем 1800 страницами информации, содержащее подробные примеры и ссылки на литературу по статистике);

·         экспорт результатов в MS Office и SAS;

·         для работы программы требуется лишь 512 MB оперативной памяти, сама программа занимает 250 MB на жестком диске компьютера;

·         возможность запуска команды, как через соответствующий пункт меню, так и через написание команды в командной строке.

Недостатки Stata:

·         отсутствие возможности полноценного экспорта и импорта данных в базы данных, электронные таблицы и текстовые процессоры;

·         возможность прямого открытия в программе лишь файлов с разрешением .dta.

В ежеквартальном журнале Stata Journal (http://www.stata-journal.com) публикуются статьи, посвященные вновь разрабатываемым функциям и возможностям анализа данных в статистическом пакете Stata. Интернетресурс Statalist (http://www.stata.com/statalist) представляет собой независимый сервер, на котором более 2500 пользователей поддерживают диалог по широкому кругу вопросов, связанных с работой со статистическими пакетами и анализом статистических данных, в частности, по вопросам работы со Stata.

На рис.1.3 представлено диалоговое окно Stata. Оно разделено на 4 основные области.

1.     Область Обзор (Review) отображает историю выполненных в сеансе команд и позволяет пользователю сохранять команды для последующего использования.

2.     Область Переменные (Variables) отображает название, метку, тип и формат переменных находящихся в открытой базе данных.

3.     Область Результат (Result) отображает результаты проведенного анализа и журнал событий.

4.     Область Команды (Command) предназначена для написания команд пользователями.


Рис. 1.3. Диалоговое окно Stata

1.4. Пакет Minitab

Пакет Minitab – универсальный статистический пакет, разработанный Государственным университетом Пенсильвании в 1972 году. Выпускается компанией Minitab Inc8. Последняя версия Minitab 16 позиционируется разработчиками как статистический пакет для аналитической работы на современных предприятиях. Версия представлена на семи различных языках (английском, французском, немецком, японском, корейском, китайском и испанском).

Программа предоставляет пользователям следующие возможности статистического анализа данных:

·         управление процессом статистической обработки данных;

·         оценка мощности и объема выборки;

·         планирование экспериментов;

·         матричные функции;

·         анализ измерительных систем, анализ надежности/выживаемости, анализ временных рядов и прогнозирование, многомерный анализ.

Достоинства Minitab:

·         система консультационной поддержки пользователя (интерактивное дерево принятия решений позволяет отыскать правильный подход к анализу данных для поиска ответа на поставленные вопросы), настройка меню и панелей инструментов для быстрого доступа к используемым методам;

·         интерпретация полученных результатов;

·         осуществление импорта данных из текстовых и табличных процессоров, HTML-файлов, сохранение результатов анализа в форматах TIFF, JPEG, PNG, BMP, GIF, EMF;

·         удобный инструмент для размещения нескольких графиков на одной странице, автоматическое обновление графиков при изменении исходных данных, создание и вращение трехмерных графиков;

·         автоматизация заданий и создание новых функций с помощью языка макропрограммирования;

·         для работы программы требуется лишь 512 MB оперативной памяти, сама программа занимает 160 MB на жестком диске компьютера;

·         работа с файлами, содержащими до 4000 переменных и неограниченное число наблюдений.

Основной недостаток Minitab – несовместимость с операционными системами, отличными от Windows.

На рис.1.4 представлено диалоговое окно Minitab. Оно разделено на 3 основные области.


Рис. 11.4. Диалоговое окно Minitab

1.     Окно сеанса (Session) содержит результаты анализа в виде текста. Кроме того, в нем можно вводить выполняемые команды вручную.

2.     Окно данных (Worksheet) представляет собой рабочий лист, напоминающий электронную таблицу. Можно одновременно использовать несколько рабочих листов, каждый из них откроется в отдельном окне данных.

3.     Окно редактора ReportPad, в который можно добавить результаты, полученные во время сеанса работы с программой Minitab. Выполняет функции простейшего текстового редактора. Позволяет быстро распечатать отчет и сохранить его в формате RTF или HTML.

Графики отображаются в отдельных окнах.

1.5. Пакет STATISTICA

Пакет STATISTICA – универсальный статистический пакет компании StatSoft Inc1. Первая версия пакета (STATISTICA for DOS) была выпущена в 1991 г. На сегодняшний день разработана 9-я версия пакета (STATISTICA 9). Русифицирована только 6-я версия (STATISTICA 6).

Стандартную комплектацию пакета STATISTICA составляют три модуля, которые могут приобретаться как единым пакетом, так и отдельно.

1.     Базовый пакет STATISTICA Base предоставляет обширные возможности выбора основных типов статистического анализа. Для эффективной работы базового пакета требуется как минимум 256 MB оперативной памяти. Минимальные требования к скорости процессора – 500 MHz.

2.     Модуль Линейные и Нелинейные Модели (Advanced Linear/NonLinearModels) содержит большой набор инструментов для моделирования и прогнозирования, включая возможности автоматического выбора модели и расширенные интерактивные средства визуализации.

3.     Модуль Многомерные разведочные технологии анализа (Multivariate Exploratory Techniques) служит для применения разведочного анализа различных типов данных в сочетании с интерактивными средствами визуализации.

Помимо общих статистических и графических средств в системе имеются специализированные модули, например, для проведения социологических или биомедицинских исследований, решения технических и промышленных задач, – карты контроля качества, модули анализа процессов и планирования эксперимента.

Разработчики STATISTICA утверждают, что пакет может применяться для решения задач в таких областях, как:

·         НИОКР, контроль качества, процесс мониторинга в химической, фармацевтической промышленности и в производстве потребительских товаров;

·         гарантийный анализ и приложения для удаленного мониторинга в обрабатывающей промышленности;

·         анализ рисков, сегментация потребителей и оценка кредитоспособности заемщиков в банковской сфере, в сфере предоставления финансовых услуг и в страховой деятельности.

Возможны различные варианты установки пакета в зависимости от целей и задач пользователя:

·         однопользовательская версия (Single-User);

·         сетевая версия (Concurrent Network) для работы в локальных вычислительных сетях;

·         Enterprise – версия для применения в вычислительных системах и крупных организациях

·         Web-Based – версия для использования в крупных сетях через веббраузер.

Пакет предоставляет пользователям следующие возможности статистического анализа данных:

·         исследование корреляций между переменными;

·         диаграмма рассеяния, матричная диаграмма рассеяния;

·         быстрые основные статистики и блоковые статистики (интерактивные средства, позволяющие одним щелчком мыши вычислять основные статистики и строить графики в любой момент в течение сеанса работы);

·         интерактивный калькулятор вероятностных распределений (позволяет интерактивно исследовать структуру распределений, например, зависимость вероятности от параметров);

·         анализ многомерных откликов, многомерное шкалирование;

·         анализ при помощи временных рядов и прогнозирование временных зависимостей, в том числе анализ сезонных колебаний.

Достоинства STATISTICA:

·         реализован обмен данными между STATISTICAи Windows-приложениями;

·         результаты анализа в виде графиков, таблиц и текста могут быть сохранены в файле с форматом RTF, который открывается и редактируется в MS Word;

·         возможность расширения системы при помощи создания программ на встроенном в STATISTICA языке программирования;

·         исходные данные из MS Excel можно легко импортировать в STATISTICA;

·         возможность записи макросов для автоматизации выполнения однотипных задач;

·         программа способна обрабатывать большие массивы данных – базы данных с числом переменных до 32 000 и практически неограниченным числом наблюдений.

В пакете представлены несколько сотен типов графиков 2D, 3D и 4D, матрицы и пиктограммы; предоставляется возможность разработки собственного дизайна графика. Средства управления графиками позволяют работать одновременно с несколькими графиками, изменять размеры сложных объектов, добавлять художественную перспективу и ряд специальных эффектов, разбивку страниц и быструю перерисовку. Например, 3D-графики можно вращать, накладывать друг на друга, сжимать или увеличивать.

STATISTICA обладает огромными возможностями для построения графиков непосредственно из таблиц исходных данных и таблиц результатов. Построение графических объектов и анализ данных в пакете тесно интегрированы. После получения результатов статистического анализа их можно с легкостью представить графически посредством команды Быстрые статистические графики. В разных модулях системы имеются свои специальные графики, учитывающие особенности получаемых в них результатов10.

Начинающие пользователи могут начать работу со специальной версии, разработанной для обучения основам статистических методов – Studеnt Еditiоn оf  STATISTICA. Эта версия представляет собой урезанный вариант пакета и позволяет анализировать файлы данных, включающих не более 400 наблюдений.

Внешний вид диалогового окна STATISTICA представлен на рис.1.5.

1.6. Пакет STATGRAPHICS

Пакет STATGRAPHICS (STATistical GRAPHICs System) – универсальный статистический пакет компании Manugistics Inc. Первая версия пакета была выпущена в середине 80-х годов. На сегодняшний день разработана 5-я версия пакета Statgraphics Plus 5.1.


Рис. 1.5. Диалоговое окно STATISTICA

Достоинства STATGRAPHICS:

·         сочетание научных методов обработки разнотипных данных с возможностью создания современной высококачественной интерактивной графики;

·         широкие возможности взаимодействия с другими программными продуктами (электронными таблицами, базами данных);

·         высококачественная двумерная и трехмерная графика,

·         интегрированная графика, предполагающая, что все элементы графических представлений результатов анализа могут быть преобразованы. После завершения процедуры статистического анализа данных можно выбрать графические отображения результатов, релевантные используемой процедуре анализа.

В STATGRAPHICS графика из средства презентации результатов анализа превращается в аналитический инструмент: можно идентифицировать точку на графическом отображении и выяснить ее местонахождение в файле данных или вращать и рассматривать с разных сторон трехмерные изображения, осуществлять разгонку точек на диаграммах рассеяния и т. п.

В STATGRAPHICS существует возможность сохранения результатов работы и создания собственных статистических проектов. После завершения анализа пользователь может сохранить последовательность выбранных методов, параметры статистических процедур, виды графических отображений результатов анализа, табличные формы, комментарии и пр. в отдельном файле. Сохраненную схему анализа можно будет автоматически применять к другому множеству данных.

Внешний вид диалогового окна STATGRAPHICS представлен на рис.1.6


Рис. 1.6. Диалоговое окно STATGRAPHICS







1.7. Пакет STADIA

Пакет STADIA (Statistical Dialogue System) – универсальный статистический пакет, разработанный специалистами Московского государственного университета им. М.В. Ломоносова совместно с НПО "Информатика и компьютеры". Первая версия пакета была выпущена в 1989 году. На сегодняшний день разработана 7-я версия пакета STADIA 7.0.

По мнению разработчиков, пакет ориентирован на массового пользователя, имеющего небольшой опыт как в статистическом анализе, так и в общении с персональным компьютером, но нуждающегося в быстром и удобном средстве оформления и обработки данных.

Пакет предоставляет пользователям широкий набор методов статистического анализа данных: описательная статистика, дисперсионный, корреляционный и спектральный анализсглаживание, прогнозирование, простая, нелинейная регрессия, кластерный и факторный анализ,методы контроля качестваанализ и замена пропущенных значений. Также возможно построение и редактирование 2-х, 3-х и многомерной графики: зависимости, прогнозы, диаграммы рассеяния, карты, гистограммы, столбиковые, башенные и круговые диаграммы, установка размеров, надписей по осям и под рисунком и пр.

Достоинства STADIA:

·         наличие системы контекстной экранной помощи, включающей объемный гипертекстстовый справочник и экспертную систему по выбору метода статистического анализа;

·         обработка больших объемов данных (до 32 000 наблюдений);

·         наличие режима выдачи оглавления архива данных с комментариями;

·         селективный поиск файлов по контексту комментариев, присвоенных архиву с данными;

·         для работы программы требуется лишь 8 MB оперативной памяти, сама программа занимает 4.1 MB на жестком диске компьютера;

·         экспорт данных и результатов.


Рис. 1.7. Диалоговое окно STADIA

Недостатки STADIA:

·         наличие только русскоязычной версии;

·         несовместимость с операционными системами, отличными от Windows.

Внешний вид диалогового окна STADIA представлен на рис.1.7.

1.8. Пакет SAS

Пакет SAS (Statistical Analysis System) – профессиональный статистический пакет, разработанный компанией SAS Institute Inc. Первая версия пакета была выпущена в 1976 году. Последняя версия SAS Statistics позиционируется как статистический пакет для аналитической работы на современных предприятиях.

Разработчики утверждают, что пакет эффективно работает с данными различных типов: маркетинговые базы данных, результаты клинических испытаний, медико-санитарных обследований, исследований предпочтений потребителей, исследований рынка ценных бумаг и пр. Встроенные инструменты статистического анализа могут быть применены для решения широкого круга вопросов, относящихся к различным областям деятельности, например:

·         промышленное производство;

·         телекоммуникации (проведение исследования рынка для выявления предпочтений потребителей и моделей выбора новых услуг);

·         правительство (применение статистических выборочных методов для разработки опросов общественного мнения);

·         исследование окружающей среды (построение моделей загрязнения воздуха с использованием пространственной статистики);

·         биотехнологии;

·         розничная торговля (моделирование поведения потребителей для выявления потенциальных целевых рынков для новых проектов в области электронной коммерции).

Пакет предоставляет пользователям следующие возможности статистического анализа данных:

·         смешанные модели;

·         анализ категорийных данных;

·         байесовский анализ;

·         многомерный анализ;

·         анализ выживаемости;

·         психометрический анализ;

·         анализ пропущенных значений.

Пакет позволяет проводить следующую работу с данными:

·         ввод, восстановление, модификация и управление данными;

·         написание отчетов и подготовка графиков;

·         статистический анализ;

·         бизнес планирование, прогнозирование и поддержка принятия решений;

·         исследование операций и управление проектами;

·         совершенствование качества;

·         разработка приложений.

Достоинства SAS:

·         быстрая обработка очень больших объемов данных;

·         возможность преобразования математических формул в программный код;

·         создание пользовательских модулей;

·         получение консультативной помощи в выборе методов анализа и в интерпретации его результатов, а также рекомендаций по дальнейшей работе с исходными данными;

·         совместимость с операционными системами Linux и Windows.

Недостатки SAS:

·         сложен в освоении для неспециалистов;

·         высокая стоимость.


1.9. Пакет BioStat

Пакет BioStat – специализированный статистический пакет компании AnalystSoft Inc. Первая версия пакета была выпущена в середине 80х годов. Последняя версия пакета – BioStat 2009.

Пакет создан для специалистов, работающих в области медицины, биологии и химии. Основан на базе известного пакета StatPlus и включает в себя почти весь его функционал, в том числе регрессионный анализанализ выживаемости, дисперсионный анализПрограмма использует электронную таблицу, совместимую с Microsoft Excel как по формату данных, так и по интерфейсу, что делает процесс изучения программы легким и быстрым.

Достоинства BioStat:

·         экспорт/импорт данных в MS Excel;

·         требуемая память на жестком диске компьютера 32 MB;

·         проверка правописания;

·         совместимость с операционными системами Windows и Mac.

Внешний вид диалогового окна BioStat представлен на рис.1.8.


Рис. 1.8. Диалоговое окно BioStat

Информация о файле
Название файла Универсальные пакеты, или пакеты общего назначения (например, SPSS, STATA, STATISTICA, S-PLUS, Stadia, STATGRAPHICS, SYSTAT, Minitab). от пользователя Гость
Дата добавления 10.5.2020, 19:20
Дата обновления 10.5.2020, 19:20
Тип файла Тип файла (zip - application/zip)
Скриншот Не доступно
Статистика
Размер файла 432.17 килобайт (Примерное время скачивания)
Просмотров 1658
Скачиваний 64
Оценить файл