Отправляет email-рассылки с помощью сервиса Sendsay

[TC] Доступные программы статобработки данных.

Здравствовать всем читающим и пишущим!
Обращаюсь к людям науки, или студентам-аспирантам, к тем, кому
приходилось ушибаться о статистическую обработку данных.
Имеется такая задача:
нужно построить вариационные ряды (число наблюдений - от 8 до 100),
определить тип распределения, а при необходимости привести его к
нормальному распределению.
Задачу (вероятно) решают различные пакеты статистических программ.
Если из них те, которые доступны нам по интерфейсу и интеллекту (ну,
типа старшекурсник-гуманитарий не увязнет в нем насмерть)
Вероятно, эту задачу можно решить и в Excel, но вот в нем я как раз
насмерть и увяз.
Базовых знаний статобработки критично мало, а без этого разобраться во
множестве стат. функций Excel - задачка та еще.
Спасибо отозвавшимся, ну и дочитавшим до конца тоже спасибо.
Станислав.

Ответить   Mon, 17 Sep 2018 15:08:11 +0300 (#3582979)

 

Ответы:

Здравствуйте.

17.09.2018 19:08, Станислав Березовский пишет:

В свое время решал подобные задачи при помощи excel и python.
Еще есть язык для статистических расчетов - "R", но я им не пользовался.
Поскольку взаимодействие с "python" и "R" происходит через командную
строку, работа с ними доступна нам.
Насколько это будет удобно вам - не знаю.

По excel на tiflocomp есть учебник, посмотрите его, может, поможет чем.

Думаете, с языками программирования проще будет?
Впрочем, никто не отменял интернет и различные форумы. Это касается как
excel, так и вышеозначенных языков.

Ответить   Tue, 18 Sep 2018 00:00:27 +0700 (#3583033)

 

Здравствуйте, Станислав Березовский.

Есть вот такая статья - http://tiflocomp.ru/docs/a11y_stat_software.php
Если за прошедшее время что-то и изменилось в отношении упомянутых
программных продуктов, то, боюсь, лишь в худшую сторону.
Вывод про предпочтительность R точно остаётся актуальным. Во всех известных
мне сетевых сообществах незрячих учёных все до сих пор на этом сходятся, так
что вряд ли кто-то где-то нашёл что-то лучше.
Также лично я в разное время, помимо программ, упомянутых в статье, имел
дело с EViews, Gretl и MATLAB.
MATLAB в целом доступен, но статистическая функциональность - это не его
основной фокус, да и маловероятно, что у вас в гуманитарном вузе окажется
лицензия на этот пакет.
EViews у меня был версии вроде 4, тогда как сейчас актуален по-моему 7. Там
было не всё хорошо, но некоторые вещи были доступны, но опять же встаёт
вопрос лицензии, а также уровня доступности актуальной версии.
Gretl бесплатный и даже вроде имеет русский интерфейс, но с ним можно было
работать только JAWS-курсором, под которым базовые диалоги были доступны.
Насколько вам будет достаточно доступной функциональности и удобно её
использовать сказать затрудняюсь, так как плохо уже помню конкретные
ограничения. Я в основном делал регрессионный анализ и тесты временных
рядов, да к тому же с Gretl по-моему в какой-то момент перешёл на работу под
Mac OS X, а не Windows.
В общем с точки зрения уровня доступности абсолютным лидером является R в
режиме консольного использования, но, боюсь, всё это подразумевает довольно
большой порог входа, так что вы можете не успеть освоить пакет до экзамена.
Если речь идёт о конкретной ситуативной задаче, то возможно эффективнее
будет инвестировать время в более подробное изучение самих статистических
методов как таковых, чтобы всё-таки реализовать это в Excel.
Откровенно говоря, статистические пакеты экономят время только если всё
равно уже достаточно чётко себе представляешь, что нужно делать. Они
являются просто пресетами большого количества методов и тестов, но не умеют
самостоятельно подбирать их нужную комбинацию и интерпретировать результат.
В общем статистика всё равно остаётся статистикой, то есть наукой, где можно
подсчитать по-разному. :-)
Успехов. Никита.

Ответить   Mon, 17 Sep 2018 20:08:24 +0300 (#3583034)

 

Доброго дня, Никита, приветствую, Дмитрий, привет всей рассылке!

17.09.2018 20:08, "Nikita" пишет:

Если речь идёт о конкретной ситуативной задаче, то возможно эффективнее

Никита, у меня как раз очень даже ситуативная задача, Excel прямо
просится под нее, но вопрос о других пакетах задал больше от отчаяния.
Проблема, конечно же на моей стороне.

С элементарными вещами (стандотклон, средние, мода, коэфф. вариации) я
разобрался, все там доступно, удобно и красиво.
А с помощью функции "промежуточные итоги" так вообще шикарно все.
Но камненм преткнновения для меня оказалась проверка вариационного ряда
на нормальность распределения.
Перелопатил и Ваш учебник по Excel, рылся в инете, но не смог понять,
как практически выполнить эту проверку в Excel, как применить критерии
согласования, ну, критерий Романовского, к примеру.
Вот вижу, например, рекомендацию применить такую комбинацию функций:

=НОРМСТРАСП(НОРМАЛИЗАЦИЯ(х; среднее; станд_откл)).

Но в упор не доходит до меня физический смысл этой конструкции, что
получу я на выходе.

Данные представляют собой ранжированные ряды биомедицинских измерений.
Мне нужно по правилу трех сигм распределить их на норму, отклонения,
патологию.
Но правило трех сигм справедливо только для нормального распределения
вариант, а как доказать это в excel, а, тем более, как нормализовать их
при необходимости - разобраться не могу.
Если можете - подскажите алгоритм действий в Excel, отсальное додумаю сам.

можно

В том-то и дело, а хочется подсчитать как правильно, а не как надо.
Я уже, увы, очень сильно даже не студент, данные, которые обрабатываю
предназначены для доклада некоему врачебному сообществу, возможно,
затем для публикации в мед.периодике.
Поэтому системной методической поддержки нет, а те мои коллеги, кто со
степенями медицинскими в статистике мягко говоря, не очень.
Многие в своих работах считали как раз так как надо было.
Вобщем, если поможете прорваться через проблему распределения, дальше,
думаю, все наладится.

Спасибо еще раз за советы.
С уважением: Станислав.

Ответить   Mon, 17 Sep 2018 22:48:19 +0300 (#3583057)

 

Приветствую всех.

В документации НОРМСТРАСП обозначена как устаревшая.
Рекомендуется использовать НОРМ.СТ.РАСП.
На выходе получите число, соответствующее плотности или вероятности для
указанного значения X для нормального распределения с указанными
параметрами.
Затем можете сравнить его с вычисленными частотами для экспериментальных
данных.
Степень различия этих величин, выраженное в том или ином виде, и будет
показывать, насколько закон распределения для ваших экспериментальных данных
отличается от нормального закона.
См.
https://studopedia.info/2-121205.html

Возможно, пригодится и обратная функция НОРМ.СТ.ОБР.

Успехов. Анатолий.

Исходное сообщение > Вот вижу, например, рекомендацию применить такую комбинацию функций:

Ответить   "i_chay" Tue, 18 Sep 2018 16:10:35 +0300 (#3583128)

 

Приветствую всех.

Как вариант: библиотеки для стат. вычислений различных языков
программирования. Например, python:
* statistics
https://docs.python.org/3/library/statistics.html

* scipy.stats
https://docs.scipy.org/doc/scipy/reference/stats.html

* NumPy
https://habr.com/post/415373/

Исходное сообщение > Если из них те, которые доступны нам по интерфейсу и интеллекту (ну,

Ответить   "i_chay" Tue, 18 Sep 2018 17:51:29 +0300 (#3583151)