ВСЕ БЕДЫ - ОТ НЕДОСТАТКА ИНФОРМАЦИИ

Объясните: Что такое статистика?

25.03.2021 09:55 • Наука

Большинство научных исследований не смогли бы извлечь смысл из данных без помощи статистики.

Изолированный числовой факт может быть статистикой. Сфера статистики другая. Он использует наборы данных для поиска закономерностей между вещами, чтобы найти причинную связь, например, меньше ли у китов, подвергающихся шуму с лодок (как здесь), меньше детей.


Описывая утверждения с числами, люди часто называют их статистикой. Например, если 70 из 100 студентов получили четверку на тесте по английскому языку, это будет статистикой. Как и вымышленное заявление «90 процентов малышей любят тунца». Но область статистики включает в себя гораздо больше, чем набор фактоидов.

Статистика - это совсем другое дело, чем в других областях STEM. Некоторые считают, что это разновидность математики. Другие утверждают, что, хотя статистика похожа на математику, она слишком отличается от математических предметов, чтобы рассматривать ее как часть этой области.

Исследователи видят данные повсюду. Данные ждут, чтобы их собрали из какашек пингвинов и погодных условий на улице. Они скрываются в движении планет и обсуждают с подростками, почему они курят. Но сами по себе эти данные не помогают исследователям далеко продвинуться. Ученым необходимо продумать структуру своих исследований, чтобы извлечь из этих данных значимую информацию.

Статистика помогает им в этом.

Это помогло палеонтологам выяснить, как определить принадлежность окаменелости динозавру - мужчине или женщине. Статистика помогла исследователям показать, что лекарства безопасны и эффективны, в том числе вакцина COVID-19 .

Исследователей статистики называют статистиками. Они ищут закономерности в данных. Статистики могут использовать данные, полученные от нескольких дельфинов-афалин, для интерпретации других дельфинов того же вида. Или они могут со временем искать связи между выбросами углекислого газа и использованием ископаемого топлива . Они могут использовать эти связи, чтобы оценить, как в будущем уровни CO 2 могут измениться, если использование ископаемого топлива возрастет, снизится или останется примерно таким же. 

«У меня есть навыки, которые необходимы морским биологам - и эти навыки - статистика», - говорит Лесли Нью. Она - статистический эколог в Университете штата Вашингтон в Ванкувере. Нью использует статистику для изучения морских млекопитающих, таких как киты и дельфины.

Она использует статистику для изучения взаимосвязи между нарушениями и популяциями морских млекопитающих. Это могут быть звуки корабля. Это также могут быть проблемы, связанные с природой - например, больше хищников или меньше еды.

Один из основных статистических инструментов нового использования называется моделированием в пространстве состояний. Это «звучит причудливо, и детали могут быть очень и очень привередливыми», - отмечает она. Но за этим стоит одна основная идея. «У нас есть вещи, которые нам интересны, но мы не можем их увидеть. Но мы можем измерить их части », - объясняет она. Это помогает исследователям изучать поведение животных, когда они не видят его.

Нью поделился примером про орлов. Ученые не могут проследить за беркутом во время его миграции с Аляски в Техас. Поэтому данные о том, как часто птица останавливается для отдыха, кормления и еды, кажутся загадкой. Но исследователи могут прикрепить к птице трекеры. Эти устройства расскажут исследователям, с какой скоростью движется орел. Используя моделирование в пространстве состояний, Нью может использовать данные о скорости птиц и то, что исследователи уже знают о привычках орлов, чтобы смоделировать, как часто они могут есть, отдыхать и собирать пищу. 

Дельфины и орлы очень разные. Но, по словам Нью, если посмотреть на них со статистической точки зрения, они во многом похожи. «Статистические данные, которые мы используем под ними, чтобы понять влияние действий человека на эти виды, очень, очень похожи».

Но биология - не единственное место, где блистают статистики. Они могут работать в криминалистике , социальных науках, здравоохранении, спортивной аналитике и многом другом.


Ищете "общую картину"

Статистики могут помочь другим исследователям разобраться в данных, которые они собирают, или поработать самостоятельно. Но статистика также представляет собой набор математических инструментов - инструментов, которые ученые могут использовать для поиска закономерностей в собираемых данных. Исследователи также могут использовать статистику при продумывании каждого этапа своего исследования. Эти инструменты помогают ученым решить, сколько и какого рода данных им нужно будет собрать, чтобы ответить на свои исследовательские вопросы. Статистика также помогает им визуализировать и анализировать свои данные. Ученые могут использовать эту информацию, чтобы представить свои выводы в контексте.

Статистика может даже проверить, насколько сильны связи. Они кажутся случайностью или указывают на то, что одно вызывает другое?

Объяснитель: корреляция, причинно-следственная связь, совпадение и многое другое.

Вы можете носить желтую куртку каждый день в течение недели. На этой неделе также может идти дождь каждый день. Итак, есть связь между тем, что вы носите желтую куртку, и дождливой погодой. Но пошел ли дождь из-за того, что вы носили желтый пиджак? Нет.

Исследователи должны убедиться, что они не делают таких ложных выводов из того, что является простым совпадением. В статистике эту идею можно выразить фразой: «Корреляция не подразумевает причинно-следственной связи». Корреляция означает, что две (или более) вещи находятся вместе или между ними существует некоторая связь. Причинность означает, что одно привело к другому. Статистика может помочь ученым увидеть разницу.


Каковы шансы?

Статистики оценивают связи в своих данных, вычисляя, насколько вероятно, что то, что они наблюдают, могло быть вызвано случайностью или ошибкой. Например, исследователи могут захотеть узнать, влияет ли шум лодки на то, куда уходят киты в океане. Они могут сравнить количество китов в районе с большим количеством лодок с количеством китов в районе с небольшим количеством лодок.

Но здесь есть много вещей, которые могут привести к ошибке. И лодки, и киты передвигаются. Лодки издают много типов шума. Районы океана могут различаться по температуре, хищникам и китовой пище. Каждый из них может добавить ошибку к измерениям, проводимым учеными. Если накопится достаточно ошибок, исследователи могут прийти к неверному выводу.

Гипотеза является идея , которая может быть проверена. Возможно, если группа китов подвергается как минимум 50 часам антропогенного шума каждый год, то их популяция сократится как минимум на 10 процентов в течение пяти лет. Затем ученые могли собрать данные, чтобы проверить это. Вместо этого статистики склонны начинать с того, что они называют нулевой гипотезой. Это идея о том, что «в любых отношениях, которые вы исследуете, ничего не происходит», - объясняет Эллисон Теобольд. Она статистик в Государственном политехническом университете Калифорнии в Сан-Луис-Обиспо.

Например, если Нью хочет проверить влияние шума на китов, она и ее коллеги могут посчитать детенышей, рожденных от самок, подвергшихся воздействию шума. Они будут собирать доказательства, чтобы проверить, верна ли нулевая гипотеза об отсутствии воздействия шума на китов. Если данные опровергают нулевую гипотезу, они могут сделать вывод о влиянии шума на китов.   

Ученые также хотят убедиться, что они изучают достаточно того, на чем они сосредоточены. Иногда известен как «n» (число), размер выборки, на которую смотрят исследователи. В приведенном выше примере это может быть количество отдельных китов или стай китов. 

Если размер выборки слишком мал, исследователи не смогут сделать надежных выводов. Нью, вероятно, не стал бы изучать только двух китов. Эти два кита могли иметь реакцию, не похожую на реакцию любых других китов. Новому потребуется изучить множество китов, чтобы выяснить это.

Но большие размеры выборки - тоже не всегда ответ. Слишком широкий взгляд на группу может сделать результаты неясными. Возможно, в одном из исследований были изучены киты, охватывающие слишком широкий возрастной диапазон. Здесь многие могут быть слишком молоды, чтобы иметь детей.


Мать и детеныш кита плавают у поверхности океана

При сравнении маршрутов миграции китов и некоторых других характеристик (например, температуры воды) размер выборки имеет значение. Глядя на корреляцию между тремя китами, не так полезно, как между тремя большими стаями китов.


Что такое статистическая значимость?

Говоря обыденным языком, когда мы говорим, что что-то важно, мы обычно имеем в виду, что это важно. Но для исследователей быть статистически значимым означает кое-что еще: вывод или вывод, скорее всего, не являются результатом случайной случайности или ошибки.

Исследователи часто обращаются к p-значению, чтобы решить, является ли что-то статистически значимым. Многие считают результаты статистически значимыми, только если p-значение мало. Обычно используется отсечение 0,05 (написано p <0,05). Это означает, что вероятность того, что исследователи придут к выводу, что эффект присутствует, составляет менее пяти процентов (или 1 из 20), когда связь, которую они видят, на самом деле вызвана случайностью или ошибкой.

Но есть проблемы с использованием p-значений для определения важности результатов, добавляет Теобольд. Фактически, она называет статистическую значимость «словом s».

Она объясняет, что людям слишком легко спутать статистическую значимость с важностью. Когда Теобольд читает новостную статью, в которой говорится, что результаты исследования были статистически значимыми, она понимает, что это означает, что исследователи «вероятно, получили очень маленькое значение p».

Но то, что разница была реальной, не обязательно означает, что разница также была важной. Это даже не значит, что разница была большой.

Статистическая значимость может побудить некоторых людей уделять больше внимания исследованиям только потому, что их p-значения малы. Между тем, исследования, которые могли быть важны, можно игнорировать, потому что их p-значения были недостаточно малы. Отсутствие статистической значимости не означает, что данные были собраны неверно или небрежно.

Многие статистики, в том числе Теобольд, призывают к альтернативам p-значениям и статистической значимости. Размер эффекта - это одна из мер, которые они могут использовать. Размер эффекта говорит исследователям, насколько сильно могут быть связаны две вещи. Например, сильный шум океана может быть связан с рождением китов на 75 процентов меньше. Это сильно повлияет на количество детенышей китов. Но если этот шум коррелирует только с уменьшением количества китов на пять процентов, тогда размер эффекта будет намного меньше. 

Статистика может показаться чужим или даже пугающим словом, но она используется для оценки данных, лежащих в основе самых крутых исследований в области STEM. «В статистике найдется место для вас, независимо от того, естественны вы в математике или естественных науках», - говорит Нью.

«Я изучала коррективную математику в начальной школе», - отмечает она. Но в итоге она получила докторскую степень. в статистике. «Так что дело не в том, что я всегда от природы был хорош в математике и статистике, а потом каким-то образом использовал это для изучения животных. Дело в том, что у меня был интерес [к животным], и потому что я был заинтересован, я смог преодолеть то, что было для меня более сложным».


Важные понятия:

аналитика: термин, широко используемый в деловом мире для обозначения интерпретации больших объемов данных. Подобно статистике, он больше ориентирован на реальные приложения.

биолог: ученый, занимающийся изучением живых существ.

биология: изучение живых существ. Ученые, изучающие их, известны как биологи.

дельфин-афалина: распространенный вид дельфинов (Tursiops truncate), который принадлежит к отряду китообразных среди морских млекопитающих. Эти дельфины водятся по всему миру.

углекислый газ: (или CO 2 ) бесцветный газ без запаха, вырабатываемый всеми животными, когда вдыхаемый ими кислород вступает в реакцию с богатой углеродом пищей, которую они съели. Двуокись углерода также выделяется при горении органических веществ (включая ископаемое топливо, такое как нефть или газ). Двуокись углерода действует как парниковый газ, удерживая тепло в атмосфере Земли. Растения превращают углекислый газ в кислород во время фотосинтеза - процесса, который они используют для приготовления пищи.

коллега: Тот, кто работает с другим; коллега или член команды.

контекст: обстановка или обстоятельства, которые помогают объяснить событие, какое-то утверждение или какой-то вывод.

корреляция: взаимосвязь или связь между двумя переменными. Когда есть положительная корреляция, увеличение одной переменной связано с увеличением другой. (Например, ученые могут коррелировать увеличение времени, затрачиваемого на просмотр телевизора, с увеличением показателей ожирения.) Если существует обратная корреляция, увеличение одного значения связано с уменьшением другого. (Ученые могут связать увеличение количества просмотров телевизора с уменьшением времени, затрачиваемого на тренировки каждую неделю.) Корреляция между двумя переменными не обязательно означает, что одна из них вызывает другую.

COVID-19: название, данное болезни, которая вызвала массовую глобальную вспышку. Впервые он появился в декабре 2019 года и вызван новым коронавирусом, известным как SARS-CoV-2. Симптомы могут включать пневмонию, затрудненное дыхание, чувство сильной усталости, чтобы пройти более нескольких шагов, лихорадку, головные боли, низкий уровень кислорода в крови, сгустки крови и мозговой туман.

данные: факты и / или статистические данные, собранные вместе для анализа, но не обязательно организованные таким образом, чтобы они имели смысл. Для цифровой информации (тип, хранящийся в компьютерах), эти данные обычно представляют собой числа, хранящиеся в двоичном коде, представленные в виде цепочек нулей и единиц.

динозавр: термин, обозначающий ужасную ящерицу. Эти древние рептилии жили примерно от 250 миллионов лет назад до примерно 65 миллионов лет назад. Все они произошли от рептилий, откладывающих яйца, известных как архозавры.

дельфины: группа очень умных морских млекопитающих, принадлежащих к семейству зубатых китов. Члены этой группы включают косаток (косаток), лоцманов и афалин.

эколог: ученый, работающий в области биологии, изучающей отношения организмов друг с другом и с их физическим окружением.

error: (В статистике) Недетерминированная (случайная) часть связи между двумя или более переменными.

field: Область исследования, например: Ее областью исследований была биология . Также термин для описания реальной среды, в которой проводятся некоторые исследования, например, в море, в лесу, на вершине горы или на городской улице. Это противоположность искусственной обстановке, такой как исследовательская лаборатория.

корм: Искать что-то, особенно пищу. Это также термин для еды, которую едят пасущиеся животные, такие как крупный рогатый скот и лошади.

криминалистика: использование науки и технологий для расследования и раскрытия преступлений.

ископаемое: любые сохранившиеся останки или следы древней жизни. Существует много различных типов окаменелостей: кости и другие части тела динозавров называются «окаменелостями». Такие вещи, как следы, называются «окаменелостями». Даже образцы фекалий динозавров являются окаменелостями. Процесс образования окаменелостей называется окаменелостью.

ископаемое топливо: любое топливо, такое как уголь, нефть (сырая нефть) или природный газ, которое образовалось на Земле за миллионы лет из разложившихся останков бактерий, растений или животных.

гипотеза: (v. выдвигать гипотезу) Предлагаемое объяснение явления. В науке гипотеза - это идея, которую необходимо тщательно проверить, прежде чем она будет принята или отвергнута.

ссылка: Связь или отношения между двумя людьми или предметами.

морской биолог: ученый, изучающий существ, обитающих в океанской воде, от бактерий и моллюсков до водорослей и китов.

морское млекопитающее: любой из многих видов млекопитающих, которые проводят большую часть своей жизни в океанской среде. К ним относятся киты и дельфины, моржи и морские львы, тюлени и каланы, ламантины и дюгони - даже белые медведи.

миграция: (v. migrate) перемещение из одного региона или среды обитания в другой, особенно регулярно (и в зависимости от времени года) или для того, чтобы справиться с какой-либо движущей силой (например, климатом или войной). Человек, который совершает этот переезд, известен как мигрант.

модель: моделирование реального события (обычно с использованием компьютера), которое было разработано для прогнозирования одного или нескольких вероятных результатов. Или человек, который должен показать, как что-то будет работать или выглядеть на других.

Нулевая гипотеза: в исследованиях и статистике это утверждение, подтверждающее, что между двумя или более проверяемыми объектами может не быть никакой разницы или взаимосвязи. Проведение эксперимента часто является попыткой отвергнуть нулевую гипотезу или доказать, что существует разница между двумя или более условиями.

Значение p: (в исследованиях и статистике). Это вероятность увидеть разницу как большую или большую, чем наблюдаемая, если нет влияния проверяемой переменной. Ученые обычно приходят к выводу, что значение р менее пяти процентов (написано 0,05) является статистически значимым или маловероятным из-за какого-либо фактора, отличного от проверенного.

палеонтолог: ученый, специализирующийся на изучении окаменелостей, останков древних организмов.

популяция: (в биологии) группа особей одного вида, живущая в одной местности.

хищник: (прилагательное: хищник) Существо, которое охотится на других животных для большей части или всей своей пищи.

случайный: что-то, что происходит случайно или без причины, без намерения или цели.

диапазон: Полный объем или распространение чего-либо. Например, ареал растения или животного - это территория, на которой они существуют в природе. (в математике или для измерений) Степень, в которой возможны вариации значений. А также расстояние, на котором что-то может быть достигнуто или воспринято.

Социальные науки: область исследований, которая имеет дело с человеческим обществом, с организациями и учреждениями, к которым люди присоединяются или в которых работают, а также с отношениями между людьми и этими организациями. Экономика и политология - это подгруппы социальных наук, которые изучают, как группы людей организуются и принимают важные решения на благо общества. Люди, работающие во всех этих областях, известны как социологи. 

виды: группа подобных организмов, способных производить потомство, способное выживать и воспроизводить.

статистическая значимость: в исследованиях результат является значимым (со статистической точки зрения), если вероятность того, что наблюдаемая разница между двумя или более условиями не является случайной. Получение статистически значимого результата означает очень высокую вероятность того, что любое измеренное различие не было результатом случайных происшествий.

статистика: практика или наука о сборе и анализе больших количеств числовых данных и интерпретации их значений. Большая часть этой работы связана с уменьшением ошибок, которые могут быть отнесены к случайным отклонениям. Специалист, работающий в этой сфере, называется статистиком.

STEM: аббревиатура (сокращение, состоящее из первых букв термина) для науки, техники, инженерии и математики.

Дети ясельного возраста: Дети от 9 месяцев до 2 лет. Этот термин относится к тому факту, что эти молодые люди только недавно научились ходить и еще не полностью устояли на ногах.

вакцина: (v. Vacinate) биологическая смесь, напоминающая возбудитель болезни. Его дают, чтобы помочь организму создать иммунитет к определенному заболеванию. Инъекции, используемые для введения большинства вакцин, известны как прививки.

погода: условия в атмосфере в определенном месте и в определенное время. Обычно его описывают с точки зрения конкретных характеристик, таких как давление воздуха, влажность, влажность, любые осадки (дождь, снег или лед), температура и скорость ветра. Погода представляет собой реальные условия, которые происходят в любое время и в любом месте. Он отличается от климата, который представляет собой описание условий, которые имеют тенденцию возникать в каком-то общем регионе в течение определенного месяца или сезона.



КОММЕНТАРИИ

Введите код с картинки: