Особенности
Мы описываем генезис городской аналитики, опираясь на современные теории социальных наук.
Мы выявляем противоположные временные рамки аналитики больших данных и городской политики.
Мы определяем стратегии решения возникающих эпистемологических проблем городской аналитики.
Мы очерчиваем условия, при которых городская аналитика способствует долгосрочной городской политике.
Считается, что анализ больших данных определяет новую эру в городских исследованиях, планировании и политике. Интеллектуальный анализ данных в реальном времени и обнаружение закономерностей в высокочастотных данных теперь можно выполнять в большом масштабе. Новые аналитические методы обещают более плавное принятие решений в рамках более основанного на фактах и более разумного урбанизма, в то время как критические голоса подчеркивают опасности и подводные камни инструментального, основанного на данных городского управления для городского управления. Меньше внимания уделялось выявлению практических условий, при которых большие данные могут реально способствовать решению проблем городской политики. В этой статье мы обсуждаем ценность и ограничения больших данных для долгосрочной городской политики и планирования. Сначала мы разрабатываем теоретический взгляд на городскую аналитику как на практику, которая является частью нового интеллектуального урбанизма. Мы идентифицируем особую напряженность противоположных темпов высокочастотных данных и длительное время структурных проблем, с которыми сталкиваются города. Основываясь на эмпирических исследованиях с использованием больших городских данных, мы выделяем эпистемологические и практические проблемы, которые возникают в результате анализа высокочастотных данных для стратегических целей, и формулируем предложения о том, как городская аналитика может определять долгосрочную городскую политику.
Большие данные и, в более общем плане, цифровые технологии считаются первостепенными в управлении и планировании умных городов. Многие ученые, занимающиеся городскими исследованиями, утверждают, что новый тип анализа больших данных обещает преимущества с точки зрения прогнозирования в реальном времени, адаптации, более высокой энергоэффективности, более высокого качества жизни и большей легкости передвижения ( Batty, 2019 ; Batty et al., 2012 ; Kourtit et al., 2017 ; Townsend, 2013). Вездесущие цифровые технологии, встроенные в физическую структуру города, делают эти желаемые результаты возможными. Идея состоит в том, что совокупность сенсорных устройств, связанных через Интернет вещей с вычислительными платформами, обрабатывает непрерывные потоки данных и, таким образом, открывает новые способы принятия решений, которые в некоторых случаях можно автоматизировать с минимальным вмешательством человека ( Harrison et al. , 2010 ; Rathore et al., 2016 ).
Городская аналитика, которую мы определяем как аналитику больших данных, применяемую для целей городского управления и планирования ( Kang et al., 2019 ), занимает центральное место в формировании и управлении умными городами. Считается, что по мере того, как доступность данных в реальном времени и необходимая вычислительная мощность продолжают расти, увеличивается и возможность обнаружения закономерностей повседневной жизни городских систем и разработки приложений, которые реагируют на эти закономерности в реальном времени ( Бэтти и др., 2012 ). Среди различных приложений городского транспорта, энергетики или охраны правопорядка интеллектуальное управление дорожным движением, пожалуй, наиболее широко используется. Новые системы, такие как оптимизатор реального времени Siemens, в настоящее время разрабатываемый для Лондона ( TfL, 2018), используйте аналитику для прогнозирования загруженности дорог и обеспечения эффективного использования дорожного пространства в режиме реального времени. Ожидается, что система также позволит достичь стратегических целей политики, включая повышение безопасности дорожного движения, улучшение качества воздуха и здоровья населения. Предполагается, что аналитика городских высокочастотных данных может способствовать решению давних проблем в городах.
Тем не менее, широко сформулированные взгляды на стратегическое значение больших данных для городов объединяют фундаментально разные временные масштабы городской динамики: краткосрочный масштаб быстрой динамики или реального времени и долгосрочную, гораздо более медленную динамику городской структуры и политики. Эта напряженность, которая частично возникает из-за противоречивой `` временной шкалы '' умных городов ( Kitchin, 2019 ), требует более тщательного изучения практических условий, при которых большие данные и городская аналитика могут вносить продуктивный вклад в стратегическую городскую политику и планирование.
Контрастные временные характеристики высокочастотных данных и реакции в реальном времени, с одной стороны, и длительный период структурной динамики города, с другой стороны, порождают несколько эпистемологических проблем, некоторые из которых могут быть связаны с положительной обратной связью или непредвиденными последствиями. Возьмем наш предыдущий пример: интеллектуальное управление трафиком на основе аналитики может сделать повседневные поездки более гладкими и, в свою очередь, стимулировать дальнейшие поездки - явление, известное как «индуцированный спрос» в транспортном планировании. Помимо выбора поездок, более гладкое путешествие может побудить жителей переехать и воспользоваться преимуществами более низкой стоимости жилья подальше от места работы, что повлияет на дневную географию и географию проживания в городе. Такие изменения, хотя и вызваны важными и, в данном случае, алгоритмическими реакциями,Бэтти, 2018 ).
Такие эпистемологические и стратегические вызовы требуют критического обсуждения того, как быстрые временные масштабы больших данных могут быть согласованы с медленной динамикой социально-пространственной организации городов. В частности, разные временные рамки усугубляют проблему причинно-следственной связи, то есть того, как наблюдения с использованием высокочастотных данных могут помочь в понимании причинно-следственных связей, необходимых в городской политике и планировании. Принимая во внимание мощную критику городской аналитики со стороны социальных наук с их возобновившейся озабоченностью по поводу технократических подходов к управлению городским хозяйством, основанных на данных ( Kitchin, 2014a ; Rabari & Storper, 2015 ; Wyly, 2014 ), мы хотим объединить усилия для критической оценки ценности больших данных ( Kitchin, 2016a ; Singleton & Arribas-Bel, 2019), уделяя особое внимание вопросам темпоральности и причинности в городских системах ( Batty, 2018 ; Kitchin, 2019 ). Наша цель - выявить условия, при которых городская аналитика с использованием высокочастотных данных может реально и продуктивно информировать о долгосрочной городской политике.
Ниже мы сначала суммируем текущие дискуссии и критику интеллектуального урбанизма, основанного на данных, и городской аналитики. Затем мы опираемся на современную теорию социальных наук, чтобы обозначить социальный генезис городской аналитики и концептуализировать ее практики в контексте гипермобильных обществ. Впоследствии мы выделяем основные характеристики городской аналитики и выявляем практические, эпистемологические вопросы, возникающие в результате анализа быстрой городской динамики для долгосрочной городской политики. Наконец, мы разрабатываем шесть предложений для определения условий, при которых городская аналитика может продуктивно влиять на стратегическую, долгосрочную городскую политику. В заключение мы приводим предложения по исследованию и расширению этих предположений.
Термин «городская аналитика» возник в контексте обработки больших данных для ряда приложений в городах, в частности «умных» городов ( Batty, 2019 ). Умные города по-разному характеризуются как формирующаяся будущая версия города, которая частично работает на потоках данных, непрерывно передаваемых между физическими объектами, участниками и учреждениями, которые определяют, населяют и управляют городами ( Batty, 2020 ; Batty et al., 2012 ; Таунсенд, 2013). Умные города представляют собой совокупность множества разумных и связанных искусственных сред, которые обладают компонентами, которые учатся на образцах повседневной деятельности и автоматически адаптируются к изменениям в таком поведении. Это стало возможным благодаря уменьшению размеров компьютеров до такой степени, что они могут быть встроены в повседневные предметы и действия наряду с развитием сенсорных и вычислительных мощностей, которые позволяют повсеместно интегрировать микроэлектронику в физический мир. Чтобы использовать физико-цифровую инфраструктуру, которая собирает и обрабатывает данные и интегрирует их в процесс принятия решений, города и компании частного сектора регулярно объединяются в государственно-частные партнерства для осуществления необходимых крупномасштабных инвестиций ( Hollands, 2008 ; Kitchin, 2014b ).
Инициативы умного города в настоящее время являются предметом обширных научных дебатов, которые варьируются от попыток разработать формальные определения до радикальной критики в области социальных наук. Существующие концепции и представления о городской аналитике тесно связаны с этими дебатами, которые в определенной степени могут быть связаны с различными эпистемологическими точками зрения, преобладающими в социальных науках. Одно направление в литературе рассматривает умный город как отдельную, определяемую и конкретизируемую вещь, которая является или станет физически и институционально проявленной, а значит, познаваемой и измеримой ( Albino et al., 2015 ; Komninos, 2011 ; Komninos et al., 2013). ; Neirotti et al., 2014). Соответствуя позитивистским концептуальным представлениям о социальном мире, эта литература рассматривает умный город как не имеющее ценностей технологическое решение, построенное на объективных данных о городской деятельности и неизбежном прогрессе человечества. Предполагается, что умные города воплощают консенсус в отношении того, как города должны быть организованы, спроектированы и управляться, и, таким образом, они представляют собой желаемое городское видение. Следовательно, исследования и разработки должны быть посвящены определению соответствующих системных архитектур, структур управления и универсальных технических стандартов ( Abella et al., 2017 ; Babar & Arif, 2017 ; Rathore et al., 2016 ; de Santana et al., 2019 ; Zygiaris , 2013). В этом контексте городская аналитика - это набор технических методов, которые применяются к цифровой инфраструктуре и включают разработку алгоритмов. Методы носят научный характер; они обеспечивают оптимальную обработку данных для интеллектуального, эффективного и автоматизированного реагирования, одновременно предоставляя фактическую информацию о городских системах лицам, принимающим решения.
Вторая часть литературы, в которой умные города рассматриваются как глубоко политические проекты, направленные на наблюдение и контроль над горожанами и извлечение прибыли из такой деятельности. Наиболее радикальная критика изображает умные города как гегемонистские проекты в рамках неолиберальной политической экономии, в которых правительства и корпорации объединяются для использования цифровых технологий для консолидации и расширения своей власти во всех сферах общества по всему миру ( Greenfield, 2013 , Greenfield, 2017 ; Hollands , 2015 ; см. Также Zuboff, 2019 ). Более мягкие и критические отчеты идентифицируют сети корпораций, защитников политики и технократов как особо влиятельных игроков, которые убеждают зачастую неимущие городские власти принимать оптовые решения умного города (Barns et al., 2017 ; Гаффни и Робертсон, 2016 ; Söderström et al., 2014 ). Примеры включают корпоративные городские проекты Songdo или Masdar или предположительно готовые инфраструктурные продукты, такие как городские «операционные системы», центры управления или хранилища данных в Рио-де-Жанейро или Нью-Йорке. Даже в более регулируемых государством обществах, таких как Сингапур, крупные ИТ-компании возглавляют движение по автоматизации и мониторингу передвижения людей, связанных, например, с более эффективным использованием различных видов транспорта. Городская аналитика рассматривается как ключевой союзник в «датафикации» и «наблюдении за данными», которые занимают центральное место в таких проектах умного города ( Kitchin, 2016b ). Здесь городская аналитика - это политический инструмент контроля посредством «сортировки программного обеспечения» ( Graham, 2005), профилирование людей и мест в соответствии с их характеристиками и потенциалом с точки зрения риска или склонности к соответствию. Он намеренно представлен как ориентированный на данные, свободный от ценностей и прагматичный, но на самом деле разработанный для воспроизведения, если не усиления преобладающих властных отношений (см. Kitchin, 2014b ; Söderström et al., 2014 ; Vanolo, 2014 ). В лучшем случае городская аналитика используется наивно, ей не хватает прозрачности и она страдает от непризнанной социальной предвзятости - взгляда, который перекликается с более общей критикой позитивизма и его политики.
С третьей точки зрения, умные города - это в основном воображаемые города будущего, которые определяют современные подходы к созданию городов. Такие воображаемые образы производятся, артикулируются и мобилизуются агентами, находящимися в нескольких социальных сетях, из которых международные сети приобрели особое значение ( Kitchin et al., 2017 ; Luque-Ayala & Marvin, 2015 ). Участники этих сетей корпораций, эксперты, советники, аналитические центры и ученые действуют в контексте, в котором преобладают определенные верования, идеологии и практики. Посредством разнообразных практик, включая посещения, личные встречи, аналитические документы и упражнения по сравнительному анализу умных городов ( Bok & Coe, 2017 ; Campbell, 2012 ; Prince, 2015), умный урбанизм проявляется как новый способ планирования и управления городами, предполагаемый императив технологического прогресса для противостояния вызовам 21 века. Тем не менее, нет гарантии, что видения будут реализованы, возможно, гегемонистским образом, каким хотели бы их видеть некоторые влиятельные игроки ( Kong & Woods, 2018 ; Wiig, 2015 ). Например, городские власти в Европе, будучи действующими лицами, часто стремятся уравновесить требования, возникающие из концепции умного города, с содержанием своих политических мандатов ( Bunders & Varró, 2019 ), хотя они регулярно принимают решения умного города как часть своих более широкие предпринимательские ориентации ( Hollands, 2008 ; Vanolo, 2014). Таким образом, проекты могут быть оспорены, пересмотрены, изменены, адаптированы или даже прекращены, что демонстрирует хорошо задокументированную динамику политической мобильности ( Peck & Theodore, 2010 ).
Со всех этих точек зрения очевидно, что существуют влиятельные группы и сети, которые продвигают интеллектуальный урбанизм, в котором обработка высокочастотных данных задействована по-разному. Поэтому мы предлагаем, чтобы городская аналитика включала набор практик, которые сами по себе являются частью набора практик, составляющих умный урбанизм, а отчасти - формы градостроительства на основе данных ( Boeing et al., 2020 ). Растущее внимание к науке о данных со стороны городских властей свидетельствует о росте убеждений и убеждений об успехе и желательности количественного прогнозирования, которые согласуются с позитивистскими и технократическими взглядами на общество ( Delmelle, 2019 ; Kitchin et al., 2015 ; Wyly, 2014).). Практики городского анализа склонны разделять убеждения, идеологии, бессознательные субъективные ориентации и предрасположенности - профессиональные или иные - которые преобладают в сетях, продвигающих умный урбанизм; но они также все чаще располагаются в определенных частях академических кругов, примером чего является рост «вычислительной социальной науки» ( gesis.org/en/institute/departments/computational-social-science ) и отмечены все более отчетливыми научными практиками, ориентированными на данные добыча полезных ископаемых, обнаружение закономерностей, машинное обучение и прогнозирование.
Таким образом, мы можем сказать, что городская аналитика представляет собой не набор четко определенных технических методов, а набор практик, которые реализуются в определенных социальных, политических и академических контекстах. Это «практическое понятие» городской аналитики может быть отнесено к более широкому кругу теорий «социальных практик», задуманных социологами ( Bourdieu, 1977 ; Giddens, 1984 ) и переработанных в контексте мобильности 21-го века ( Sheller, 2017 ; Urry , 2007 ). Прежде чем мы рассмотрим городскую аналитику как практику и ее возможную роль в городской политике более подробно, мы обозначим социальные тенденции, которые приводят к широкому внедрению сенсорных и обрабатывающих технологий в городскую среду.
Среди давних дебатов, касающихся роста цифровых технологий и их последствий для городов ( Batty, 1997 ; Castells, 1996 ; Graham and Marvin, 1996 , Graham and Marvin, 2001 ; Larsen et al., 2006 ; Lash, 2002 ; Thrift & French, 2002 ; Urry, 2000 , Urry, 2007 ), парадигма мобильности предлагает недавнюю, основанную на практике перспективу, с помощью которой можно концептуализировать внедрение цифровых технологий в городах. Основные принципы заключаются в том, что мобильность определяет социальные отношения в 21 веке ( Sheller & Urry, 2006 ; Urry, 2007 , Urry, 2012).) Как диалектический связаны коэволюции T ransportation, я нформация и C ommunication T ехнология (который мы называем TICT далее) и социально-пространственные отношения , которые привели в социальных взаимодействиях , которые все более и более отдаленные. В настоящее время социальные отношения формируются и поддерживаются на больших расстояниях посредством путешествий, а также новых и обширных электронных коммуникаций, включая виртуальный личный контакт. Несмотря на существование теле- и электронной связи, прочные социальные связи, отмеченные доверием, по-прежнему требуют прямого личного контакта и совместного присутствия (см. Giddens, 1984, 86 ; Urry, 2007, 166).). Несмотря на возможность того, что этот социологический закон может измениться в будущем, он подразумевает, что, поскольку социальные агенты образуют гораздо больше слабых звеньев за счет увеличения количества путешествий и виртуального присутствия, кроме того, необходимы физические путешествия для развития и поддержания этих социальных связей.
В результате социальные отношения и, в некоторой степени, функционирование общества требуют путешествий и цифровых коммуникаций на все увеличивающиеся расстояния, которые зависят от TICT, объединенного во все более сложной инфраструктуре, или от того, что Urry (2007)называет «мобильными системами». К таким системам относятся железнодорожные сети, автомобиль, сети мобильной связи, аэропорты, на самом деле можно было бы добавить целые мультимодальные системы, если не даже сам умный город в целом, что во многих смыслах все касается обеспечения мобильности и организации потоков людей. , товары и информация. При этом любая система мобильности становится незаменимой в поддержании коммуникаций и потоков, которые имеют решающее значение для функционирования общества, и в самоусиливающейся петле порождают дальнейшие далеко идущие социальные взаимодействия, которые требуют все большего количества путешествий и коммуникаций.
Поддерживая и расширяя пространственно-временную дистанцию социальных отношений, системы мобильности становятся все более цифровыми в том смысле, что цифровые технологии все более широко внедряются в физическую среду. Поскольку социальные взаимодействия на больших расстояниях являются результатом внедренного в цифровом виде и контролируемого TICT, что, в свою очередь, приводит к почти необратимому процессу дальнейшей цифровизации и растущей зависимости от экспертных форм знаний (см. Также Kitchin & Dodge, 2011, 10), мы можем утверждать, что при обработке данных, генерируемых физико-цифровыми системами мобильности, городская аналитика - это практика, которая является частью растущей мобильности, характеризующей общество 21 века. Повышенная вычислительная мощность, обусловленная теми же социальными и экономическими силами, подпитывает новую практику городской аналитики и порождает новые аналитические процедуры обработки больших данных в реальном времени, обнаружение закономерностей и статистическое обучение, используемые для определения и выполнения оптимальных, автоматизированных ответов.
Таким образом, мобильность предлагает социальное объяснение более восторженным взглядам и защите умных городов, таких как предлагаемое интегрированное городское управление и планирование на основе данных ( Babar & Arif, 2017 ; Rathore et al., 2016 ; de Santana et al., 2019 ) и недавно принятые стандарты умного города, сертифицированные ISO, которые определяют все, от взаимодействия данных до механизмов управления городским хозяйством ( BS ISO 37106: 2018, 2018 ). Мы также можем наблюдать тенденцию, в которой движение все больше привязано к цифровым идентификаторам, связывающим различные цифровые следы людей, будь то биометрия, местоположение GPS, покупки по кредитным картам или активность в социальных сетях. Недавние примеры включают Программу известных путешественников ( WEF, 2018) или Social Credit Systems ( Merics, 2017 ), которые можно использовать для «сортировки программного обеспечения» и регулирования поведения отдельных лиц, организаций или учреждений ( Graham, 2005 ; Wood & Graham, 2006 ).
В том же ключе появление вычислительных социальных наук можно рассматривать как результат современной мобильности. Эта дисциплина, характеризующаяся частым межотраслевым сотрудничеством между научными кругами и бизнесом, поддерживается удаленной обработкой и облачными вычислениями, которые расширяют технологии, связанные с мобильностью, обеспечивая сотрудничество и совместный анализ на больших расстояниях. Такие новаторские практики возникают на более широком фоне академического сообщества, зависящего от мобильности, которое, как и любая другая профессия, поддерживает доступ к сетям, знаниям и другим ресурсам посредством электронной коммуникации, онлайн-публикаций и, до недавнего времени, увеличения количества международных поездок ( Storme et al. ., 2017 ).
Наконец, как и в случае с мобильностью, мы можем ожидать, что городская аналитика разовьет самовоспроизводящиеся качества, которые выходят за рамки удовлетворения конкретных потребностей. Обращение может быть источником прибыли, возможно, лучшим примером является автомобильная промышленность. Потенциальная прибыль, связанная с предоставлением технологии обработки больших данных, укрепляет позиции городской аналитики, ее поддержку и связанные с ней методы. Несколько примеров включают в себя активно выражаемый энтузиазм по поводу детализации и объема, предлагаемых новыми источниками больших данных, признание эффективных, оптимизированных городских операций, интерес к быстрой динамике города и прогнозированию в реальном времени, а также продвижение данных. -принятие решений (см., например, Provost & Fawcett, 2013). Можно ожидать, что независимо от ее потенциального вклада в социальные цели, городская аналитика активно продвигается теми же `` эпистемическими сообществами '' и `` правозащитными коалициями '' ( Kitchin et al., 2017 ), которые мобилизуют интеллектуальный урбанизм в широком диапазоне контекстов.
Таким образом, очевидно, что системы мобильности и их физические и цифровые компоненты оказывают глубокое влияние на практику и отношения между участниками любого типа. Китчин (2019) описывает, как цифровые и мобильные технологии изменяют темп и ритмы повседневной жизни как горожан, так и городских операций. 'Реальность' ( Китчин, 2019, 786), поддерживаемые большими данными, лежащими в их основе цифровыми и сетевыми технологиями, а также практикой городской аналитики, которую они делают возможной, создают эту темпоральность, которая характеризует умный урбанизм. Китчин усматривает в городской деятельности тенденцию отдавать предпочтение реакции в реальном времени над планированием, размышлениями и долгосрочными стратегиями. Эта тенденция может быть дополнительно усилена осознанием объема финансовых обязательств, необходимых для поддержания «реального времени» во всех областях и секторах города.
Для отношений между городской аналитикой и политикой вопрос о темпоральности ставит две эпистемологические и, следовательно, практические проблемы. Во-первых, необходимо изучить условия, при которых высокочастотные данные могут помочь нам понять города, помимо мгновенных, быстрых, возможно, переходных явлений. Другими словами, какому типу «понимания» города способствует анализ быстрой динамики, и в какой степени понимание применимо к общей и глубоко укоренившейся причинно-следственной динамике, с которой обычно связана городская политика?
Вторая проблема связана с тем, что городская аналитика использует те же технологии, которые алгоритмически изменяют, синхронизируют или регулируют практики городских акторов для изучения и понимания городов ( Batty, 2019 ). Транзитные смарт-карты не только улавливают, но и изменяют спрос на поездки за счет автоматизированных вмешательств, для которых предназначены системы (например, динамическое ценообразование в пик / непиковый период), что влияет на нашу способность понимать мобильность людей через их данные. Как следствие, любые наблюдаемые нами закономерности в такой же степени являются продуктом человеческих субъектов, как и работы самих технологий; их происхождение уходит корнями в человеческую и институциональную динамику мобильности современного общества. Этот фундаментальный вопрос причинно-следственной связи наряду с предвзятостью, присущей большим данным ( Boyd & Crawford, 2012 г.; Taylor, 2015 ) являются критически важными вопросами для долгосрочной городской политики и планирования, которые с их целью организовать и улучшить города, по сути, стремятся вмешаться в сложные причинно-следственные связи в городских системах.
Чтобы определить характерные особенности городской аналитики как практики, мы рассмотрим ряд исследовательских приложений городской аналитики, которые основаны на более широком спектре анализа мобильности в реальном времени с использованием данных смарт-карт для путешествий. Смарт-карты для путешествий автоматически собирают плату за проезд в системах общественного транспорта и, таким образом, создают большие объемы записей о поездках, относящихся к подавляющему большинству пассажиров. Преимущество по сравнению с традиционными источниками данных, такими как опросы пассажиров, - это охват, большой размер выборки и точность. Хотя схемы смарт-карт возникли из-за необходимости упростить и модернизировать сбор платы за проезд, чтобы сделать ежедневные поездки более гладкими, источник данных также широко рассматривается как стратегический актив для транспортного планирования ( Anda et al., 2017 ; Pelletier et al., 2011). В то время как подавляющее большинство исследований обрабатывают данные смарт-карт для целей моделирования транспорта, некоторые исследования стремятся по-новому охарактеризовать спрос на поездки, опираясь на детали, предлагаемые такими данными. Лишь очень небольшое число людей расширяет анализ за пределы нескольких месяцев до более длительных временных рамок.
Многочисленные исследования демонстрируют, как охват и точность записей смарт-карт позволяют по-новому характеризовать спрос на поездки (например, Goulet Langlois et al., 2016 ; Liu et al., 2019 ; Reades et al., 2016 ; Zhong et al., 2014 ; Zhong и др., 2016 ). Аналитические подходы к обработке записей смарт-карт разнообразны, но часто содержат важный этап исследовательского интеллектуального анализа данных для извлечения закономерностей. Многие исследования сосредоточены на разработке новых способов характеристики городской мобильности и ограничивают их анализ одним моментальным снимком.
Чтобы продемонстрировать, в какой степени объем этого типа высокочастотного набора данных может использоваться для разработки политики, мы обратимся к нашему собственному анализу данных карт Oyster в Лондоне. Данные карты Oyster теперь используются для оплаты 85% поездок в лондонском метро (Tube). В обычный будний день на метро совершается до 5 миллионов пассажирских поездок, имеется 11 линий метро и 270 станций. Мы используем маршруты, извлеченные из карты, которая позволяет пассажиру подключиться к станции в начале поездки и гарантирует, что они отключатся на другом конце, в противном случае налагается штраф. У данных нет атрибутов, кроме времени и места подключения и выхода, статуса карты в отношении оплаты, а также того, является ли пассажир пожилым, ребенком или инвалидом.
Этот набор данных является исчерпывающим и подробным в отношении пункта отправления (O) и пункта назначения (D) поездки (станции), а не маршрута, по которому путешествует пассажир. Мы выводим маршруты, определяя кратчайший маршрут от одной станции до любой другой, используя вариант Дейкстры (1959).стандартный алгоритм, а затем извлекает пункты отправления и назначения для каждой поездки и маркирует их кратчайшим путем. Распределение этих путей само по себе предоставляет подробную и новую информацию относительно резервирования всех возможных маршрутов в системе транзита. Но такие траектории также помогают уловить и охарактеризовать неоднородность привычек путешествий на уровне минут. Различные исследования показывают, что повседневная активность путешественников может быть определена на основе пространственно-временных характеристик повторных поездок за определенный период времени ( Reades et al., 2016 ; Zhong et al., 2014 , Zhong et al., 2016 ).
Изучая любой профиль поездок для любой станции за самый короткий период времени, который мы считаем аналитически приемлемым, например, 1, 2, 5, 10 минут, мы обнаруживаем, что временная частота отдельных поездок различается в каждый день недели. Это связано с тем, что пассажиры не могут приходить на станцию каждый день в одно и то же время, но также потому, что профиль каждого путешественника в зависимости от рабочей недели сильно неоднороден. Из данных мы можем извлечь, сколько людей имеют похожие профили в отношении любой конкретной станции, а также время входа или выхода. Мы обнаружили, что только около трети пассажиров используют одни и те же станции метро для выхода и входа два раза в день, что предполагает определенную регулярность, связанную с поездкой на работу или регулярным ежедневным посещением двух разных мест. Хотя утренний и вечерний пик и поздний вечерний пик в центре Лондона - это четко обозначенный распорядок дня, их состав изо дня в день весьма разнообразен, что означает, что более половины всех пассажиров не имеют регулярного распорядка. Такие результаты остаются замаскированными в совокупных данных и данных с небольшим объемом выборки; их можно идентифицировать только путем анализа высокочастотных данных в масштабе отдельных записей.
Чтобы исследовать закономерности в дезагрегированных моделях, мы агрегируем по станциям и профилируем их с учетом сходства между любой парой траекторий. Мы выбираем любые два периода времени и вычисляем сходство между объемами поездок на каждой станции - количество входов и выходов - относительно того, как они сравниваются на всех 270 станциях. Короче говоря, это сравнение между любыми двумя временами (всего из 72) относительно объемов поездок в каждый из этих периодов времени по всем 270 станциям. Время измеряется с 20-минутными интервалами по 24-часовым данным, что дает 72 временных периода. Мы выбрали этот интервал, поскольку он достаточно детализирован, чтобы достаточно подробно осветить, насколько один период времени отличается от любого другого в течение 24 часов анализа. Конечно, большие данные обеспечивают гибкую детализацию, можно выбрать более точные интервалы времени. 20-минутные интервалы времени позволяют нам визуально изучить закономерности и принять решение о дальнейшем анализе.
Профили по отношению к любой паре периодов времени показаны на рис. 1, где первая карта (A) показывает плотность корреляции между любой парой периодов времени по отношению к объему поездок по всем станциям; то есть корреляция представляет собой подходящую нормированную функцию, основанную на сравнении вариаций потоков на всех станциях за любые два временных интервала. Мы также вычислили схожесть между любыми двумя траекториями по рангам, а не по объему поездок. Здесь мы переупорядочиваем профили в соответствии с рангом объема, а затем проводим сравнение как нормализованную разницу между каждой парой ранжированных профилей по станциям в каждый период времени. Мы показываем узор на рис. 1 (B), а на рис. 1(C) мы вычисляем тот же набор сходств, но на этот раз в терминах абсолютных объемов. Этот рисунок ближе к рисунку 1 (A), поскольку используемая мера просто сглаживает рисунки, в то время как на рисунке 1 (B) структура профилей перемещения заострена.
Как видно из рис.1.(A) утренний пик - первый набор строк с высокой корреляцией между 7 и примерно 9–20 утра означает, что это довольно похожие распределения поездок. Это означает, что объемы по всем станциям довольно сильно коррелируют с каждой в 20-минутных интервалах, которые определяют этот пик. Затем примерно с 10:00 до 15:30 есть аналогичный блок, который можно интерпретировать как другую последовательность профилей для часов в середине дня. Тогда будет намного меньше изменений в общем количестве поездок и намного меньше общее количество, но матрица по-прежнему выявляет сходство во временных моделях, а не в общих объемах. Затем примерно с 16:00 до 19:00 наступает вечерний пик, который размывается как в середине дня, так и в середине и конце вечерних объемов.На рис. 1 (B) видна та же картина, но она намного яснее. Середина дня и пик раннего вечера сливаются друг с другом, в то время как блок вечерних профилей путешествий весьма различен. Рис. 1 (C) представляет собой нечто вроде промежуточного пункта, который просто отличается от рис. 1 (A) из-за того, что к одному и тому же профилю данных применяются разные меры.
Чтобы предоставить подробную интерпретацию профилей поездок, мы отмечаем, что необходимо делать обоснованные предположения о характере городских поездок и рассматриваемом месте, включая структуру распределения поездок в западных городах в течение рабочей недели и связанные с ней пики спроса в разное время, указывающее на разные виды городской деятельности. В случае данных, где мы должны извлечь структуру, тогда даже способы визуализации данных, включая размер временных интервалов, должны быть известны до начала анализа. Следовательно, визуализация, распознавание и интерпретация закономерностей - это циклический процесс, основанный на внешних данных, информации и теории о том, как функционирует городская система. Эта уверенность возрастает при анализе высокочастотных данных для долгосрочных приложений.
Исследования, которые обрабатывают данные смарт-карт в течение периода времени, превышающего несколько месяцев, редки. Чу (2015) анализирует записи смарт-карт за два года и извлекает тенденции поездок на индивидуальном и совокупном уровнях. Briand et al. (2017) связывают все транзакции, зарегистрированные в феврале за пять лет, чтобы охарактеризовать изменение использования автобусов в годовом исчислении. Их подход к интеллектуальному анализу данных, основанный на сегментации, выявляет сложную совокупность изменяющихся временных схем движения, замаскированных в рамках общей тенденции стабильного обслуживания автобусов. Хуанг и др. (2018)обрабатывать небольшую выборку транзакций со смарт-картами в течение семи лет, чтобы исследовать взаимозависимости между мобильностью в жилых помещениях, сменой работы и ежедневными поездками. Основное внимание в этом небольшом количестве новаторских исследований уделяется характеристике тенденций на разных уровнях, а не систематическим попыткам их объяснения.
Вопрос причинно-следственной связи занимает центральное место в нашем собственном исследовании, примером которого являются Кандт и Лик (2019) , которые обрабатывают данные смарт-карт за шесть лет в столичном регионе Бирмингем, Великобритания. Транспортная администрация региона, Transport for West Midlands, зафиксировала неуклонное снижение посещаемости автобусов, особенно среди пожилых жителей, которые имеют право путешествовать бесплатно. Снижение патронажа общественного транспорта прямо противоречит долгосрочной цели города по обеспечению экологической устойчивости, социальной интеграции и здоровья по частям за счет обеспечения равного доступа к общественному транспорту.
Смарт-карты были введены в 2010 году для записи всех льготных поездок с целью компенсации операторам. Анализ последовательностей - это метод неконтролируемого интеллектуального анализа данных, который может обнаруживать профили аналогичных временных тенденций в продольных данных ( Gauthier et al., 2014 ). На рис.1 показано извлечение шести временных профилей, обнаруженных в 300 миллионах транзакций по смарт-картам, совершенных пассажирами в возрасте 66 лет и старше в период с 2011 по 2016 год (источник: Kandt & Leak, 2019 ). Две группы указывают на явное сокращение количества интернатов за шесть лет.
Чтобы интерпретировать закономерности с точки зрения причинно-следственной связи, мы опирались на низкочастотные контекстные данные, статистику районов переписи населения Великобритании и официальные среднегодовые оценки населения. Контекстуализация неожиданно показала, что особенно резкое снижение покровительства произошло в более бедных районах, где зависимость от бесплатного проезда на автобусе обычно выше. На основе контекстуализации и некоторых соображений, в основном взятых из литературы о спросе на поездки, мы смогли разработать актуальные для политики причинно-следственные гипотезы ( Таблица 1). Этот процесс привел к заключительному этапу - триангуляции, измерению правдоподобия гипотез с использованием другого набора небольших и низкочастотных данных в качестве доказательства, включая отчеты о тенденциях в области покупок в Интернете и бедности пенсионеров, а также свидетельские свидетельства, такие как время, когда и способ, которым услуги электронного звонка разрешены в регионе.
Гипотеза | Триангулированные доказательства |
---|---|
1. Интернет-магазины заменяют поездки вне дома. | Умеренный |
2. Пожилые люди, особенно женщины, имеют больший доступ к машине. | Умеренный |
3. Рост бедности среди пенсионеров ведет к сокращению активности вне дома. | Сильнее |
4. Повышается уровень преждевременной смертности. | Слабый |
5. Раннее начало инвалидности или плохого состояния здоровья, ограничивающей мобильность, среди уязвимых групп. | Слабый |
6. Сокращение автобусных маршрутов снизило доступность. | Слабый |
7. Расширение трамвая снижает спрос со стороны автобусов. | Сильнее |
8. Появление новых режимов совместного использования пассажиров и электронного вызова снижает спрос на автобусы. | Сильнее |
(Источник: Kandt and Leak (2019) .)
Исследование показывает, что вывод любых потенциальных причинно-следственных связей из высокочастотных данных для долгосрочной политики требует ряда элементов: теоретически обоснованной интерпретации, контекстуализации и триангуляции. Это контрастирует с чисто вычислительным подходом, который будет заключаться в использовании шаблонов как таковых и разработке приложений, предлагающих пассажирам, соответствующим определенному профилю, изменить свой выбор, чтобы помочь переломить тенденцию. Такой автоматизированный подход, который часто рассматривается как часть умного урбанизма, может быть эффективным для достижения краткосрочных целей, таких как увеличение доходов за счет более целевого маркетинга ( Singleton & Arribas-Bel, 2019, 10). Но в контексте городского планирования и политики это будет означать лечение симптомов, а не структурных или социальных причин проблем, связанных с инклюзивной мобильностью. Такие социальные причины могут находить выражение в воспринимаемых данных, но они не могут быть прочитаны из самих возникающих паттернов.
Как же тогда мы интерпретируем закономерности в больших данных? Хотя нам неизвестны какие-либо эмпирические исследования когнитивных процессов, участвующих в интерпретации больших данных, теория социальной практики и подтверждающие ее данные предполагают, что интерпретации по своей сути будут зависеть от убеждений, повседневного опыта и субъективных ориентаций интерпретатора и те убеждения и предрасположенности, которые преобладают в сетях, в которых находится переводчик (см. также Boyd & Crawford, 2012 ; Taylor, 2016). Влияние и неуловимость неявной интерпретации составляет фундаментальное отличие от обработки традиционных источников данных, таких как специально разработанные опросы, где наряду с данными субъекты данных `` говорят сами за себя '', и, таким образом, пространство для интерпретации более прозрачно, если не значительно. уже.
В контексте городской аналитики полезно использовать теоретическую перспективу интеллектуального урбанизма, чтобы определить области, в которых могут располагаться причинные силы. Во-первых, мы различаем два измерения, участвующих в генезисе данных: технология (смарт-карты) и субъекты (пассажиры), которые, в свою очередь, являются выражением того, как была развернута технология сбора данных, что делают пассажиры и как технологии и предметы взаимодействуют в повседневной жизни. Технологическое измерение может быть далее разделено на карты и связанную сеть и инфраструктуру хранения, встроенную в изменяющуюся транспортную систему. Измерение субъектов данных включает время и место посадки, а также меняющийся повседневный контекст пожилых людей. В самом деле, рассуждения об умном урбанизме с точки зрения мобильности предполагают, что контекстные изменения как транспорта, так и жизни пожилых людей могут быть вызваны одними и теми же технологиями и, в свою очередь, более широкими социально-экономическими обстоятельствами, определяющими их использование; это умный урбанизм как практика, основанная на стремлении облегчить и регулировать мобильность, снизить затраты и повысить эффективность в рамках рыночных стилей управления как части более широкой экономической идеологии, и все это одновременно влияет на сектор общественного транспорта, построенную среду как а также социальные, географические и материальные условия жизни пожилых людей.
Подводя итог, можно сказать, что городская аналитика и ее основные практические элементы обнаружения закономерностей, теоретизирования, контекстуализации и интерпретации предлагают потенциал для создания новых и новых стратегически значимых гипотез, которые не были бы получены без обработки больших данных; но отметим, что ни в одном из исследований большие данные не давали ответов на причинно-следственные связи. Поэтому мы утверждаем, что городская аналитика способствует нашему пониманию городских систем, поскольку поддерживает быстрое генерирование новых гипотез, которые могут быть теоретически обоснованы и контекстуализированы с использованием небольших низкочастотных данных.
Какие обещания дает городская аналитика для городской политики и планирования? Мы выделили следующие определяющие практические характеристики городской аналитики:
Акцент на быстрой динамике в реальном времени, зафиксированной в высокочастотных данных, что контрастирует с медленной динамикой структурных изменений городов;
Большая степень и роль субъективности в интерпретации закономерностей, обнаруженных в больших данных;
Политический характер развертывания сенсорных и вычислительных технологий; и
Составной характер захваченных данных в том смысле, что большие данные представляют собой составные сигналы о работе сенсорной технологии, действиях субъектов данных и взаимном влиянии, которое они оказывают друг на друга.
Помня об этих характеристиках, мы формулируем следующие предложения о значении городской аналитики для стратегической политики и планирования.
Большие городские данные порождают новые гипотезы.
Большие городские данные фиксируют деятельность как людей, так и разумную среду, и поэтому не похожи ни на один другой тип источника данных. Но моделей, полученных из городской аналитики, вряд ли достаточно для определения программы действий в области городской политики и планирования. Как и в тематических исследованиях, где мы можем использовать данные смарт-карт для выявления тенденций и закономерностей, которые в противном случае не были бы обнаружены, эти закономерности сами по себе не давали понимания причин. Вместо этого, опираясь на геовременную контекстуализацию и теоретическую перспективу городской аналитики, можно было бы разработать новые гипотезы относительно того, что может вызвать эти закономерности.
Поэтому мы утверждаем, что городская аналитика редко, если вообще когда-либо, дает прямые ответы на проблемы городской политики; вместо этого мы утверждаем, что новые уровни понимания городских систем могут быть косвенно достигнуты за счет использования больших городских данных в качестве исследовательского материала для разработки новых гипотез. Это означает, что главное изменение, которое большие данные вносят в исследования и политику городов - и, возможно, в социальные науки в целом - это более высокие темпы и новый способ генерирования гипотез. Используя новый расширенный материал больших городских данных, городские исследователи в эпоху больших данных могут тратить больше времени на формулирование и исследование новых причинно-следственных гипотез, которые могут иметь стратегическое значение для городов.
Теория становится более, а не менее важной.
По мере увеличения количества наборов данных и генерируемых паттернов теория становится более важной, чем когда-либо, в интерпретации возникающих паттернов. Интерпретация - это отчасти когнитивный процесс, который обязательно основан на теории, даже если или действительно потому, что он может происходить неявно и подсознательно. «Непрофессиональный» ежедневный пользователь лондонского метро идеально подходит для формулирования гипотез о причинах закономерностей, обнаруженных в данных карты Oyster, на основе рефлексивных, но менее структурированных с научной точки зрения интерпретаций повседневного опыта. Повседневные сознательные и бессознательные теории являются необходимыми человеческими действиями как частью практической повседневной социальной жизни (см. Гидденс, 1984, стр. 26).). Мы можем ожидать, что те же субъективные процессы действуют при интерпретации закономерностей в больших данных и, таким образом, сильно влияют на нашу способность понимать их.
В двух приведенных выше тематических исследованиях интерпретация закономерностей и результатов, обнаруженных в данных смарт-карт, требовала предположений о повседневной практике передвижения городских жителей. Неявные «предметные» знания могут быть получены из существующих эмпирических исследований и практического опыта. Но для того, чтобы прозрачно идентифицировать вероятные причинные области, необходимо также учитывать комбинированный социальный контекст наблюдаемых субъектов данных и технологию сбора данных. Поскольку теоретико-практическая перспектива определяет большие городские данные как составные сигналы действий человека, все более чувствительной среды и их открытых или скрытых взаимодействий, мы полагаем, что эта перспектива предлагает подходящую основу для структурирования интерпретации в соответствии с полным спектром причинных областей.
Небольшие данные становятся более, а не менее важными.
Как показано в тематических исследованиях, большие данные не вытесняют мелкие; Фактически, необходимы дополнительные наборы небольших данных, чтобы установить геовременные характеристики паттернов (контекстуализация), которые позволили генерировать гипотезы, и неформально оценить правдоподобность новых гипотез для дальнейшего исследования (триангуляция). Поскольку большие городские данные позволяют нам быстрее генерировать больше гипотез, наша потребность в их тестировании, подтверждении и отклонении возрастает.
Таким образом, большие данные могут сделать традиционные источники данных стратегически более важными для долгосрочных исследований, политики и планирования, поскольку уверенность, возникающая в результате контролируемого, научно структурированного сбора данных, имеет решающее значение как для контекстуализации, так и для триангуляции. Хотя вполне возможно, что традиционные методы сбора исследовательских данных, такие как выборочные опросы, станут менее успешными ( Burrows & Savage, 2014 ), использование таких источников в рамках анализа больших данных все же может возрасти. Несмотря на неопределенное будущее крупномасштабных опросов, гипотезы, сформированные на основе больших данных, могут служить ориентиром для новых исследований с использованием установленных эмпирических методов, в то время как контекстуализированные модели сами по себе могут служить основой для построения выборки количественных или качественных исследований их причин.
Стратегические идеи зависят от долгосрочных данных.
Для городской политики, которая занимается причинно-следственными связями, краткосрочные идеи, полученные на основе городской аналитики, должны быть сформулированы в рамках долгосрочных тенденций. В тематических исследованиях исследования различные закономерности, связанные со снижением патронажа, могут быть получены только из долгосрочных записей о деятельности, тогда как при разрешении в несколько минут модели могут быть однозначно охарактеризованы изменениями в пунктах назначения, времени путешествия и т. Д. продолжительность поездки, чтобы назвать несколько. Вместо того, чтобы понимать причины, которые относятся к «почему», большие данные позволяют получить исключительно точное описание записанных действий, то есть «что». Когда мы можем наблюдать за этой быстрой динамикой в течение более длительных периодов времени, большие данные, несомненно, становятся мощным ресурсом для выявления и характеристики глубоко укоренившихся проблем в современных городских системах.
До сих пор прогрессу препятствовали практические ограничения в отношении передачи и хранения данных, а также ограничения на совместное использование данных, соображения конфиденциальности и коммерческая или государственная конфиденциальность ( Engin et al., 2020). Хотя стоимость хранения постоянно снижается, по нашему опыту, организации регулярно удаляют исторические высокочастотные данные из-за ограничений на хранение и обработку. Transport for London пока не использует систематически данные своих карт Oyster для каких-либо функций управления или политики, а просто архивирует их по мере сбора. Несмотря на то, что ведется обширная работа по визуализации данных в городской аналитике, чтобы сделать большие данные доступными, конкретная задача в контексте долгосрочной городской политики будет заключаться в том, чтобы решить, какие из постоянно растущих объемов данных следует сохранить, извлечь, обобщить или отбросить, чтобы что они могут стать активами для принятия стратегических решений в городах. Мы предполагаем, что в контексте городской политики инфраструктуры долгосрочных данных не могут быть отделены от конкретных политических программ города.
Анализ больших данных основан на контекстном анализе.
Ввиду цикличности городской аналитики - то есть с использованием той же технологии, которая меняет города для их изучения - мотивация развертывания технологий и режимы работы должны стать неотъемлемой частью количественного анализа данных. Имеется небольшой опыт формальной интеграции обработки данных и контекстного анализа городских сенсорных технологий, который, вместо этого, имеет тенденцию происходить неформально на этапе интерпретации. Как мы утверждали, теоретический взгляд на городскую аналитику и умный урбанизм может помочь направить этап интерпретации, начав с взаимосвязи технологии и субъекта, чтобы распаковать сложные сигналы двух измерений.
При более формальном подходе мы можем идентифицировать и включать соответствующие метаданные, содержащие операционные данные. Этот контекстный анализ может включать в себя официально кодифицированные решения и события, например, переменные, которые фиксируют изменения в сети общественного транспорта, которые могли быть вызваны наблюдениями за моделями спроса в данных смарт-карт. Такие кодифицированные «журналы» можно затем просматривать вместе с измененными таким образом моделями спроса на поездки. Некоторые исследовательские коллективы начинают изучать такие подходы ( https://mobility.mit.edu/london ).
Более широкий контекстуальный анализ будет включать решения влиятельных субъектов, таких как частные компании, консультационные агентства, научные круги и городские департаменты, которые могут активно продвигать развертывание и эксплуатацию технологий для обеспечения постоянной отдачи от инвестиций в инфраструктуру данных. Такие соображения связаны с более широкой повесткой дня критических исследований того, как работают городские учреждения, как они развертывают приборы датчиков и устройств в городской среде, как они инвестируют и используют платформы городской информатики, на которые поступают данные, и как это влияет на их виды. причинных рассуждений, необходимых в долгосрочной городской политике.
Городская аналитика должна учитывать альтернативные рациональные подходы.
Будучи частью умного урбанизма, городская аналитика напрямую участвует в изменении городов, наиболее очевидно посредством анализа в реальном времени. Многие критики отмечали, что инструментальная рациональность, преобладающая в этой форме урбанизма, может привести к неблагоприятным социальным последствиям, включая институционализацию стигматизации, социальной предвзятости и неравных возможностей ( Hollands, 2015 ; Kitchin, 2016b ; Rabari & Storper, 2015 ) . Мы бы предположили, что возможности городской аналитики - новая характеристика и быстрое генерирование гипотез - могут быть преобразованы в альтернативные рациональные решения, чтобы сформулировать новые политические приложения.
В городском планировании Александр (2006) выделяет содержательную, стратегическую и коммуникативную рациональность в дополнение к инструментальной. Следовательно, малоизученные альтернативные приложения городской аналитики включают промежуточную и фактическую оценку конкретных мер городской политики или сбор данных о непредвиденных социальных последствиях умного урбанизма в различных временных рамках. Оценка умного урбанизма с точки зрения успеха или конфликта с другими целями и повестками дня ( Martin et al., 2018) будет иметь как существенное, так и стратегическое значение для городов. Приложения, основанные на коммуникативной рациональности, могут быть сосредоточены на том, в какой степени характеристики и визуализация на основе аналитики могут вовлекать более широкий круг членов гражданского общества в создание городов. Необходима более концептуальная и эмпирическая работа над приложениями городской аналитики, которые охватывают неинструментальную рациональность; и мы утверждаем, что такая работа наряду с рефлексивным, теоретическим построением, основанным на современных, ускоренных формах мобильности и умном урбанизме в качестве практики, является необходимыми шагами, позволяющими городской аналитике вносить положительный вклад в городскую политику и планирование с точки зрения социального, эгалитарного видения. .
Хотя остается неясным, как практика городской аналитики повлияет на то, как мы можем планировать города, критика в области социальных наук демонстрирует, что, если городская политика, основанная на данных, проводится с помощью инструментальной рациональности, автоматическая `` программная сортировка '' станет фундаментальной для организации городов ( Китчин и Додж, 2011 ; Вуд и Грэм, 2006 ). Такая перестройка городских институтов, вероятно, воспроизведет существующие властные отношения и усилит влияние технических экспертов, поскольку растет зависимость от все более сложных физико-цифровых систем ( Kitchin, 2019 ).
На этом социальном и политическом фоне мы определили важные эпистемологические и практические проблемы, которые возникают при анализе высокочастотных данных в целях стратегической городской политики. Мы обнаружили, что большие данные и городская аналитика улучшают наше понимание городских систем, поскольку они генерируют новые и новые гипотезы, возможно, более быстрыми темпами, чем раньше. Соглашаясь с Singleton и Arribas-Bel (2019) , мы утверждаем, что правдоподобность, актуальность и, следовательно, стратегическая ценность гипотез материализуются через прозрачное теоретическое обоснование и геовременную контекстуализацию. В этом процессе важность давно установленных, низкочастотных активов знаний будет возрастать не несмотря на рост больших данных, а из-за их роста.
Ясно, что существует дальнейшая потребность в концептуальной и эмпирической работе по городской аналитике, направленной на решение эпистемологических, практических и нормативных проблем, возникающих в контексте городской политики. Обсуждая шесть наших предложений по городской аналитике, мы определили ряд исследовательских потребностей, которые могут внести полезный вклад в обсуждение.
Во-первых, больше внимания следует уделять когнитивным процессам, которые участвуют в интерпретации закономерностей, обнаруженных в больших данных, в конкретных институциональных условиях. Как мы показали, пространство для интерпретации и свобода действий больше, чем в данных опросов, когда субъекты данных активно и дискурсивно предоставляют информацию в рамках научно разработанного запроса. Таким образом, теоретические рассуждения и шаги по контекстуализации играют гораздо большую, но еще более труднодостижимую роль в практике анализа больших данных.
Во-вторых, ввиду регулирующего характера сенсорных и вычислительных технологий, необходимы дополнительные исследования способов инвестирования и развертывания технологий, обеспечивающих городскую аналитику, в конкретных социальных, географических и временных контекстах. Но контекстуальная чувствительность больших данных также подразумевает, что городская аналитика должна расширить фокус с того, что мы можем узнать о человеческих субъектах «данных», на взаимодействия человека и технологии, их институционализацию и характер новых социотехнических объединений. Другими словами, городская аналитика должна отказаться от своей часто бихевиористской ориентации и сосредоточиться на сложных сигналах человеческих действий, институциональных, технических и нормативных характеристиках, зафиксированных во все более разумной и отзывчивой среде.
Наконец, исследования должны способствовать более полному описанию быстрой динамики, регистрируемой в режиме реального времени, в рамках долгосрочных тенденций в городах. Вскоре большие городские данные будут доступны в долгосрочной перспективе, что устранит проблемы агрегирования и временного масштаба. Затем мы вступим в эпоху, когда краткосрочное и долгосрочное начнут сливаться, и это может иметь