Запущен веб-сайт, облегчающий работу с правительственными данными

0

data usa

На протяжении многих лет федеральное правительство, власти штатов и некоторых городов с большим энтузиазмом работали на созданием баз данных, открытых для широкой общественности. Тонны бумажных документов по демографии, здравоохранению, дорожному движению, потреблению энергии, доходам семей и многим-многим другим темам были оцифрованы и размещены в Интернете. Этот массив данных – золотой рудник открытий и идей, но найти в нем самородок может быть непросто и требует специальных навыков.

Проект, который в понедельник запустила компания M.I.T. Media Lab, нацелен на облегчение поиска в массиве информации с целью сделать правительственные данные доступными для широкой аудитории. Проект под названием «Данные США» (Data USA) позиционирует себя как «наиболее полная визуализация американских публичных данных». Он бесплатный и исходный код его программного обеспечения открыт, а это означает, что разработчики могут создавать свои собственные приложения, добавляя в базу новые данные.

Цезарь А. Идальго, доцент кафедры медиа-искусств и наук в M.I.T. Media Lab, который руководил проектом «Данные США», сообщил, что веб-сайт был разработан для «визуализации данных», которая включает в себя графики, диаграммы и словесные описания.

Media Lab работала совместно с компанией «большой четверки» Deloitte, которая обеспечила финансирование проекта и поделилась накопленной информацией о том, как люди используют правительственные данные для ведения бизнеса и исследований.

«Целью проекта было организовать и визуализировать данные таким образом, каким большинство людей представляют их», сказала Патриция Бакли, директор экономической политики и анализа в Deloitte и бывший старший экономист Министерства Торговли.

Наберите «Нью-Йорк» в поисковой строке на веб-сайте «Данные США», и раскрывшееся меню предложит выбор — город, район, штат и другие варианты. Выберите город, и на странице отображается авиа-снимок Манхэттена с тремя основными статистическими показателями: население (8,49 млн), средний доход домашних хозяйств ($ 52,996) и средний возраст (35,8).

Чуть ниже находятся шесть иконок для связанных категорий, в том числе экономика, демография и образование. Если вы нажмете на демографию, появится одно из так называемых словесных описаний статистических данных, в основном базирующееся на данных опроса Бюро Переписи Населения Соединенных Штатов.

Используя красочные графики и короткие пояснения, описание показывает средний возраст жителей Нью-Йорка иностранного происхождения (44,7) и жителей, рожденных в Соединенных Штатах (28,6); наиболее распространенные страны происхождения иммигрантов (Доминиканская республика, Китай и Мексика); процент жителей, которые являются американскими гражданами (82,8% против средне-национального 93%).

«Данные США» размещают определенные статистические данные на своей домашней странице, как-то: гендерный разрыв в оплате труда в штате Коннектикут; расовую составляющую бедноты во Флинте, штат Мичиган; заработная плата врачей и хирургов по всей территории Соединенных Штатов; учебные заведения, которые присваивают наибольшее количество степеней в области компьютерных наук.

Хэл Р. Вариан, главный экономист Google, который не имеет никакого отношения к проекту «Данные США», называл сайт «очень информативным и эстетичным». Тот факт, что правительство дает открытый доступ к такому объему данных, добавил он, стимулирует творческую работу над проектами, аналогичными «Данным США».

Веб-сайт воплощает в себе современный подход к анализу данных, что, скорее всего, будет становиться все более распространенным, сказал Крис Хаммонд, профессор компьютерных наук Университета Северо-Запада. Сайт предполагает, кто является его потенциальными пользователями, и закладывает эти ожидания в свое программное обеспечение, сказал он.

«Таким подходом движет мысль, что мы можем на самом деле выяснить, что пользователь захочет узнать, когда он будет смотреть на набор данных», сказал г-н Хаммонд.

Ученые, работающие с базами данных, по его словам, часто противятся, когда такой подход имплементируется в программное обеспечение, которым они пользуются. Но опытных пользователей в мире меньшинство, сказал г-н Хаммонд, который также является главным разработчиком в старт-апе Narrative Science, занимающимся разработкой программного обеспечения для работы с базами данных.

Комментариев нет. Войдите чтобы оcтавить комментарий.

Добавить комментарий

Наверх