СюжетыОбщество

ИИ против пыток, калькулятор «удаленки», орфанные данные

20+ идей хакатона «Прожектор 2021». Присоединяйтесь к нам!

13–14 февраля «Новая газета» совместно с Теплицей социальных технологий проведет онлайн-хакатон социальных дата-проектов «Прожектор-2021». В течение двух дней мы будем создавать приложения, сервисы, исследования и расследования для решения важных общественных проблем на основе данных. Победитель получит финансовую поддержку в размере 110 тыс. рублей — на доработку и внедрение своей идеи.

Если вы исследователь, программист, IT-специалист, журналист, дизайнер, энтузиаст работы с данными или просто человек с активной жизненной позицией и желанием делать мир лучше — присоединяйтесь к нам! Выбирайте идею из списка и пишите на почту ([email protected]) или в Telegram (@mayorsimon). Подробнее о «Прожекторе-2021» и условиях участия — на странице хакатона.

Кейсы от «Новой газеты»

Альтернативные индикаторы неравенства

Не секрет, что по уровню благосостояния российские регионы сильно различаются. Обычно благосостояние измеряют уровнем зарплат, цен, размером ВВП, но все это формальные критерии, они показывают лишь одну, легко измеримую сферу жизни. Между тем неравенство может проявляться самыми разными способами — например, доступом к образованию и медицине, к правосудию, чистому воздуху и т. д. И даже разница во времени, затрачиваемом на путь до работы, — это тоже неравенство.

Задача: сформулировать неочевидные и яркие критерии неравенства российских регионов, собрать подходящие данные, подготовить инфографику и драфт будущего материала-исследования.

Собственность РФ

В последние годы чиновники разного уровня все чаще стали засекречивать свою недвижимость и земельные участки в данных Росреестра. Кто-то скрывается под псевдонимом (вспомним сыновей экс-генпрокурора Юрия Чайки, обозначенных на кадастровой карте как «ЛСДУ3» и «ЙФЯУ9»), кто-то выбирает звучное «собственность Российской Федерации». Очевидно, что манипуляции подобного рода будут только продолжаться. Повлиять на эту ситуацию мог бы инструмент мониторинга изменений в Росреестре.

Задача: придумать и разработать сервис, который помог вы выявлять попытки сокрытия владельцев недвижимости и осуществлять мониторинг, например, через аномалии в данных Росреестра. В рамках этого кейса можно также попробовать определить, какое количество из указанной на карте земли действительно принадлежит России.

Нелегальное использование природных ресурсов

В 2019 году Китай вышел на первое место в мире по экспорту древесины в США и Европу — притом что внутри самой страны вырубка лесов категорически запрещена. Тем временем, по данным Всемирного фонда дикой природы (WWF), ущерб России от нелегальных лесозаготовок достигает $2 млрд в год. Впрочем, речь не только о лесе: порядка 10% от всего объема золотодобычи в стране приходится на деятельность черных старателей, а профильные ведомства ежегодно фиксируют десятки тысяч случаев браконьерства. Как правило, подобный промысел находится в тесном контакте с полулегальными структурами, не платит налоги и наносит серьезный ущерб окружающей среде.

Можно ли оценить реальные масштабы нелегальной добычи природных ресурсов в России? Основой такого исследования может стать сравнение данных из разных источников (например, карты лесного покрытия планеты с официальными цифрами лесозаготовки), мониторинг новостных сообщений о выявленных случаях браконьерства и т. д.

Инфраструктура вечной мерзлоты

Разлив топлива под Норильском стал одним из самых крупных экологических бедствий в российской Арктике. Среди возможных его причин называют глобальное потепление, приведшее к разрушению резервуара с нефтепродуктом. Вечная мерзлота занимает до 65% площади России, а изменение ее несущей способности по одному из сценариев может затронуть в таких зонах более 54% жилых зданий и 19% критически важной инфраструктуры — и привести к потерям в десятки миллиардов долларов. Но если в советское время вечную мерзлоту изучали целые институты, то сегодня этим вопросом почти никто не занимается.

Какое количество жилого фонда и промышленных объектов расположено в условиях вечной мерзлоты и когда их ремонтировали в последний раз? Как глобальное потепление влияет на инфраструктуру Севера и жизнь коренных народов — вот тема для масштабного дата-исследования участников хакатона.


ИИ против пыток

Автор: Комитет против пыток

Формат: веб-сервис

В правозащитную организацию «Комитет против пыток» поступает большое количество обращений пострадавших от насилия в колониях, в тюрьмах, СИЗО, отделах полиции и просто на улицах. Часто помощь правозащитников заключается в составлении правовых документов: юристы пишут жалобы, ходатайства, обращения в различные инстанции. Есть необходимость оптимизировать эту работу — для этого потребуется запустить нейронную сеть, которая при взаимодействии с заявителем могла бы определять, какие документы ему нужны в конкретном случае и в какие органы их следует направить. Для обучения алгоритма у комитета есть обширная база всевозможных процессуальных документов. В дальнейшем полученный искусственный интеллект можно было бы настроить на написание стандартных жалоб, заявлений и т. д. — не только по «пыточной» статье, но и по другим. Сейчас в разработке у комитета находится сайт, куда планируется интегрировать этого робота.

**Алексей Фокин, Комитет против пыток: ** «Последние события в стране и мире показали что с пытками и произволом со стороны государства может столкнуться абсолютно любой человек. Мы прикладываем все усилия для помощи пострадавшим, но наши силы ограничены регионами присутствия. Зачастую люди готовы самостоятельно бороться за свои права, но им не хватает юридического образования для составления грамотных юридических документов. Наш проект направлен на помощь этой группе населения нашей страны».


COVID Antivax

Автор: денис кваснюк

Формат: дата-исследование, публикация

Год назад команда активистов за медицинское просвещение работала на хакатоне «Прожектор-2020» над портретом типичного антипрививочника — противника всех видов вакцинации. Изучая поведение членов сообщества в соцсетях, участникам удалось собрать данные и разработать модель диалога с «антиваксерами». В этом году активисты решили продолжить исследование под другим углом и разобраться, что происходит в сообществе антипрививочников, когда слово «вакцина» уже давно вошло в наш повседневный лексикон?

**Денис Кваснюк, автор идеи: ** «Антипрививочники отличаются от прочих научных скептиков тем, что у них есть определенные юридические основания для легитимации своей позиции: отказ от прививок детей делает их сообщество более устойчивым. При этом за прошедший год суммарное знание о болезнях в мире значительно выросло. Насколько тема коронавируса актуальна в среде антиваксеров, заставил ли ковид кого-нибудь передумать или же, наборот, присоединиться к сообществу — на эти и другие вопросы мы собираемся найти ответ на хакатоне.


Калькулятор «удаленки‎»‎

Автор: All Good eco-friendly agency

Формат: Веб-сервис, публикация

Мы часто даже не задумываемся, как влияет на окружающую среду обычная работа в офисе. Расходы бумаги на распечатку документов, транспортные выбросы от поездок сотрудников, освещение и отопление офисных помещений — если измерить все виды экоследа, на нужды одного работника может тратиться условно до 10 деревьев в год.

2020-й позволил нам оценить все преимущества (и недостатки) удаленного труда, но как вычислить пользу от этого для экологии?Решением может стать калькулятор «удаленки‎» — веб-сервис, который поможет подсчитать, как сократятся издержки и повысится удобство работы отдельно взятой компании при переходе на работу из дома.

Наталия Сонина, автор проекта: «‎Для расчетов используем такие данные, как офисные площади, энергопотребление, расход питьевой воды, километраж автомобильных поездок в офис, распечатываемые и отправляемые курьером документы. Итоговый подсчет выдаст сэкономленные деньги и сокращенный экослед. Например, компания из десяти человек в год может сэкономить около 500 тыс. руб. и спасти 120 деревьев. На хакатоне мы сможем более точно подсчитать, что произойдет, если все компании города/страны перевести на работу из дома. Напишем классную статью с инфографикой и мотивируем больше бизнесов сделать жизнь сотрудников приятнее, а природу — чище».


Орфанные данные

Автор: АНО «Маяк»

Формат: исследование, публикация, визуализация

Редкие (орфанные) болезни зачастую влекут за собой отказ жизненных систем и смерть человека еще в детском или юном возрасте. Лечение таких заболеваний всегда персонализировано, а поскольку требуется оно относительно небольшому количеству человек, стоимость лекарств, как правило, исчисляется миллионами рублей. При этом, информация о кампаниях по сбору средств для орфанных пациентов, кажется, окружает нас со всех сторон; у доноров растет практика закрытия сборов крупными пожертвованиями, а фонды переходят от «точечных» франдрайзинговых кампаний к программным.

Оценить все эти тенденции невозможно, без понимания общей картины происходящего. Задача для участников хакатона — cобрать единую статистику по орфанным заболеваниям в России, включающую в себя следующие данные: сколько в нашей стране людей с редкими заболеваниями, какая сумма необходима на лечение всех этих пациентов, и какую ее часть на данный момент удается закрывать благодаря государственным субсидиям и частным сборам.

Рина Гзогян, автор идеи: «Сколько на самом деле нужно денег, чтобы вылечить все орфанные болезни в России — вот ключевой вопрос, от которого зависит понимание масштабов, необходимых для решения этой глобальной проблемы. Для ответа на него важно собрать больше данных и о самих болезнях, и о фондах, которые участвуют в решении. Эта информация может пригодиться впоследствии для разработки реестра благотворительных организаций, работающих с редкими болезнями — он помог бы людям, столкнувшимся с такой бедой, не тратить драгоценное время. В перспективе мне бы хотелось привлечь энтузиастов и к разработке игры-квеста, помогающей в сборах».


Нетоксичный алгоритм

Автор: AivsBIAS

Формат: модель машинного обучения, утилита

На протяжении долгого времени общемировой культурный фон оставался по гендерному признаку крайне предвзятым. В XXI веке все эти стереотипы перенимают модели машинного обучения, тренируемые на статистических данных и корпусах текстов.

Вот как это происходит: искуственный интеллект работает с так называемыми «эмбеддингами» — представлениями слов в виде векторов, где расстояние между кодами слов соотносится с их смысловой близостью. Обучают «эмбеддинги» на больших объемах текста, значительная часть которых совсем не гендерно-нейтральна (например, классическая художественная литература). Как результат — алгоритмы работают некорректно, cопоставляя со словами мужчина и_ женщина _множество не всегда подходящих терминов.

Команда AivsBIAS предлагает технический подход к решению этой проблемы, применимый ко всем современным чат-ботам, переводчикам и даже роботам-журналистам. Участники планируют представить гендерно-нейтральную языковую модель и программную утилиту для ее обучения, а также переосмыслить сам подход к обучению искусственного интеллекта.

**Михаил Кузнецов, автор проекта: ** «Наглядным примером указанной проблемы может стать пример с роботами-переводчиками (от Google или Яндекс), когда профессии инженера, физика и прочие, по умолчанию становятся мужскими. Когда мы обучали «эмбеддинг» на романе «Война и мир» оказалось, что к слову _женщина _самые близкие по смыслу понятия — это романтичный, неженатый, беспомощный, в то время как к мужчине наиболее приближены добрый и атлетичный. Слова_ наука _и _военный_ также оказались значительно ближе к мужскому полу».


Как определиться, кому помогать?

Автор: ФОНД «НУЖНА ПОМОЩЬ»

Формат: Веб-сервис

В каталоге фонда «Нужна помощь» представлены десятки благотворительных организаций, для навигации по которым предусмотрен детальный классификатор. В планах у фонда сделать подбор подходящих для жертвования организаций более «нативным» и органичным. Одним из решений может стать тест, который предложит пользователю оценить свое согласие/несогласие с несколькими распространенными утверждениями. Например: «помогать стоит прежде всего фондам, чьи названия и люди хорошо известны», или «в мире много проблем и судьба домашних животных далеко не самая важная из них». Если желания заполнять анкету нет, пользователю можно предложить и другую опцию: специальный алгоритм подберет вам наиболее подходящий фонд на основе анализа вашего профиля в соцсетях (с учетом географических параметров, интересов, подписок и т. д.).

Артем Овсянников, фонд «Нужна помощь»: «Разобраться в том, какой организации из представленных у нас на сайте лучше сделать пожертвование, — это довольно частый запрос. Мы за осознанную благотворительность, поэтому для релевантного ответа пользователю придется немного покопаться в себе. Идея в том, чтобы человек получил список организаций, которые не противоречили бы его убеждениям. Подобный сервис мы хотим разместить на главной странице фонда и, возможно, использовать его как элемент геймификации в своей рассылке».


Удобные инструкции к вакцинам

Автор: АНО «Коллективный иммунитет»

Формат: парсер, веб-сервис

Россия — страна c высоким уровнем недоверия к вакцинации. При этом, не только обычные люди, но даже многие медики не привыкли обращаться к официальным документам, например, инструкциям к вакцинам. Одна из причин — состояние Государственного реестра лекарственных препаратов (ГРЛС), где эти самые инструкции публикуются. Сайт сделан на устаревших технологиях, имеет крайне неудобный поиск и часто выдает технические ошибки.

На хакатоне «Прожектор 2021» команда разрабатывает парсер инструкций с сайта ГРЛС. Участникам предстоит решить нетривиальную задачу — научить программу искать в отсканированных pdf-документах актуальную версию каждого из разделов инструкции **** (часто ее текст разбит на несколько отдельных файлов). А дальше — распределять эту информацию в соответствующие поля базы данных.

**Елена Савинова, автор идеи: ** «Сейчас ситуация такова, что единственным в России источником актуальных инструкций к лекарственным средствам и вакцинам не пользуются даже специалисты. Отсюда — многие бездоказательные и просто неверные утверждения о противопоказаниях и способах введения лекарств. На основе собранной базы данных, в наших планах также создать приложение по поиску противопоказаний для вакцин, но эта задача является отдельным самостоятельным проектом АНО «Коллективный иммунитет».


Близким лицом близкому лицу

Автор: Консорциум женских НПО

Формат: исследование, публикация

При работе с общественным мнением по вопросу масштабов семейного насилия в России одним из аргументов служит статистика МВД: 40% всех тяжких преступлений совершается в семье, а потерпевшими от них чаще всего становятся женщины, пожилые люди и дети. При этом сотрудники женских НКО отмечают, что прозрачного механизма сбора и анализа данных о жертвах преступлений с учетом пола и семейного статуса до сих пор не существует. Официальные цифры указывают на общее количество женщин, ставших жертвами преступных посягательств, но сколько из них погибло в близких отношениях — неизвестно.

В рамках хакатона консорциум женских НПО приглашает программистов и дата-аналитиков вместе исследовать судебные решения по ст. 105 «Убийство», ст. 107 «Убийство в состоянии аффекта» и ч. 4 ст. 111 УК РФ «Умышленное причинение тяжкого вреда здоровью, повлекшее по неосторожности смерть потерпевшего», где погибшими являлись женщины. И выяснить, какова доля женщин, убитых в близких отношениях от рук родственника или партнера, по сравнению с общим количеством убитых женщин. В приговорах потребуется исследовать отношения жертв с обвиняемым лицом — эти данные содержатся в текстах судебных решений.

Александра Граф, автор проекта: «Официальная статистика не раскрывает, при каких обстоятельствах чаще всего погибают женщины, а декриминализация домашнего насилия привела к еще большему обострению этой проблемы: так, МВД не считает забитую насмерть мужем (и тем более сожителем) женщину погибшей от домашнего насилия. Все это дает противникам ужесточения законодательства в этой области повод говорить — да, женщин убивают, но семейное насилие тут ни при чем».


Зеленый курс России

**Автор: ** Greenpeace

**Формат: ** интерактивная карта

В борьбе с глобальным изменением климата страны мира переходят на долгосрочные стратегии низкоуглеродного развития (т. е. с низким уровнем выбросов парниковых газов). В сентябре 2020 г. Greenpeace России совместно с более чем 150 организациями и экспертами представил программу «Зеленый курс России» — в ней собраны системные решения по охране климата, переходу к экологичной экономике, ее зеленому восстановлению после коронавируса.

Наглядно обозначить потенциал Зеленого курса применительно к регионам России может интерактивная карта. По задумке она будет состоять из несколько слоев, каждый из которых раскроет разные решения, предложенные стратегической программой. Например, слой «Энергетика»: пользователь перетаскивает виртуальную солнечную панель, отслеживая изменение инсоляции по регионам, и возможность для развития на местах солнечной энергетики. Другой слой — «Лес» — может содержать Карту неиспользуемых сельхозземель, потенциально пригодных для высаживания деревьев; здесь же можно просчитать, сколько выбросов парниковых газов эти леса могли бы поглотить.

Полина Каркина, Greenpeace: «Сейчас для получения общественной поддержки предложений Зеленого курса важно донести его выгоды и преимущества до широкой аудитории — в понятной и интересной форме. Хочется, чтобы Зеленый курс воспринимался как желаемый и необходимый путь развития страны для преодоления климатического кризиса — реального, рукотворного и решаемого. Участникам хакатона мы предложим пофантазировать, как могла бы выглядеть наша интерактивная карта по механике, на основе имеющихся на сегодня данных».


Незавалинка

Формат: карта, визуализация, веб-сервис

Пандемия коронавируса подтолкнула людей к мысли о переезде из больших городов в провинцию. Оказалось, что там можно комфортно жить, работая удаленно. Это может стать долгосрочным трендом — по данным исследования, 33% опрошенных хотели бы переехать из большого города в город поменьше или на малую территорию. Из них 65% готовы участвовать в развитии территории и местных сообществ, но часто не знают, с чего начать. В свою очередь, активисты на местах часто действуют в одиночку, мало взаимодействуя с тематическими проектами в стране.

Идея сделать карту с контактами и проектами людей, развивающих малые территории, появилась давно. В прошлом году проект «Альтуризм» уже участвовал с ней в хакатоне, но реализацию было решено отложить и начать с формирования сообщества. Сейчас карта создается и развивается силами группы активистов — участников курса развития малых территорий «Незавалинка». К продолжению этой работы приглашаются все желающие.

**София Минасян, автор идеи: ** «За 2020 год зародилось сообщество#Незавалинка, объединившее экспертов и активных людей, которые верят в будущее деревень и малых городов. Карта позволяет в интерактивном режиме увидеть все многообразие жизни на малых территориях, найти активных людей и вдохновиться новыми идеями и смыслами. Прочитав невероятные истории проектов, просто невозможно удержаться от создания своего!»


Как нарушают права задержанных на митингах

Автор: Московская Хельсинская группа

Формат: исследование, визуализация

Задержанные на протестных акциях то и дело сталкиваются с нарушениями в отделениях полиции: их лишают свободы на срок более трех часов по «неарестным» статьям, к ним часто не допускают адвокатов и защитников, применяют силу и т.д. Информация о подобных инцидентах циркулирует в информационном пространстве, но нет единого источника, где она была бы собрана и проанализирована.

Актуальная задача на хакатон — подготовить исследование и визуализацию по указанной теме. Для работы потребуется собрать данные об обращении в отделах полиции с задержанными на митингах — с последующим выявлением наиболее частых нарушений и проблемных отделов полиции. Полученные дата-сет и визуализация могут быть в дальнейшем использованы в работе журналистами, активистами и исследователями.

**Александра Пинтелина, автор проекта: ** «У коллег Московской Хельсинской группы уже есть похожий проект с информацией об отделах полиции. Одной из частей нового исследования может стать интерактивная карта отделений с информацией о нарушениях, с которыми в них сталкиваются задержанные — так мы сможем наглядно показать самые «проблемные» участки. Начать работу можно с Воронежа, где коллеги систематизируют информацию уже сейчас. По Москве эти данные еще предстоит собрать на хакатоне.


Кому на Руси жить хорошо

Автор: Антон Алексишин

Формат: веб-сервис, сайт

В новостных изданиях регулярно публикуются данные о состоянии экономики России: уровень инфляции, курс валюты, реальные располагаемые доходы, средняя или медианная зарплата, данные о прожиточном минимуме, стоимость продуктовой корзины. Однако все эти цифры довольно сложно воспринимать в отрыве друг от друга и вне временного контекста. Сделать информацию более наглядной поможет сайт-дашборд, на котором отобразятся основные показатели экономической и социальной ситуации в России в динамике.

**Антон Алексишин, автор проекта: ** «Дашборд в первой итерации можно построить с помощью витрины данных Google Data Studio, а в дальнейшем — переписать на открытых инструментах. Данные будут агрегироваться из открытых источников: Росстат, портал Открытых данных. Для описания политических и социальных событий буду обращаться к отраслевым экспертным отчетам ООН, Всемирного банка и отечественных аналитиков. Диаграммы с основными показателями будут дополнены политическими и социальными событиями, предоставляя контекст ситуации и позволяя самостоятельно сделать выводы».


Састейнометр

Автор: Василий Радаев

Формат: сервис, telegram-бот

Устойчивые продовольственные системы — концепция, которая только набирает популярность как в России, так и в мире. Время от времени можно услышать, что производство отдельных продуктов питания «слишком дорого обходится планете», однако комплексного представления о том, как наш пищевой рацион влияет на окружающую среду и что такое «дорого», мы пока еще не имеем.

Решением может стать калькулятор устойчивости. На основе данных о том, сколько водных, земляных, углеродных ресурсов расходуется при производстве и транспортировке отдельно взятого продукта, можно рассчитать его кумулятивный показатель, а дальше сравнивать по этому параметру различные продукты между собой.

Василий Радаев, автор идеи: «Своим проектом мы бы хотели привлечь внимание людей к тому, насколько их диеты устойчивы, а также сподвигнуть на формирование пищевых привычек, полезных не только для собственного здоровья, но и для окружающей среды. Приложение может оказаться полезным как для отдельных пользователей, так и для целых компаний. Кроме того, его можно было бы использовать и для образовательных целей».


Агрегатор онлайнов

Автор: ЕВРОПЕЙСКИЙ УНИВЕРСИТЕТ В САНКТ-Петербурге

Формат: веб-сервис, сайт

В условиях, когда некое общественно значимое событие развивается быстро и нелинейно, многие СМИ начинают вести текстовые трансляции или просто периодически публикуют обновления по теме. Это касается, например, протестных акций, но не только. Поскольку журналисты разных СМИ освещают развитие ситуации из различных точек, пользователи часто вынуждены переключаться между множеством источников. Не то чтобы это было большой проблемой, но это неудобно. Идея: создать агрегатор онлайнов, который будет отслеживать появление текстовых трансляций на сайтах СМИ и в режиме реального времени собирать их в ленту на отдельной веб-странице, обрабатывая и убирая повторения. В дальнейшем, на основе постоянно растущей базы данных, сервис позволит проводить аналитику, изучая события и реакцию на них новостных каналов.

Илья Утехин, автор идеи, профессор Европейского университета в СПб: «‎Люди интересуются самыми последними новостями на некоторую актуальную тему не только из сопереживания, но и потому, что события могут напрямую затрагивать повседневную жизнь (например, перекрытие проезда или прохода). Благодаря агрегатору пользователи получат в реальном времени доступ к многомерной картине события с разных точек зрения. А исследователи медиа — структурированный материал для дальнейшего анализа.


Экосистема активизма городской среды

**Автор: ** Диана Ишматова

**Формат: ** исследование, визуализация

Исследователи активизма часто применяют в своей работе теорию пересечений. Например, изучая движение за права животных, анализируют насколько участники рассматривают эту проблему изолированно либо в комплексе с прочими практиками угнетения, и кооперируются с другими активистами для достижения общей цели.

Активизм можно изучать и с точки зрения различного подхода к нему у разных групп. Так, в области городской среды часть активистов занимается надзором состояния дорог, зданий и т. д., заставляя городскую администрацию выполнять свои функции; другие же действуют в логике do-ocracy, привлекая для осуществления изменений собственные ресурсы.

Цель исследования в рамках хакатона — используя вышеуказанные методики, оценить степень развития экосистемы активизма городской среды в Санкт-Петербурге. В качестве материала могут служить тематические группы «ВКонтакте», данные из которых предстоит выгрузить, проанализировать и сделать визуализацию.

**Диана Ишматова, автор проекта: ** «Применив интерсекциональный подход, мы сможем выявить совместную деятельность членов питерских групп озеленения, раздельного сбора, экологических групп, градозащитников и т. д. Исследование покажет и насколько участники do-ocracy-сообществ заинтересованы в группах, решающих проблемы институциональным способом и наоборот».


Нулевой травматизм / Vision Zero

Формат: свободный

Автор: Проектное агентство Алексея Радченко

Качество дорожной инфраструктуры и городской среды ежегодно приводит к большому количеству человеческих жертв: только за первую половину 2020 года в результате ДТП в России погибло более 6,4 тыс. человек и ранено 77,7 тыс. С помощью данных эксперты и активисты реализуют десятки проектов по развитию общественного транспорта и безопасности улиц. Городская среда остается пространством для реализации большого количества идей и проектов.

Алексей Радченко, исследователь, урбанист: «В рамках движения за нулевую смертность на дорогах исследователи активно используют открытые данные ГИБДД и, в частности, зависимость тяжести ДТП от внешних факторов и инфраструктуры вокруг. Эту задачу мы предлагаем разделить с участниками хакатона, для чего готовы предоставить данные по всем совершенным ДТП с пострадавшими по всем регионам страны с 2015 по 2020 год в разрезе места (координат), типа и вида ДТП, его участников и условий аварии».


Common data

Автор: АНАСТАСИЯ ГИСИНА

Формат: веб-сервис

В Сети доступно огромное количество дата-сетов и сервисов, на которых можно выбрать себе данные на любой вкус (Kaggle, Google Datasets Search, VisualData и другие). При этом вопрос качества некоторых наборов часто оставляет желать лучшего. Команда Common Data разрабатывает сервис, который поможет определять сбалансированность дата-сетов, искать в них аномальные данные и, если это нужно, предлагать пользователю догенерацию. За два дня хакатона участники команды планируют доделать алгоритм машинного обучения и запустить первый вариант веб-сервиса, с которым можно будет взаимодействовать.

**Анастасия Гисина, команда Common Data: ** «Чтобы отобрать качественный набор данных под свою задачу или даже просто убедиться, что релеватного дата-сета нет, иногда нужно провести несколько часов на самых разных платформах и скачать несколько десятков файлов. Мы предлагаем облегчить этот процесс и создать веб-сервис, способный за считаные секунды оценивать целостность дата-сета и давать советы по тому, как можно его улучшить».


Связность Рунета

Автор: ifreedomlab.net

Формат: визуализация, публикация

Связность интернета, то есть наличие каналов взаимодействия между автономными узлами и системами внутри сети — важнейший параметр, говорящий о надежности и устойчивости всемирной паутины и ее национальных сегментов. Еще в 2016 году «Общество защиты интернета» представило индекс связности Рунета с мировой сетью; исследованиями в этой области постоянно занимаются активисты и IT-cпециалисты. Однако, информация о связи российского интернета с внешним миром, о факторах бесперебойной работы сети и возможности фиксировать шатдауны по-прежнему недоступна для широкого круга интернет-пользователей.

На хакатон команда поставила себе две основных задачи: проверить имеющиеся критерии связности, найти и разработать новые, дополнив имеющиеся данные из открытых источников; подобрать визуализацию для данных, чтобы результат анализа связности легко читался и был максимально нагляден.

**Владимир Кузьмин, ifreedomlab: ** «Cейчас в России нет критических проблем со связностью и это заслуга отечественных провайдеров, которые развивались долгое время без внимания государства, в здоровой конкурентной среде. Но, судя по всему, ситуация будет меняться, и далеко не в лучшую сторону. Сейчас мы работаем над тем, чтобы добавить в свой анализ геоданные, то есть считать не просто переходы трафика через границу России, а конкретизировать — РФ и Казахтан, РФ и Япония, РФ и Украина… Это позволит проследить развитие связей с определенными странами. Что еще важного можно сделать? Придумать, как максимально простым языком донести до аудитории, что собственно такое связность, как ее измерить, и как она влияет на каждого из нас».

shareprint
Добавьте в Конструктор подписки, приготовленные Редакцией, или свои любимые источники: сайты, телеграм- и youtube-каналы. Залогиньтесь, чтобы не терять свои подписки на разных устройствах
arrow