13 марта Google AI Research представила Groundsource — методологию превращения неструктурированных новостей в структурированные данные с помощью Gemini. Первый датасет содержит 2,6 миллиона записей об городских паводках, извлечённых из 5 миллионов новостных статей на 80 языках. Данные охватывают более 150 стран.
Технически система работает так: Google Read Aloud агент извлекает текст из статей, Cloud Translation API стандартизирует его на английский, а Gemini определяет место, время и масштаб каждого наводнения. При ручной проверке 82% записей оказались достаточно точными для практического использования, а 60% были точны и по локации, и по времени.
На основе полученного датасета Google обучила модель прогнозирования городских паводков, способную предсказывать их за 24 часа. Прогнозы уже доступны в Google Flood Hub — платформе, которая ранее покрывала только речные наводнения для 2 миллиардов человек. Теперь охват расширен на городские территории, где риск особенно высок из-за плотной застройки.
Исследователи подчёркивают, что методология Groundsource применима не только к наводнениям. Её можно адаптировать для отслеживания засух, оползней, лавин и других стихийных бедствий, для которых не существует точных исторических данных. Это отличный пример того, как ИИ решает реальные проблемы — от генерации текста до спасения жизней.


