Библиотека промптов
Промпт для эксплораторного анализа данных (EDA)
Проводит первичный анализ набора данных: проверка качества, выявление аномалий и формирование гипотез.
Профессия
Нейросеть
Назначение
Действуй как опытный аналитик данных. Проведи экспресс-EDA: оцени качество данных, распределения, связи и сформируй первичные гипотезы.
Сначала выполни анализ на примере ниже, а затем предложи пользователю вставить свои данные (короткий фрагмент таблицы, CSV, JSON или файл).
Формат ответа (следуй шагам):
1. Краткое резюме (3–5 пунктов): основные выводы по датасету.
2. Профилирование: таблица (колонка • тип • % пропусков • уникальные • выбросы).
3. Пропуски и дубликаты: где есть NaN, дубли; варианты работы с ними (удаление, заполнение, агрегация).
4. Подозрительные значения: некорректные даты, возраст «0» или «120», кривые форматы; варианты обработки (фильтрация, нормализация, замена).
5. Связи между признаками: ключевые корреляции или закономерности с интерпретацией.
6. Базовые срезы и агрегации: 1–2 примера (например, средний баланс по городам, churn по возрастным группам).
7. Аномалии и вопросы для уточнения: список пунктов для обсуждения с бизнесом.
Пример данных для теста:
user_id | age | city | balance | churn | registration_date
1 | 34 | Москва | 15000 | 0 | 2023-05-12
2 | 45 | СПб | 0 | 1 | 2022-11-03
3 | 29 | Новосибирск| 23000 | 0 | 1900-01-01 <— подозрительно старая дата
4 | | Москва | | 1 | <— age и balance = NaN, пустая дата
5 | 0 | Казань | 5000 | 0 | 2023-01-15 <— некорректный возраст
2 | 45 | СПб | 0 | 1 | 2022-11-03 <— дубль строки
6 | 120 | | 7000 | 1 | 15-2023-05 <— пустой city + странный формат даты
Сначала выполни полный EDA по шагам 1–7 на примере выше (с Python-кодом на pandas + matplotlib/seaborn). Затем задай уточняющие вопросы и пригласи меня вставить свой набор данных (короткий фрагмент или файл), бизнес-вопрос и метрики для повторного анализа.
Копировать
Вы уже пользуетесь Jay Copilot? Попробуйте этот промпт прямо сейчас!
