Pandas: Рассчитать среднее время пребывания
- Не решено
Дано 3 датафрейма: df1
, df2
, и df3
, состоящие из 3 полей:
+-----------+-----------+-----------+
| page1 | page2 | page3 |
+-----------+-----------+-----------+
Каждая строка датафрейма - информация о времени, которое пользователь провел на той или иной странице сайта.
page1
- общая страница с тестамиpage2
- страница с вопросамиpage3
- страница с ответами
Каждый из датафреймов содержит полностью идентичные названия и типы столбцов - просто в каждом из них содержится информация за разный промежуток времени.
Вам необходимо:
- Объединить все датафреймы в один
- Удалить строки, где есть хотя бы один пропуск
- Добавить строку
Mean
в конец датафрейма, в которой будет рассчитано среднее значение по каждому из столбцов
На выходе функции должен возвращаться итоговый датафрейм.
Другими словами, бизнес-задача формулируется так: найти среднее время пребывания на каждой из страниц только для тех пользователей, которые прошли тест до конца.
Примечание: Тест считается пройденным до конца только в том случае, если пользователь попал на страницу с ответами. При другом раскладе пользователь попасть на эту страницу не может.
Вы видели эту задачу на собеседовании?