Загрузка...

Pandas: Рассчитать среднее время пребывания

  • Легкая
  • Не решено

Дано 3 датафрейма: df1, df2, и df3, состоящие из 3 полей:

+-----------+-----------+-----------+ | page1 | page2 | page3 | +-----------+-----------+-----------+

Каждая строка датафрейма - информация о времени, которое пользователь провел на той или иной странице сайта.

  • page1 - общая страница с тестами
  • page2 - страница с вопросами
  • page3 - страница с ответами

Каждый из датафреймов содержит полностью идентичные названия и типы столбцов - просто в каждом из них содержится информация за разный промежуток времени.

Вам необходимо:

  • Объединить все датафреймы в один
  • Удалить строки, где есть хотя бы один пропуск
  • Добавить строку Mean в конец датафрейма, в которой будет рассчитано среднее значение по каждому из столбцов

На выходе функции должен возвращаться итоговый датафрейм.

Другими словами, бизнес-задача формулируется так: найти среднее время пребывания на каждой из страниц только для тех пользователей, которые прошли тест до конца.

Примечание: Тест считается пройденным до конца только в том случае, если пользователь попал на страницу с ответами. При другом раскладе пользователь попасть на эту страницу не может.

58 / 164