Cleaning Bad Data in R
Cleaning Bad Data in R
.MP4, AVC, 500 kbps, 1280x720 | English, AAC, 128 kbps, 2 Ch | 1h 54m | 265 MB
Instructor: Mike Chapple
Целостность данных является новым центром научной революции. Теперь, когда все на борту с ролью информации в жизни людей и бизнеса, это не несправедливый вопрос спросить: "Можете ли вы доказать, что ваши данные точны?" В этом, конечно, вы можете научиться выявлять и решать многие проблемы целостности данных, стоящих перед современными учеными данных с помощью R и tidyverse
Узнайте, как обрабатывать отсутствующие значения и повторяющиеся данные. Узнайте, как конвертировать данные между различными единицами и решать плохо отформатированный текст. Плюс, научиться выявлять отклонения, решить ее структурные проблемы, и определить красные флаги, которые указывают на возможные проблемы качества данных.
Там, где это возможно, инструктор Майка Чаппела показывает, как исправить проблемы с помощью R, но те же принципы могут быть применены к любой статистический язык программирования.
Темы включают:
отсутствуют сведения
повторяющихся строк и значений
преобразование данных
форматирование данных
Работа с опрятным данных
уборки наборы данных
дело с подозрительными данными
DOWNLOAD
turbobit