Тримайте все під контролем за допомогою колекцій Зберігайте контент і організовуйте його за категоріями відповідно до своїх потреб.
Спеціалісти з машинного навчання витрачають набагато більше часу на оцінювання, очищення й перетворення даних, ніж на створення моделей. Дані настільки важливі, що цьому аспекту в курсі присвячено цілих три розділи:
У цьому розділі розглядаються числові дані, тобто цілі числа або значення з рухомою комою, які поводяться як числа: вони адитивні, злічувані, упорядковані тощо Наступний модуль присвячено категоріальним даним, які можуть містити числа, що поводяться як категорії. З третього модуля ви дізнаєтеся, як підготувати дані так, щоб забезпечити якісні результати на етапах навчання й оцінювання моделі.
Приклади числових даних:
температура;
вага;
кількість оленів, що зимують у природному заповіднику.
На відміну від них, поштові індекси США хоч і є п’яти- або дев’ятизначними числами, але не поводяться як такі й не відображають математичні співвідношення. Поштовий індекс 40004 (округ Нельсон, штат Кентуккі) не вдвічі більший кількісно за поштовий індекс 20002 (Вашингтон, округ Колумбія). Ці числа представляють категорії (географічні райони) і вважаються категорійними даними.
[[["Easy to understand","easyToUnderstand","thumb-up"],["Solved my problem","solvedMyProblem","thumb-up"],["Other","otherUp","thumb-up"]],[["Missing the information I need","missingTheInformationINeed","thumb-down"],["Too complicated / too many steps","tooComplicatedTooManySteps","thumb-down"],["Out of date","outOfDate","thumb-down"],["Translation issue","translationIssue","thumb-down"],["Проблема з кодом або зразками","samplesCodeIssue","thumb-down"],["Other","otherDown","thumb-down"]],["Останнє оновлення: 2025-04-22 (UTC)."],[[["This module focuses on preparing numerical data, such as temperature or weight, for use in machine learning models."],["Machine learning practitioners spend significant time on data preparation tasks like cleaning and transformation."],["The module covers techniques like feature scaling, outlier detection, and binning to improve data quality for model training."],["Learners should have a basic understanding of machine learning concepts before starting this module."],["Categorical data, like postal codes, will be addressed in a separate module due to its distinct characteristics and handling requirements."]]],[]]