В настоящее время мы поддерживаем табличные данные в формате csv с кодировкой «UTF-8» или «ISO-8859-1» с весом не более 1 ГБ. Загружаемые наборы данных должны соответствовать следующим требованиям:
• Таблица должна содержать более одного столбца и более 100 строк;
• Первая строка таблицы должна содержать уникальные названия столбцов без специальных символов, таких как ! " ' # $ % & ( ) * + . , - / : ; < = > ? @ [ \\ ] ^ ` { | } ~
• Поддерживаемые сепараторы колонок: запятая (,); точка с запятой (;); tab (\t); pipe (|)
• Количество столбцов с данными должно соответствовать количеству столбцов в хэдере
• Дробная часть дробных числовых значений отделяется точкой (126.23)
• Числовые данные должны быть представлены без пробелов, запятых, знака процента, знака валюты
• Требования к столбцам с датами:
o Даты могут разделяться точками (MM.DD.YYYY), дефисами (MM-DD-YYYY), слэшами (MM/DD/YYYY).
o Даты могут содержать время в формате MM/DD/YYYY HH:MM:SS
o Последовательность дней, месяцев, лет в соответствии с любым из:
- MM/DD/YYYY
- DD/MM/YYYY
- YYYY/MM/DD
- YYYY/DD/MM
• Табличные данные, используемые для обучения модели и для прогнозирования, должны быть в одном и том же формате.
Обратите внимание, если в данных для прогнозирования меньше/больше столбцов, чем в обучающем наборе, платформа исключит лишние и заполнит отсутствующие статистическими значениями из обучающего набора. Это может снизить точность предсказания, поэтому важно, чтобы все использованные при обучении столбцы присутствовали в датасете для предсказания.