Отбор информативных признаков производится экспериментальным путем с постоянной валидацией и учетом особенностей алгоритмов, используемых для предсказания целевой переменной.
Загрузите необработанные данные с текстовыми, категориальными и числовыми переменными, пустыми ячейками, датами и экстремальными значениями. Переменные будут автоматически очищены и обработаны.
Если данные содержат пропуски, Nova ML применит ML-алгоритмы для обучения на основе остальных известных данных и спрогнозирует пропущенные значения. Данный функционал доступен как отдельный сервис.
Экспериментальным путем проверяются разные типы моделей на базе простых линейных и трехбазисных алгоритмов. В результате такого анализа Nova ML выбирает наиболее подходящую модель.
Nova ML проводит оценку значимости факторов на каждом этапе калибровки модели.
Переместите таблицу с новыми данными для предсказания прямо в окно браузера. Nova ML обработает тестовый набор данных и отправит прогнозные значения в папку «Загрузки» на вашем компьютере.
Преимущества NovaML
Доступно
Работа с алгоритмами ML требует поддержки дорогостоящей инфраструктуры. NovaML использует необходимые вычислительные ресурсы по требованию и отключается от них после завершения расчетов.
Качественно
На одних и тех же данных качество моделей, полученных с помощью NovaML, превосходит результаты работы ML-инженеров на Kaggle. Несмотря на такой впечатляющий результат, мы не перестаем работать над усовершенствованием NovaML.
Быстро
На работу по подготовке и очистке данных, анализ и оптимизацию модели обычно уходят недели труда data-science специалистов. NovaML сделает все то же самое, но за пару минут, даже если вы работаете с несколькими проектами одновременно.
Легко
Вместе с NovaML вы сможете использовать все возможности машинного обучения, даже не имея навыки программирования. NovaML проведет вас через весь ML-процесс и сделает большую часть технической работы автоматически.
Результаты решения задач по предиктивной аналитике с помощью AutoML платформ в сравнении с NovaML
NovaML
Google Automl
AWS Automl
Microsoft Azure
Obviously.ai
Задача
Датасет
Критерий кач-ва
Метрика
NovaML: результаты на уровне лучших мировых аналогов
В среднем на 5% выше качество предсказаний, чем у конкурентов
NovaML показывает качество предсказаний на уровне технологических гигантов, сочетая в себе удобство no-code площадок
Оценка эффективности маркетинга
Классификация химических веществ
Biodegradation
стремится к 1.00
Accuracy
0.86
0.80
0.78
0.75
0.81
Определение рельефа местности
Hill-Valley
стремится к 1.00
Accuracy
0.85
0.86
0.83
0.87
0.78
Bank marketing
стремится к 1.00
Accuracy
0.92
0.84
0.81
0.80
0.78
0.2 mb
0.8 mb
3.9 mb
Выявление оптимальных маркетинговых стратегий для финансовых институтов (например, оценка эффективности таргетной рекламы в социальных сетях)
Accuracy — показатель, который описывает общую точность предсказания модели по всем классам. Accuracy рассчитывается как отношение количества правильных прогнозов к их общему количеству
Распознавание биоразлагаемых химических веществ
Построение предиктивной модели, определяющей холмистую местность и впадины в рельефе
Результаты решения задач по предиктивной аналитике Data Science-специалистами (Kaggle competitions) в сравнении с NovaML
Задача
Датасет
Критерий кач-ва
Метрика
Получение результата в 2500 раз быстрее: оптимизация времени позволяет быстро проводить проверку гипотез и построение моделей машинного обучения
Качество предиктивных моделей, построенных NovaML, сопоставимо с качеством работы моделей, построенных Data Science-специалистами
NovaML: результаты на уровне лучших мировых аналогов
Определение цены и ключевых факторов, влияющих на оптимальную цену продажи
Построение предиктивной модели выживаемости пассажиров и определение типов людей, которые имеют высокие шансы выжить при кораблекрушении
Предсказание уровня неудовлетворенности клиентов и определения ключевых факторов, влияющих на низкий уровень удовлетворенности
RMSLE — среднеквадратичная логарифмическая ошибка. Для вычисления необходимо взять логарифм прогнозов модели и целевых значений, затем рассчитать среднеквадратичное отклонение между ними
Accuracy — показатель, который описывает общую точность предсказания модели по всем классам. Accuracy рассчитывается как отношение количества правильных прогнозов к их общему количеству
AUC — показетель, позволяющий оценить качество бинарной классификации; отображает соотношение между долей объектов от общего количества носителей признака, верно классифицированных как несущие признак, и долей объектов от общего количества объектов, не несущих признака, ошибочно классифицированных как несущие признак
Время обучения модели и выбор наилучшего алгоритма
NovaML
Data Science-специалисты медиана Kaggle Leaderboard
NovaML
Data Science-специалисты медиана Kaggle Leaderboard
NovaML
Data Science-специалисты медиана Kaggle Leaderboard
Оценка эффективности маркетинга
Классификация химических веществ
Biodegradation
стремится к 1.00
Accuracy
0.86
0.80
0.78
0.75
0.81
Определение рельефа местности
Hill-Valley
стремится к 1.00
Accuracy
0.85
0.86
0.83
0.87
0.78
Bank marketing
стремится к 1.00
Accuracy
0.92
0.84
0.81
0.80
0.78
0.2 mb
0.8 mb
3.9 mb
Выявление оптимальных маркетинговых стратегий для финансовых институтов (например, оценка эффективности таргетной рекламы в социальных сетях)
Accuracy — показатель, который описывает общую точность предсказания модели по всем классам. Accuracy рассчитывается как отношение количества правильных прогнозов к их общему количеству
Распознавание биоразлагаемых химических веществ
Построение предиктивной модели, определяющей холмистую местность и впадины в рельефе
Оценка стоимости недвижимости
Предсказание дождливой погоды
Australian
стремится к 1.00
Accuracy
0.87
Error
0.92
0.90
Error
Предсказание времени для испытаний
Mercedes-Benz
стремится к 1.00
R2
0.543
0.547
0.543
0.540
n/a
House Prices
стремится к 0.00
RMSLE
0.12
0.27
0.13
0.16
n/a
0.1 mb
0.4 mb
1 mb
Определение цены и ключевых факторов, влияющих на оптимальную цену продажи
RMSLE — среднеквадратичная логарифмическая ошибка. Для вычисления необходимо взять логарифм прогнозов модели и целевых значений, затем рассчитать среднеквадратичное отклонение между ними
Прогнозирование дождя на следующий день в Австралии
Прогнозирование времени, необходимого для тестовых испытаний автомобиля
Accuracy — показатель, который описывает общую точность предсказания модели по всем классам. Accuracy рассчитывается как отношение количества правильных прогнозов к их общему количеству
R2 — показатель, который показывает, какую часть дисперсии (изменчивости) наблюдаемой переменной можно объяснить с помощью построенной модели
В среднем на 5% выше качество предсказаний, чем у конкурентов
NovaML показывает качество предсказаний на уровне технологических гигантов, сочетая в себе удобство no-code площадок
Оценка эффективности маркетинга
Bank marketing 3.9 mb
стремится к 1.00
Accuracy
Критерий кач-ва:
Метрика:
Датасет:
0.92
0.78
NovaML
Obviously.ai
0.80
Microsoft Azure
0.81
AWS Automl
0.84
Google Automl
Выявление оптимальных маркетинговых стратегий для финансовых институтов (например, оценка эффективности таргетной рекламы в социальных сетях)
Accuracy — показатель, который описывает общую точность предсказания модели по всем классам. Accuracy рассчитывается как отношение количества правильных прогнозов к их общему количеству
Классификация химических веществ
Biodegradation 0.2 mb
стремится к 1.00
Accuracy
Критерий кач-ва:
Метрика:
Датасет:
0.86
0.81
NovaML
Obviously.ai
0.75
Microsoft Azure
0.78
AWS Automl
0.80
Google Automl
Распознавание биоразлагаемых химических веществ
Определение рельефа местности
Hill-Valley 0.8 mb
стремится к 1.00
Accuracy
Критерий кач-ва:
Метрика:
Датасет:
0.85
0.78
NovaML
Obviously.ai
0.87
Microsoft Azure
0.83
AWS Automl
0.86
Google Automl
Построение предиктивной модели, определяющей холмистую местность и впадины в рельефе
Оценка стоимости недвижимости
House Prices 1 mb
стремится к 0.00
RMSLE
Критерий кач-ва:
Метрика:
Датасет:
0.12
n/a
NovaML
Obviously.ai
0.16
Microsoft Azure
0.13
AWS Automl
0.27
Google Automl
Определение цены и ключевых факторов, влияющих на оптимальную цену продажи
RMSLE — среднеквадратичная логарифмическая ошибка. Для вычисления необходимо взять логарифм прогнозов модели и целевых значений, затем рассчитать среднеквадратичное отклонение между ними
Предсказание дождливой погоды
Australian 0.1 mb
стремится к 1.00
Accuracy
Критерий кач-ва:
Метрика:
Датасет:
0.87
Error
NovaML
Obviously.ai
0.90
Microsoft Azure
0.92
AWS Automl
Error
Google Automl
Прогнозирование дождя на следующий день в Австралии
Предсказание времени для испытаний
Mercedes-Benz 0.4 mb
стремится к 1.00
R2
Критерий кач-ва:
Метрика:
Датасет:
0.543
n/a
NovaML
Obviously.ai
0.540
Microsoft Azure
0.543
AWS Automl
0.547
Google Automl
Прогнозирование времени, необходимого для тестовых испытаний автомобиля
R2 — показатель, который показывает, какую часть дисперсии (изменчивости) наблюдаемой переменной можно объяснить с помощью построенной модели
Результаты решения задач по предиктивной аналитике Data Science-специалистами (Kaggle competitions) в сравнении с NovaML
NovaML: результаты на уровне лучших мировых аналогов
Получение результата в 2500 раз быстрее: оптимизация времени позволяет быстро проводить проверку гипотез и построение моделей машинного обучения
Качество предиктивных моделей, построенных NovaML, сопоставимо с качеством работы моделей, построенных Data Science-специалистами
Оценка стоимости недвижимости
House Prices 1 mb
стремится к 0.00
RMSLE
0.12
0.15
Критерий кач-ва:
Метрика:
Датасет:
3 мин.
4 нед.
Определение цены и ключевых факторов, влияющих на оптимальную цену продажи
RMSLE — среднеквадратичная логарифмическая ошибка. Для вычисления необходимо взять логарифм прогнозов модели и целевых значений, затем рассчитать среднеквадратичное отклонение между ними
Время обучения модели и выбор наилучшего алгоритма
NovaML
Data Science-специалисты медиана Kaggle Leaderboard
Оценка уровня удовлетворенности
Santander Cust. Sat 120 mb
стремится к 1.00
AUC
0.83
0.83
Критерий кач-ва:
Метрика:
Датасет:
18мин.
2 мес.
Предсказание уровня неудовлетворенности клиентов и определения ключевых факторов, влияющих на низкий уровень удовлетворенности
AUC — показетель, позволяющий оценить качество бинарной классификации; отображает соотношение между долей объектов от общего количества носителей признака, верно классифицированных как несущие признак, и долей объектов от общего количества объектов, не несущих признака, ошибочно классифицированных как несущие признак
NovaML
Data Science-специалисты медиана Kaggle Leaderboard
Прогноз выживаемости пассажиров
Titanic 0.1 mb
стремится к 1.00
Accuracy
0.77
0.78
Критерий кач-ва:
Метрика:
Датасет:
4 мин.
2 нед.
Построение предиктивной модели выживаемости пассажиров и определение типов людей, которые имеют высокие шансы выжить при кораблекрушении
Accuracy — показатель, который описывает общую точность предсказания модели по всем классам. Accuracy рассчитывается как отношение количества правильных прогнозов к их общему количеству
NovaML
Data Science-специалисты медиана Kaggle Leaderboard
Результаты решения задач по предиктивной аналитике Data Science-специалистами (Kaggle competitions) в сравнении с NovaML
NovaML: результаты на уровне лучших мировых аналогов
Мы воспользовались Nova ML для того, чтобы обработать неупорядоченные данные. Некорректные и недостающие данные обрабатываются автоматически, что экономит массу времени и сил. С нетерпением ждем, когда Nova ML сможет работать и с текстом.
Андрей Кармазин Technical Unit Leader, Avito
Nova ML экономит массу времени и ресурсов. С помощью платформы мы запустили сразу несколько пилотных проектов, что было бы сложно реализовать без автоматизации анализа данных.
Кристина Романеску Senior Contract Manager, Grup Servicii Petroliere
Прогнозирование спроса, основанное только на нашем бизнес-опыте, проигрывает на фоне результатов, которые показывает Nova ML. Теперь наши модели учитывают сотни взаимосвязанных корреляций, чего ранее не удавалось достичь.
Вадим Свястиньш After Sales Manager, Jungheinrich Lift Truck SIA
Nova ML помог проанализировать важность факторов процесса производства и построить предиктивные модели анализа запланированных бизнес-изменений.
Ларс Андерсен Senior Business Architect, Teracom Samhällsnät
Автоматизированное машинное обучение в один клик привнесло новые и неожиданные инсайты в наш маркетинговый пайплайн. Nova ML действительно делает предиктивную аналитику ближе к бизнесу, чем когда-либо.
Елена Резник-Орская Chief Operations Officer, William Hill
Nova ML предоставляет мгновенный доступ к расширенной предиктивной аналитике для любого применения и набора навыков. Использование платформы сэкономило нам значительное количество человеческих и денежных ресурсов.
Гэри Шивон Lineman, NextEra Energy
Не думал, что работа с машинным обучением может быть столь увлекательной. Эти ребята превратили скучный статистический анализ в отличное настоящее приключение. С Nova ML машинное обучение становится доступным инструментом для каждого.
Маскуд Алиев Deputy Director, North West Logistics LLC
Как работает платформа?
Тарифы
Индивидуальные планы
Корпоративный доступ
Стоимость услуг зависит от условий использования и определяется дополнительно в договоре с клиентом
Стоимость услуг зависит от объема и частоты использования платформы, определяется дополнительно в договоре с клиентом