Аннотация на русском языке: Недавние споры по поводу уровня повторяемости поведенческих исследований, анализируемых с использованием статистических рассуждений, пробудили интерес к разработке более эффективных методов анализа результатов психологических экспериментов. Здесь мы утверждаем, что дополнение аналитического рабочего процесса психологических экспериментов аналитикой машинного обучения может максимизировать точность и минимизировать проблемы воспроизводимости. По сравнению со статистическим выводом, ML-анализ экспериментальных данных не зависит от модели и в основном фокусируется на прогнозировании, а не на выводе. Он также выделяет некоторые из потенциальных ловушек внедрения экспериментальной аналитики на основе машинного обучения. При неправильном использовании это может привести к аналогичным наблюдаемым чрезмерно оптимистичным оценкам точности с использованием статистических рассуждений. Средства от этих ловушек также представлены в виде моделей построения, основанных на перекрестной проверке и использовании ансамблевых моделей. Модели машинного обучения обычно считаются черными ящиками, и мы обсудим стратегии для более прозрачной визуализации прогнозов.
The summary in English: Recent controversy over the level of repeatability of behavioral studies analyzed using statistical reasoning has sparked interest in developing more effective methods for analyzing the results of psychological experiments. Here we argue that supplementing the analytical workflow of psychological experiments with machine learning analytics can maximize accuracy and minimize reproducibility problems. Compared to statistical inference, ML analysis of experimental data is model independent and mainly focuses on forecasting rather than inference. He also highlights some of the potential pitfalls of implementing experimental analytics based on machine learning. If misused, this can lead to similarly observed overly optimistic estimates of accuracy using statistical reasoning. The remedies for these pitfalls are also presented in the form of building models based on cross-validation and the use of ensemble models. Machine learning models are generally considered black boxes, and we will discuss strategies for more transparent visualization of predictions.
Ключевые слова:
ML, машина опорных векторов, наивный байесовский метод, Knn, случайный лес.
Key words:
ML, Support Vector Machine, Naive Bayes, Knn, Random Forest.