Читать онлайн Математика для DATA SCIENTIST. Анализ данных и математическое моделирование (путеводитель) бесплатно
© Леонид Гербертович Никифоров, 2021
ISBN 978-5-0053-4495-3
Создано в интеллектуальной издательской системе Ridero
Математика (Математическое обучение) для DATA SCIENTIST
Предисловие
Когда спрашивают – зачем DATA SCIENTIST’у дифференциальные уравнения, можно вспомнить графики Курта Воннегута в координатах (время по оси Х, уровень счастья-несчастья по оси Y).
https://www.youtube.com/watch?v=EEL-PIZVO08
Например, постепенное затухание жизненных сил описывается кратко и понятно одной формулой exp (-k* t), которую сразу видно на графике, где t – время, а что может быть понятнее этой переменной? Или атомный взрыв- той же экспонентой, только с положительным аргументом exp (k*t), качания на качелях или супружескую эмоциональную жизнь – одним уравнением x’' = – k*x. И траекторией y= sin (t). Как тут не вспомнить один из лучших учебников по Микроэкономике Вэриана, где автор долго и добросовестно уговаривает американцев выучить производные, чтобы одной строчкой записывать то, что иначе надо на целую страницу разъяснять.
Совсем недавно мне нужно было консультировать магистерскую диссертацию по «Применение DATA SCIENCE в классификации архетипов американских киносценариев», там была взята за основу тройка хэппи-ендов и тройка трагедий в тех же координатах, что и у Курта Воннегута.
Теперь давайте предположим, что у нас есть случайная величина Z по всему сценарию как оценка (счастья-несчастья) в данный момент времени t. Ну и соответственно выборка Z (n). Как нам найти главного героя? Если есть только реплики? Я предложил ввести аналогичные Х1 (t), X2 (t) и т. д. Конечно, чтобы определить главного героя DATA SCIENCE будем вычислять ковариацию и/или корреляцию corr (Z, Xi). То есть достаточно всего одного числа – по выборке. А как определить врага главного героя? Надо искать отрицательную максимальную корреляцию. А если корреляция близка к нолю? Это кто, как вы думаете, Уважаемый Читатель? Вот вам и потребность в Теории вероятностей и Корреляционном анализе для DATA SCIENTIST.
Иногда также сомневаются в нужности Векторной алгебры и даже матриц, но это снимается теми соображениями, что бальшие массивы данных частно необходимо делить на блоки с малыми связями, как бы нарезать подмножества из всего большого множества. А также уметь смотреть под разными углами или с разных точек зрения. Но ведь это не что иное, как замена базиса пространства и определение ортогональных подпространств меньшей размерности. Вообще говоря, Линейная алгебра – должна быть в преподавании доведена до максимальной степени простоты и это только улучшает ее понимание учащимися.
Что касается предмета «Математический анализ бесконечно малых переменных величин», то мне трудно представить начинающего DATA SCIENTISTa, кто бы сомневался в необходимости этого фундаментального раздела высшей математики.
1. Алгебра
1.1 Комплексные числа. Геометрическое представление, алгебраическая и тригонометрическая форма записи, извлечение корней, корни из минус единицы.
1.2 Метод Жордано-Гаусса к системам линейных уравнений. Прямоугольные матрицы как способ представления систем линейных уравнений. Приведение матриц и систем линейных уравнений к ступенчатому виду. Самый простой и надежный метод.
1.3 Ранг матрицы. Линейная зависимость строк (столбцов). Основная лемма о линейной зависимости, базис и ранг системы строк (столбцов). Ранг матрицы. Критерий совместимости и определенности системы линейных уравнений в терминах рангов матриц. Фундаментальная система решений однородной системы линейных уравнений.