Математика для Data Science

После занятия Вы будете знать, зачем учить математику, что это даст, и какая польза от неё в мире Data Science.
Полный набор знаний высшей математики для старта в Data Science. Подготовка к собеседованию по математическим вопросам на Data Science позиции.

Математический анализ

Об основаниях математики. Законы формальной логики. Интуитивная теория множеств. Понятие функции (отображения). Понятие точной грани множества, её существование.
1. Введение
Определение числовой последовательности. Понятие предела числовой последовательности. Операции над последовательностями и их пределами. Критерий Коши сходимости последовательностей. Свойства монотонных последовательностей. Предельные точки последовательностей, их существование. Примеры.
2. Числовые последовательности
Понятие числовой функции. Определение предела числовой функции по Коши и по Гейне. Доказательство эквивалентности определений пределов. Примеры. Предел и арифметические операции. Сравнение пределов. О-символика. Асимптотическое сравнение функций в точке. Первый и второй замечательные пределы. Их следствия. Основные асимптотические эквивалентности. Применение эквивалентности к нахождению пределов.
3. Предел числовой функции
Определение непрерывности в точке и на множестве. Примеры. Непрерывность арифметических операций и композиции. Односторонняя непрерывность и классификация точек разрыва. Примеры. Свойства. Локальная ограниченность и сохранение знака. Теорема о промежуточных значениях непрерывной функции. Теоремы Вейерштрасса о максимуме и минимуме. Равномерная непрерывность, теорема Кантора-Гейне. Теорема об обратной функции.
4. Непрерывность числовой функции
Определение и физический смысл производной. Определение дифференцируемости. Эквивалентность определений. Дифференциал и производная. Их геометрический смысл. Необходимое условие дифференцируемости. Примеры. Теорема о производной композиции. Арифметические операции над дифференцируемыми функциями. Производная обратной функции. Производные высших порядков. Формула Лейбница. Вывод производных элементарных функций. Некоторые высшие производные элементарных функций.
5. Дифференцируемость числовой функции
Необходимое условие локального экстремума – теорема Ферма. Теорема Ролля о нуле производной. Формула конечных приращений Лагранжа. Геометрический смысл. Формула конечных приращений Коши. Правила Лопиталя раскрытия неопределённостей. О связи коэффициентов многочлена с его высшими производными. Формула Тейлора. Остаточные члены в форме Лагранжа и Пеано. Разложение некоторых функций по формуле Тейлора. Использование формулы Тейлора для приближённых вычислений.
6. Основные теоремы дифференциального исчисления
Понятие о первообразной. «Единственность» первообразной. Неопределённый интеграл и его свойства. Замена переменной в неопределённом интеграле. Следствия. Формула интегрирования по частям. Пример. Связь знака производной с поведением функции. Достаточные условия локального экстремума. Выпуклость функции и точки перегиба. Связь со второй производной. Асимптоты графика функции. Общая схема исследования функций. Численное дифференцирование. Формулы конечных разностей. Погрешность формул конечных разностей. Итерационные методы решения алгебраических уравнений. Методы бинарного поиска, секущих и Ньютона.
7. Различные вопросы дифференциального исчисления
Метрические пространства. Понятие шара. Предел последовательности в метрическом пространстве. Полнота. Внутренние и граничные точки. Открытые и замкнутые множества. Ограниченные, компактные и предкомпактные множества. Предел и непрерывность функции в метрических пространствах. Принцип сжимающих отображений. Понятие о линейных пространствах. Арифметические пространства. Норма в линейных пространствах. Примеры. Эквивалентность. Сходимость в арифметических пространствах. Свойства. Функции и функционалы многих переменных. Примеры. Теорема о промежуточных значениях непрерывного функционала. Теоремы Вейерштрасса о максимуме и минимуме.
8. Функции многих переменных
Дифференцируемость (производная по Фреше). Необходимое условие дифференцируемости по Фреше. Производная по направлению (производная Гато). Связь производной по направлению и градиента. Смысл градиента. Частные производные и матрица Якоби. Примеры. Дифференциал функции многих переменных, геометрический смысл. Производная композиции дифференцируемых функций. Высшие производные. Теорема о равенстве смешанных производных. Формула Тейлора для функций многих переменных. Необходимое условие локального экстремума функционала. Матрица Гессе и достаточное условие локального экстремума. Понятие об условном экстремуме. Примеры. Метод градиентного спуска. Его вариации. Теорема сходимости.
9. Дифференцируемость функций многих переменных
Интегральное исчисление. Понятие разбиения. Интегральные суммы (нижние, верхние). Определённый интеграл Римана числовой функции. Необходимое условие интегрируемости. Пример. Критерий Дарбу. Классы интегрируемых функций. Основные свойства интеграла Римана. Интеграл с переменным верхним пределом и первообразная. Формула Ньютона-Лейбница. Примеры. Формулы замены переменного и интегрирования по частям. Понятие меры Жордана многомерной фигуры. Площади и объёмы. Многомерные разбиения и интегральные суммы. Кратный интеграл Римана и его основные свойства. Формула замены переменного в кратном интеграле. Полярная замена. Сведение кратного интеграла к повторному. Расщепление интеграла. Примеры.
10. Интеграл Римана
Несобственные интегралы Римана I, II и III родов. Сходимость Н. И. Основные примеры несобственных интегралов I и II родов. Критерий Коши сходимости несобственного интеграла. I, II и частный признаки сравнения несобственных интегралов. Условная и абсолютная сходимость. Признак Дирихле-Абеля. Примеры несобственных интегралов. Главное значение несобственного интеграла. Примеры. Понятие длины параметрический кривой. Вычисление длин и площадей с помощью интеграла Римана. Вычисление интегралов средствами компьютерной техники. Основная идея классических квадратурных формул. Построение формулы трапеций и оценка её погрешности. Формулы прямоугольников, трапеций и Симпсона (парабол).
11. Вопросы интегрального исчисления
Числовой ряд и его сумма. Пример – геометрическая прогрессия. Критерий Коши сходимости числовых рядов. Гармонический ряд. Необходимое условие сходимости числового ряда. I и II признаки сравнения числовых рядов. Специальные признаки: Даламбера и Коши. Примеры. Признак Коши-Маклорена. Частный признак сравнения. Абсолютная и условная сходимость числовых рядов. Признаки Дирихле и Лейбница сходимости знакопеременных рядов. Вопрос «коммутативности» суммы ряда: теоремы Коши и Римана. Асимптотика частичных сумм числовых рядов. Функциональные ряды и последовательности. Примеры. Поточечная и равномерная сходимости. Эквивалентное определение. Критерий Коши равномерной сходимости. Признак Вейерштрасса равномерной сходимости. Свойства равномерного предела: непрерывность и интегрируемость. Дифференцирование функциональных рядов и последовательностей. Степенные ряды (ряды Тейлора). Теорема Коши-Адамара. Примеры.
12. Ряды
Алгебры и сигма-алгебры множеств. Примеры и свойства. Минимальная сигма-алгебра. Борелевская сигма-алгебра. Определение меры. Сигма-аддитивные меры. Свойства меры. Мера Жордана – не сигма-аддитивная мера. Другие примеры мер: считающая мера, дискретная вероятность. Определение и свойства одномерной меры Лебега. Измеримые функции и определение интеграла Лебега. Свойства интеграла Лебега. Критерий интегрируемости. Критерий Лебега интегрируемости функции по Риману. Сходимости в среднем, по мере и почти всюду, их связь. Теоремы Лебега, Леви и Фату. Интегрируемость по Лебегу функции Дирихле. Интеграл Лебега относительно считающей меры. Функциональные пространства L_p(X).
13. Теория меры и интеграла Лебега

Линейная алгебра

Операции над матрицами, их свойства. Элементарные преобразования и метод Гаусса приведения к ступенчатому виду. Системы линейных уравнений, метод Гаусса их решения.
1. Матрицы
Свойства определителя. Разложения определителя. Определитель произведения матриц. Метод Гаусса вычисления определителя.
2. Определитель матрицы
Свойства операции обращения. Вычисление обратной матрицы с помощью элементарных преобразований строк. Правило Крамера решения систем линейных уравнений.
3. Обратная матрица, ее явный вид
Фундаментальная система решений. Векторное пространство, его базис и размерность, координаты вектора. Линейные подпространства и линейные многообразия.
4. Однородные и неоднородные системы линейных уравнений – геометрический подход
Линейная зависимость системы строк (столбцов) матрицы, базис и ранг. Ранг матрицы, определение ранга через миноры. Основная теорема о линейной зависимости. Ранг произведения матриц. Метод Гаусса вычисления ранга. Критерии совместности и определенности систем линейных уравнений в терминах ранга.
5. Линейная зависимость в векторном пространстве
Геометрическое изображение, алгебраическая и тригонометрическая формы. Формула Муавра, извлечение корня из комплексного числа.
6. Комплексные числа
Сопряженное отображение, свойства его ядра и образа. Специальные классы отображений: ортогональные операторы, самосопряженные операторы.
10. Отображения в евклидовых пространствах
Матрица линейного отображения и ее изменение при переходе к другому базису. Образ и ядро линейного отображения, связь между их размерностями.
7. Линейные отображения (операторы)
Характеристический определитель. Собственные подпространства, алгебраическая и геометрическая кратности собственного значения. Операторы простой структуры и диагонализуемые матрицы.
8. Собственные значения и собственные векторы линейных отображений
Скалярное произведение, длина вектора, неравенство Коши-Буняковского. Ортогональные базисы. Метод ортогонализации Грама-Шмидта. Задачи минимизации в евклидовом пространстве, ортогональное дополнение, ортогональная проекция вектора.
9. Евклидовы пространства
Матрицы билинейной формы и ее изменение при переходе к другому базису. Симметричные билинейные формы и квадратичные формы. Канонический вид квадратичной формы, закон инерции. Положительно определенные матрицы, критерий Сильвестра положительной определенности.
11. Билинейные формы

Комбинаторика

    Правило подсчета количества комбинаторных объектов. Принцип Дирихле. Примеры.
    1. Основные правила комбинаторики
    Круги Эйлера, операции на множествах. Формула включений и исключений. Примеры.
    2. Множества
    Размещения, перестановки и сочетания. Бином Ньютона. Треугольник Паскаля. Сочетания с повторениями.
    3. Сочетания

    Теория вероятностей
    и математическая статистика

    Основные понятия теории вероятностей. Определение вероятностного пространства, простейшие дискретные случаи (выборки с порядком и без него, упорядоченные и неупорядоченные), классическая вероятностная модель. Объяснить, что такое вероятность случайного события и научить вычислять вероятности сложных событий. Независимость событий. Попарная независимость и независимость в совокупности.
    1. Случайные события
    Познакомиться с главным объектом, который изучает теория вероятностей: узнать, что такое случайные величины, для чего они нужны и какие у них есть характеристики. Функция распределения.
    2. Случайные величины
    Теорема Байеса. Независимость случайных величин.
    3. Совместное распределение, условное распределение.
    Определение математического ожидания, дисперсии, ковариации и корреляции, их свойства.
    4. Математическое ожидание, дисперсия, корреляци
    Познакомиться с законами распределения, часто встречающимися при математическом моделировании реальных явлений; научиться моделировать случайные величины с нужным законом распределения на компьютере. Стандартные дискретные и непрерывные распределения, их математические ожидания, дисперсии и свойства. биномиальное, равномерное, нормальное, пуассоновское, показательное, геометрическое. Домашние задания: Случайные события и величины
    5. Основные законы распределения
    Оценивать неизвестные величины по наблюдениям и узнать какими свойствами должны обладать хорошие оценки.
    7. Точечные оценки и их свойства
    Моделировать случайные величины с нужным законом распределения на компьютере. Основные теоремы теории вероятностей. Неравенство Чебышева. Закон больших чисел. Центральная предельная теорема.
    6. Моделирование случайных величин
    Выборочные характеристики проанализировать, какое распределение будет выявлено на выборочных данных. Домашние задания: Моделирование случайных величин. Вычисление выборочных характеристик
    8. Интервальные оценки
    Объяснить в чём заключается задача проверки статистической гипотезы и как правильно сформулировать ответ в этой задаче, как принимается решение, принять гипотезу или отвергнуть.
    9. Проверка гипотез
    Ознакомиться с двумя видами гипотез, которые проверяются при A/B-тестировании и разобрать критерии их проверки.
    10. Проверка гипотез при A/B тестировании
    Не путать разные виды зависимостей, не делать поспешные выводы о наличии причинно-следственной связи между признаками; исследовать зависимость пары номинальных признаков с помощью проверки гипотез и нормированных коэффициентов связи. Проверка гипотез
    11. Исследование зависимостей
    Применение теоремы Гаусса-Маркова, а также основные виды регрессий для построения прогнозов на основе зависимостей между признаками.
    12. Регрессии

    Темы дополнительных сессий

    На них мы обсуждаем применение высшей математики в дата сайенс.
    Word2vec
    Градиентный спуск
    Backpropagation
    Случайный лес


    Классификация наблюдений: логистическая и пробит регрессии

    Метод ближайших соседей (KNN)
    Классификация наблюдений: байесовский классификатор

    Итоговое занятие

    Подведем итоги нашего курса, в том числе завершим обсуждение линейных регрессионных моделей, свойства оценок коэффициентов и способов их построения.