Рецензия на книгу “Базовая математика для искусственного интеллекта”

Сегодня обзор новой книги по математическому аппарату ИИ — для всех вовлеченных в анализ данных и построение ML/DL моделей. «Базовая математика для искусственного интеллекта» (Essential Math for AI: Next‑Level Mathematics for Efficient and Successful AI Systems) от издательства O’Reilly Media, в переводе от БХВ Петербург — это фолиант на 600 стр. для дата-сайентистов всех уровней. Полезность книги — в обширном материале по мат.аппарату ИИ, собранном в одном месте.
“For all those exploring the value in AI systems this book is a must have“, — из рецензии читателя на Амазон.

Вот ссылка на страницу книги “Базовая математика для искусственного интеллекта” на сайте БХВ. Напомним, на все книги по компьютерным технологиям от издательств “БХВ Петербург”,” Alist” и “Фолиант” доступен промокод SSPSOFT на скидку 25% как подарок читателям Хабра от нашего блога.

Кстати, есть возможность прочесть книгу в оригинале на английском языке и не покупая на Амазон (т.е. бесплатно). Вот ссылка на ресурс documen.pub, где можно скачать электронную версию книги Essential Math for AI: Next-Level Mathematics for Efficient and Successful AI Systems в формате PDF.

Хала Нельсон — автор с необычной судьбой

Ливанка по происхождению, Хала Нельсон (Hala Nelson) прошла сложный жизненный путь, прежде стать преподавателем по прикладной математике в сфере искусственного интеллекта (ИИ).
В своем блоге она вспоминает детство, полное лишений и опасностей, с израильскими бомбардировками и блок-постами. В 20-летнем возрасте автор смогла получить приглашение на учебу в США, что открыло дорогу к занятиям математикой на профессиональном уровне.

А вот как Хала Нельсон описывает начало своего пути в математику: «Когда я росла, мой отец приносил большую оранжевую книгу с очень мелким шрифтом, полную математических задач, написанных на французском языке. Я сидела рядом с ним у нашей железной печи, и он читал мне французские задачи, а затем я переводила их на английский и решала их. Мне нравился его акцент и возмутительно неправильное произношение, когда он пытался сам переводить на английский язык математику. Я решала все задачи в этой книге при свете свечи, так как у нас почти никогда не было электричества. Это мои первые воспоминания о серьезной математике: с моим отцом, большой оранжевой французской книгой, теплом от старой железной печи и свечей.»

Сегодня Хала Нельсон занимает должность профессора в департаменте математики Университета Джеймса Мэдисона (James Madison University) в Вирджинии, США.

Почему изучение математического аппарата ИИ достойно внимания дата-сайентистов

Современные разработчики избалованы интегрированными средами и визуальными инструментами, поэтому чистая математика из этой книги у многих вызовет «зубную боль» и желание отложить получение таких знаний до момента, «пока не прижмет». Однако, не обманывайте себя — в этот самый момент у вас не будет достаточно времени на изучение сложного математического аппарата, лежащего в основе ИИ. Гораздо проще создать для себя некоторое расписание и не спеша двигаться по главам книги. Благо основы мат.аппарата ИИ не меняются так быстро как инструменты ML/DL на основе ПО.

Конечно, владение рядом инструментов, таких как PyTorch и Scikit-Learn, — важно для практической работы дата-сайентистов. Но одного этого знания недостаточно для полноценного понимания и эффективного применения моделей машинного обучения и искусственного интеллекта. Эти библиотеки предоставляют мощные абстракции, которые позволяют быстро реализовывать сложные алгоритмы, но без понимания математических основ, лежащих в их основе, специалисты по данным рискуют использовать их как «черные ящики».

Именно знание математических основ позволяет дата-сайентистам выходить за рамки готовых решений, предлагаемых библиотеками. Они могут модифицировать существующие алгоритмы или создавать новые, оптимизированные под конкретные задачи. Например, понимание принципов оптимизации помогает правильно выбирать и настраивать функции потерь и оптимизаторы в нейронных сетях, что может значительно улучшить производительность модели.

Математическая основа также критична для понимания ограничений и допущений, лежащих в основе различных алгоритмов. Это помогает выбирать наиболее подходящие методы для конкретных задач и данных, а также оценивать потенциальные риски и ограничения выбранных подходов.

Наконец, быстрое развитие области искусственного интеллекта и науки о данных требует от специалистов постоянного обучения и адаптации к новым методам и алгоритмам. Прочная математическая база облегчает понимание новых концепций и позволяет быстрее осваивать новые инструменты и техники, что критически важно для поддержания личной конкурентоспособности на рынке труда в этой динамичной области.

Что полезного в главах

В этом разделе вы найдете аннотации к главам книги «Базовая математика для искусственного интеллекта» Халы Нельсон. Чтобы не отнимать слишком много времени, мы сделали аннотации совсем короткими. Оглавление книги для русского издания можно найти здесь, а для английского — здесь.

Глава 1. Почему важно изучать математику ИИ?Эта глава введет вас в мир ИИ, рассматривая его основы и значимость математики в этой области. Дата-сайентистам важно понимать, как математические концепции лежат в основе ИИ и помогают решать сложные задачи, начиная от обработки данных до разработки интеллектуальных агентов.

Глава 2. Данные, данные, и еще раз данныеГлава посвящена основам работы с данными, включая их сбор, анализ и моделирование. Знание распределений данных и вероятностных моделей важно для дата-сайентистов, так как они часто работают с большими наборами данных, требующими сложных аналитических подходов для извлечения значимых зависимостей.

Глава 3. Подгонка функций под данныеЗдесь рассматриваются методы регрессии и классификации, включая такие модели, как логистическая регрессия и метод опорных векторов. Эти модели являются основой машинного обучения и позволяют дата-сайентистам строить предсказательные модели на основе данных.

Глава 4. Оптимизация нейронных сетей Глава охватывает различные аспекты оптимизации нейронных сетей, включая градиентный спуск, регуляризацию и нормализацию. Для дата-сайентистов эти методы важны для настройки и улучшения производительности нейронных сетей, что критично для разработки высокоэффективных ИИ-систем.

Глава 5. Сверточные нейронные сети и компьютерное зрениеЗдесь рассматриваются свёрточные нейронные сети (CNN) и их применение в компьютерном зрении. Дата-сайентисты используют CNN для задач распознавания образов и классификации изображений, что является одним из востребованных направлений ИИ.

Глава 6. Декомпозиция сингулярных значений: Обработка изображений, обработка естественного языка и социальные медиаГлава описывает сингулярное разложение матриц (SVD) и его применение в обработке изображений, анализа текста и социальных сетей. SVD важен для дата-сайентистов, так как он помогает в сжатию данных, уменьшении размерности и выделении значимых признаков.

Глава 7. ИИ для естественного языка и финансов: векторизация и временные рядыЭта глава исследует методы векторизации текста и анализ временных рядов, применяемые в обработке естественного языка и финансовом анализе. Дата-сайентисты, работающие с текстовыми данными или временными рядами, найдут эти методы полезными для моделирования и предсказаний.

Глава 8. Вероятностные генеративные моделиВ главе обсуждаются вероятностные генеративные модели, включая GANs и вариационные автокодировщики. Эти модели важны для создания новых данных, симуляции и других творческих задач, что делает их ценными для дата-сайентистов, работающих в области генеративного ИИ.

Глава 9. Графовые моделиГлава посвящена графовым моделям и их применению в различных областях, таких как социальные сети, биология и рекомендации. Для дата-сайентистов это важная тема, так как графы используются как инструмент для моделирования сложных взаимосвязей в данных.

Глава 10. Исследование операцийВ этой главе рассмотрены методы операционного исследования, такие как линейное программирование и теория игр. Эти методы помогают оптимизировать сложные системы и процессы, что полезно для дата-сайентистов, работающих над улучшением эффективности решений.

Глава 11. ВероятностьГлава углубляется в теорию вероятностей, включая стохастические процессы и марковские цепи. Эти концепции важны для дата-сайентистов, так как они лежат в основе многих алгоритмов ML/DL.

Глава 12. Математическая логикаОбсуждаются различные логические структуры и их применение в ML. Для дата-сайентистов понимание математической логики помогает в построении моделей, которые могут рассуждать и принимать решения на основе сложных правил.

Глава 13. Искусственный интеллект и дифференциальные уравненияГлава исследует использование дифференциальных уравнений в частных производных (PDE) в контексте ИИ. Эти уравнения применяются в моделировании физических процессов, и знание их решений важно для дата-сайентистов, работающих над интеграцией физических моделей в ИИ.

Глава 14. Искусственный интеллект, этика, математика, право и политикаЗаключительная глава рассматривает вопросы этики, закона и политики в области ИИ. Дата-сайентистам важно понимать эти аспекты, чтобы создавать ИИ-системы, которые соответствуют нормативным требованиям и этическим стандартам.

О терминах AI, ML, DL в книге

Как нам показалось, в книге присутствует несколько вольное смешение терминов AI, ML и DL. Возможно, частое упоминание термина ИИ (AI) сделано для лучшего маркетинга. Поэтому желательно пояснить разницу между терминами.

Терминология: AI — это общий термин для всех методов создания ИИ-систем (сюда даже включают чат-боты, распознавание голоса и т.д.), тогда как ML и DL — это более узкие и строгие области в рамках AI ,связанные с моделями анализа данных.
Модели: ML основывается на обучении систем с помощью данных для выполнения конкретных задач, а DL использует сложные нейронные сети для работы с очень сложными задачами.
Как используют термины: AI может использоваться для описания или идентификации любых ИИ-систем, от простых до сложных. ML применяется, когда системы должны учиться на данных, а DL используется для наиболее сложных задач, требующих анализа больших объемов данных.

Таким образом, AI — это такой общий зонтичный термин, под которым находятся ML и DL, и где ML и DL представляют собой конкретные методы для построения систем искусственного интеллекта, с DL, как более продвинутой формой ML, ориентированной на нейронные сети и работу с большими данными.

Заключение

Если вы решите приобрести русское издание или скачаете английский оригинал, попробуйте работать над этой книгой хотя бы по несколько часов в неделю, пусть и на протяжении года. Это проверенная практика, когда надо изучить сложную тему, не выгорев по пути и не ограничивая себя по времени.

Знание основ математического аппарата имеет критическое значение для специалистов в области науки о данных, и книга «Базовая математика для искусственного интеллекта» Халы Нельсон помогает освоить эти знания. Математика является фундаментом, на котором строятся все алгоритмы и модели искусственного интеллекта и машинного обучения. Без глубокого понимания математических концепций дата-сайентисты рискуют использовать инструменты и методы, не полностью осознавая их возможности, ограничения и потенциальные подводные камни.

Добавим каплю рекламы от нашего блога: компания SSP SOFT приглашает на позиции инженеров QA и DevOps, системного аналитика, аналитика данных, разработчиков на Java, JS, React и Python, 1С — см. страницу на hh.ru. Если вашей специальности нет в текущих вакансиях, все равно присылайте резюме, т.к. новые позиции в командах открываются еженедельно (пишите в Telegram или на почту job@ssp-soft.com).

Успехов в изучении и практическом применении математики в AI, ML и DL!

ссылка на оригинал статьи https://habr.com/ru/articles/840570/