Родительские жанры
Соседние жанры
Теги
-
Теоретический минимум по Big Data. Всё что нужно знать о больших данных Анналин Ын
ISBN: 978-5-4461-1040-7 Год издания: 2019 Издательство: Питер Cегодня Big Data - это большой бизнес.
Нашей жизнью управляет информация, и извлечение выгоды из нее становится центральным моментом в работе современных организаций. Не важно кто вы - деловой человек, работающий с аналитикой, начинающий программист или разработчик, - "Теоретический минимум по Big Data" позволит разобраться в основах новой и стремительно развивающейся отрасли обработки больших данных.
Хотите узнать о больших данных и механизмах работы с ними? Каждому алгоритму посвящена отдельная глава, в которой не только объясняются основные принципы работы, но и даются примеры использования в реальных задачах. Большое количество иллюстраций и простые комментарии позволят легко разобраться в самых сложных аспектах Big Data.
"Отличная визуализация концепций машинного обучения позволяет «нетехнарям» интуитивно понять сложные абстрактные понятия. Это лаконичная и точная выжимка содержит теоретический минимум информации, необходимый для первого знакомства с Big Data."
Этан Чен, автор курса CS 102: Big Data, Стэнфордский университет
-
Изучаем SQL Линн Бейли
ISBN: 978-5-459-00421-2, 978-05962526849 Год издания: 2012 Издательство: Питер Язык: Русский В современном мире наивысшую ценность имеет информация, но не менее важно уметь этой информацией управлять. Эта книга посвящена языку запросов SQL и управлению базами данных. Материал излагается, начиная с описания базовых запросов и заканчивая сложными манипуляциями с помощью объединений, подзапросов и транзакций. Если вы пытаетесь разобраться в организации и управлении базами данных – эта книга будет отличным практическим пособием и предоставит вам все необходимые инструменты. Особенностью данного издания является уникальный способ подачи материала, выделяющий серию "Head First" издательства O'Reilly в ряду множества скучных книг,…
-
SQL за 10 минут Бен Форта
ISBN: 978-5-8459-1858-1, 978-0-672-33607-2 Год издания: 2014 Издательство: Вильямс Язык: Русский В книге SQL за 10 минут предлагаются простые и практичные решения для тех, кто хочет быстро получить результат. Проработав все 22 урока, на каждый из которых придется затратить не более 10 минут, вы узнаете обо всем, что необходимо для практического применения SQL. Приведенные в книге примеры подходят для IBM DB2, Microsoft Access, Microsoft SQL Server, MySQL, Oracle, PostgreSQL, SQLite, MariaDB и Apache OpenOffice Base.
Наглядные примеры помогут понять, как структурируются инструкции SQL.
Советы подскажут короткие пути к решениям.
Предупреждения помогут избежать распространенных ошибок.
Примечания предоставят дополнительные разъяснения.
Что можно узнать за 10 минут:
- основные инструкции SQL;
- создание сложных SQL-запросов с множеством предложений и операторов;
- извлечение, сортировка и форматирование данных;
- получение конкретных данных с помощью различных методов фильтрации;
- применение итоговых функций для получения сводных данных;
- объединение реляционных таблиц;
- добавление, обновление и удаление данных;
- создание и изменение таблиц;
- работа с представлениями, хранимыми процедурами и многое другое.
Бен Форта — директор департамента разработки в компании Adobe Systems. Автор множества бестселлеров, включая книги по базам данных, SQL и ColdFusion. Имеет большой опыт в проектировании баз данных и разработке приложений.
-
Искусство статистики. Как находить ответы в данных Дэвид Шпигельхалтер
ISBN: 978-5-00169-250-8 Год издания: 2020 Издательство: Манн, Иванов и Фербер Язык: Русский Как статистика помогает нам лучше понимать мир? И как можно приходить к уверенным умозаключениям, когда у нас нет идеальных и полных данных?
На эти вопросы отвечает «Искусство статистики» — одна из самых содержательных и при этом доступных книг по теме. С блестящими примерами, интересным изложением, наглядными графиками, определениями, формулами и программным кодом в приложениях.
Статистика играла ключевую роль для научного познания мира на протяжении веков, а в эпоху больших данных базовое понимание этой дисциплины и статистическая грамотность становятся критически важными.
Специалист с огромным опытом Дэвид Шпигельхалтер познакомит вас с ключевыми принципами и показателями, которые помогают извлекать из данных знания о мире и отвечать на вопросы о нем. Он делает это на примерах из реальной жизни, показывая, как статистика способна помочь определить самого удачливого пассажира на Титанике, выяснить, можно ли было раскрыть серийного убийцу Гарольда Шипмана раньше, рассчитать количество деревьев на нашей планете, определить необходимое количество участников для достоверного медицинского исследования, вычислить количество безработных в стране и ответить на десятки других вопросов о нашем мире. Вопросов, на которые нельзя ответить без применения статистики. -
Apache Kafka. Потоковая обработка и анализ данных Ния Нархид
ISBN: 978-5-4461-0575-5 Год издания: 2019 Издательство: Питер Язык: Русский При работе любого enterprise-приложения образуются данные: это файлы логов, метрики, информация об активности пользователей, исходящие сообщения и т.п. Правильные манипуляции над всеми этими данными не менее важны, чем сами данные. Если вы - архитектор, разработчик или выпускающий инженер, желающий решать подобные проблемы, но вы пока не знакомы с Apache Kafka, то именно из этой замечательной книги вы узнаете, как работать с этой свободной потоковой платформой, позволяющей обрабатывать очереди данных в реальном времени. -
Data Science. Наука о данных с нуля Джоэл Грас
Год издания: 2017 Издательство: БХВ-Петербург Книга позволяет изучить науку о данных (Data Science) и применить полученные знания на практике. Она написана так, что способствует погружению в Data Science аналитика, фактически не обладающего глубокими знаниями в этой прикладной дисциплине. В объемах, достаточных для начала работы в области Data Science, книга содержит интенсивный курс языка Python, элементы линейной алгебры, математической статистики, теории вероятностей, методов сбора, очистки, нормализации и обработки данных. Даны основы машинного обучения. Описаны различные математические модели и их реализация по методу k ближайших соседей, наивной байесовской классификации,…
-
Роман с Data Science. Как монетизировать большие данные Роман Зыков
Год издания: 2021 Язык: Русский Как выжать все из своих данных? Как принимать решения на основе данных? Как организовать анализ данных (data science) внутри компании? Кого нанять аналитиком? Как довести проекты машинного обучения (machine learning) и искусственного интеллекта до топового уровня? На эти и многие другие вопросы Роман Зыков знает ответ, потому что занимается анализом данных почти двадцать лет. В послужном списке Романа – создание с нуля собственной компании с офисами в Европе и Южной Америке, ставшей лидером по применению искусственного интеллекта (AI) на российском рынке. Кроме того, автор книги создал с нуля аналитику в Ozon.ru.
Эта книга предназначена для думающих читателей, которые хотят попробовать свои силы в области анализа данных и создавать сервисы на их основе. Она будет вам полезна, если вы менеджер, который хочет ставить задачи аналитике и управлять ею. Если вы инвестор, с ней вам будет легче понять потенциал стартапа. Те, кто «пилит» свой стартап, найдут здесь рекомендации, как выбрать подходящие технологии и набрать команду. А начинающим специалистам книга поможет расширить кругозор и начать применять практики, о которых они раньше не задумывались, и это выделит их среди профессионалов такой непростой и изменчивой области. Книга не содержит примеров программного кода, в ней почти нет математики.
К данной аудиокниге прилагается PDF-файл, рекомендованный для скачивания. Файл важен для лучшего понимания и усвоения книги. -
Скрапинг веб-сайтов с помощью Python Райан Митчелл
Год издания: 2016 Издательство: ДМК пресс Язык: Русский Изучите методы скрапинга и краулинга веб-сайтов, чтобы получить доступ к неограниченному объему данных в любом уголке Интернета в любом формате. С помощью этого практического руководства вы узнаете, как использовать скрипты Python и веб-API, чтобы одновременно собрать и обработать данные с тысяч или даже миллионов веб-страниц.
Идеально подходящая для программистов, специалистов по безопасности и веб-администраторов, знакомых с языком Python, эта книга знакомит не только с основными принципами работы веб-скраперов, но и углубляется в более сложные темы, такие как анализ сырых данных или использование скраперов для тестирования интерфейса веб-сайта. Примеры программного кода, приведенные в книге, помогут разобраться в этих принципах на практике. -
Основы Data Science и Big Data. Python и наука о данных Дэви Силен
ISBN: 978-5-496-02517-1 Год издания: 2017 Издательство: Питер Язык: Русский Data Science - это совокупность понятий и методов, позволяющих придать смысл и понятный вид огромным объемам данных.
Каждая из глав этой книги посвящена одному из самых интересных аспектов анализа и обработки данных. Вы начнете с теоретических основ, затем перейдете к алгоритмам машинного обучения, работе с огромными массивами данных, NoSQL, потоковым данным, глубокому анализу текстов и визуализации информации. В многочисленных практических примерах использованы сценарии Python.
Обработка и анализ данных - одна из самых горячих областей IT, где постоянно требуются разработчики, которым по плечу проекты любого уровня, от социальных сетей до обучаемых систем. Надеемся, книга станет отправной точкой для вашего путешествия в увлекательный мир Data Science.
-
Шаблоны корпоративных приложений Фаулер М.
ISBN: 978-5-8459-1611-2 Год издания: 2009 Издательство: Вильямс Язык: Русский Создание компьютерных систем - дело далеко не простое. По мере того как возрастает их сложность, процессы конструирования соответствующего программного обеспечения становятся все более трудоемкими, причем затраты труда растут экспоненциально. Как и в любой профессии, прогресс в программировании достигается исключительно путем обучения, причем не только на ошибках, но и на удачах - как своих, так и чужих. Книга дает ответы на трудные вопросы, с которыми приходится сталкиваться всем разработчикам корпоративных систем. Автор, известный специалист в области объектно-ориентированного программирования, заметил, что с развитием технологий базовые принципы проектирования и решения общих проблем остаются неизменными, и выделил более 40 наиболее употребительных подходов, оформив их в виде типовых решений. Результат перед вами - незаменимое руководство по архитектуре программных систем для любой корпоративной платформы. Это своеобразное учебное пособие поможет вам не только усвоить информацию, но и передать полученные знания окружающим значительно быстрее и эффективнее, чем это удавалось автору.
Книга предназначена для программистов, проектировщиков и архитекторов, которые занимаются созданием корпоративных приложений и стремятся повысить качество принимаемых стратегических решений. -
Введение в системы баз данных К. Дж. Дейт
ISBN: 5-8459-0788-8, 0-321-19784-4 Год издания: 2006 Издательство: Вильямс Язык: Русский Новое издание фундаментального труда Криса Дейта представляет собой исчерпывающее введение в очень обширную в настоящее время теорию систем баз данных. С помощью этой книги читатель сможет приобрести фундаментальные знания в области технологии баз -
Введение в SQL Мартин Грабер
ISBN: 5-85582-010-6 Год издания: 2000 Издательство: Лори Язык: Русский Данное руководство поможет вам научиться: - применять команды SQL, необходимые для управления данными; - конструировать сложные запросы и подзапросы, а также создавать базы данных из составных таблиц; - проектировать эффективные базы данных, -
Практическая статистика для специалистов Data Science Питер Брюс
ISBN: 978-5-9775-3974-6 Год издания: 2018 Издательство: БХВ-Петербург Книга рассчитана на специалистов в области Data Science, обладающих некоторым опытом работы с языком программирования R и имеющих предварительное понятие о математической статистике. В ней в удобной и легкодоступной форме представлены ключевые понятия из статистики, которые относятся к науке о данных, а также объяснено, какие понятия важны и полезны с точки зрения науки о данных, какие менее важны и почему. Подробно раскрыты темы: разведочный анализ данных, распределения данных и выборок, статистические эксперименты и проверка значимости, регрессия и предсказание, классификация, статистическое машинное обучение и обучение без учителя. -
NoSQL. Новая методология разработки нереляционных баз данных Мартин Фаулер
ISBN: 978-5-8459-1920-5, 978-0-321-82662-6 Год издания: 2015 Издательство: Вильямс Язык: Русский Необходимость обрабатывать все более крупные объемы данных является одним из факторов, влияющих на внедрение нового класса нереляционных баз данных NoSQL. Сторонники баз NoSQL утверждают, что их можно использовать для создания более производительных, легче масштабируемых и проще программируемых систем.
Эта книга - краткое, но полное введение в быстро развивающуюся технологию NoSQL. Прамодкумар Дж.Садаладж и Мартин Фаулер объясняют, как работают базы данных NoSQL, и демонстрируют, в каких ситуациях они могут стать более успешной альтернативой традиционным системам RDMBS. Авторы излагают материал в быстром темпе, знакомя читателей с критериями, которые необходимо применять, чтобы принять правильное решение, стоит ли использовать базы NoSQL и какие технологии следует при этом выбирать.
Первая часть книги посвящена основным концепциям, включая неструктурированные модели данных, агрегаты, новые модели распределения, теорему САР и отображение-свертку. Во второй части авторы исследуют архитектурные и проектные вопросы, связанные с реализацией баз данных NoSQL. Они также описывают реалистичные сценарии использования, демонстрирующие работу баз данных NoSQL и возможности баз Riak, MongoDB, Cassandra и Neo4j.
Кроме того, основываясь на новаторской работе Прамодкумара Садаладжа, авторы книги показывают, как реализовать эволюционное проектирование на основе миграции схем - важный метод, необходимый для применения баз данных NoSQL. Книга завершается описанием новой эры многовариантной персистентности, открытой благодаря технологии NoSQL. В этом мире сосуществуют разнообразные базы данных, и архитектор может выбирать технологию, наилучшим образом подходящую для обеспечения любого вида доступа к данным. -
Oracle PL/SQL. Для профессионалов Стивен Фейерштейн
ISBN: 978-5-496-01152-5, 978-1-4493-2445-2 Год издания: 2015 Издательство: Питер Язык: Русский Данная книга является подробнейшим руководством по языку PL/SQL, представляющему собой процедурное языковое расширение для SQL. В ней детально рассмотрены основы PL/SQL, структура программы, основные принципы работы с программными данными, а также методика применения операторов и инструкций для доступа к реляционным базам данных. Большое внимание уделяется вопросам безопасности, влиянию объектных технологий на PL/SQL и интеграции PL/SQL с XML и Java.
За последние 18 лет, в течение которых переиздается эта книга, она стала незаменимым руководством по PL/SQL для сотен тысяч программистов, как начинающих, так и профессионалов. Шестое издание книги полностью обновлено под версию Oracle12c. -
Шаблоны реализации корпоративных приложений Кент Бек
ISBN: 978-5-8459-1406-4, 0-321-41309-1 Год издания: 2008 Издательство: Вильямс Язык: Русский -
Непрерывная интеграция Поль М. Дюваль
ISBN: 978-5-8459-1408-8 Год издания: 2008 Издательство: Вильямс Язык: Русский -
MongoDB в действии К. Бэнкер
ISBN: 978-5-97060-431-1 Год издания: 2016 Издательство: ДМК пресс Язык: Русский MongoDB – это документно-ориентированная база данных, предназначенная для гибкой, масштабируемой и очень быстрой работы даже при больших объемах данных. При ее проектировании изначально закладывалась высокая доступность, поддержка сложных динамических схем и простое распределение данных по нескольким серверам. Эта книга представляет собой введение в MongoDB и документно-ориентированную модель данных. Она дает не только общую картину, необходимую разработчику, но и достаточно деталей, чтобы удовлетворить системного инженера. Многочисленные примеры помогут обрести уверенность в области моделирования данных – вопросе, который необычайно важен для разработки ПО. Вам понравится углубленное изложение различных функциональных возможностей, в том числе репликации, автосегментирования и развертывания. -
Изучаем Spark. Молниеносный анализ данных Холден Карау
ISBN: 978-5-97060-323-9 , 978-1-449-35862-4 Год издания: 2015 Издательство: ДМК пресс Язык: Русский Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. С помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala.
Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения. -
Data Science. Инсайдерская информация для новичков Кэти О'Нил
ISBN: 978-5-4461-0622-6 Год издания: 2019 Издательство: Питер Data Science (исследование данных) - одна из самых востребованных специализаций нашего времени. Изучение данных позволяет преобразить любую традиционную или инновационную бизнес-модель. Эта книга основана на вводном курсе по Data Science из Колумбийского университета, и начинающему специалисту-аналитику она совершенно необходима.
Эта книга увлекательно и доступно рассказывает о:
- Байесовском методе;
- Статистических алгоритмах;
- Финансовом моделировании;
- Рекомендательных движках;
- Визуализации данных;
- MapReduce.
С примерами на языках Python и R. -
SQL. Описание SQL92, SQL99 и SQLJ Мартин Грабер
ISBN: 5-85582-109-9, 0-7821-2538-7 Год издания: 2003 Издательство: Лори Язык: Русский Классическая работа по SQL, полностью обновленная, содержащая описание SQL92 и SQL99. Эта книга - отличный источник знаний для всех, кто программирует на SQL. Всеобъемлющая, пользующаяся доверием и не зависящая от конкретных продуктов,
-
Программирование баз данных SQL. Типичные ошибки и их устранение Билл Карвин
ISBN: 978-5-4252-0510-0 Год издания: 2012 Издательство: Рид Групп Язык: Русский В мире существует огромное число книг и интернет-публикаций по языку SQL. Но как отличить хорошие примеры от плохих? "Программирование баз данных SQL" - продукт многолетней практической работы. Каждая тема здесь раскрывается подробно, а внимание к деталям превосходит ожидания. Хотя книга предназначена не для новичков, любой опытный SQL-программист найдет в ней что-нибудь новое. Предложенные здесь решения охватывают множество случаев: от традиционных "Не могу поверить, что это опять сделал я" до хитрых сценариев, где оптимальный вариант противоречит догмам, на которых выросли все профессионалы.
-
Cassandra. Полное руководство Эбен Хьюитт
ISBN: 978-5-97060-453-3 Год издания: 2017 Издательство: ДМК-Пресс Язык: Русский Только вообразите, что бы вы могли сделать, если бы не проблема масштабируемости! Благодаря этому практическому руководству вы узнаете, как система управления базами данных Cassandra справляется с обработкой сотен терабайтов данных, работая в нескольких ЦОДах и сохраняя высокую доступность. Во втором издании, дополненном и охватывающем версию Cassandra 3.0, вы найдете технические детали и практические примеры, которые помогут запустить эту систему в боевых условиях.
Авторы, Джефф Карпентер и Эбен Хьюитт, демонстрируют достоинства нереляционного дизайна Cassandra, уделяя особое внимание моделированию данных. Если вы - разработчик, администратор базы данных или архитектор, стремящийся решить проблему масштабирования или обеспечить будущее развития приложения, то эта книга поможет воспользоваться всеми преимуществами в быстродействии и гибкости, которые дает Cassandra.
Описание распределенной и децентрализованной структуры
Использование языка запросов и его оболочки
Создание модели данных и ее сравнение с эквивалентной реляционной моделью
Разработка приложений с применением клиентских драйверов для различных языков
Изучение топологии кластера и способов передачи данных между узлами
Поддержание высокой производительности кластера
Развертывание Cassandra в локальном ЦОДе, в облаке и с помощью Docker
Интеграция Cassandra с Spark, Hadoop, Elasticsearch, Solr и Lucene -
HTML, JavaScript, PHP и MySQL. Джентльменский набор Web-мастера Николай Прохоренок
ISBN: 978-5-9775-0540-6 Год издания: 2010 Издательство: БХВ-Петербург Язык: Русский Рассмотрены вопросы создания интерактивных Web-сайтов с помощью, HTML, JavaScript, PHP и MySQL. Представлен материал о применении каскадных таблиц стилей (CSS) для форматирования Web-страниц. Даны основные конструкции языка РНР, на примерах показаны приемы написания сценариев, наиболее часто используемых при разработке Web-сайтов. Описаны приемы работы с базами данных MySQL при помощи РНР, а также администрирования баз данных с помощью программы phpMyAdmin. Особое внимание уделено созданию программной среды на компьютере разработчика и настройке Web-сервера Apache. В 3-м издании книги описываются новые версии программ Apache 2.2.14, РНР 5.3.0 и MySQL 5.1.40. Добавлено описание программ Notepad++, Aplana Studio, NetBeans и HeidiSQL, рассмотрены возможности шаблонизатора Smarty, а также переработаны и дополнены все главы книги. На прилагаемом компакт-диске содержатся листинги более чем двухсот примеров, описанных в книге, руководство по созданию динамического сайта, электронная версия самоучителя языка Perl и видеоуроки. Для Web-разработчиков.