改訂新版 Google Cloudではじめる実践データエンジニアリング入門(技術評論社) [電子書籍]
    • 改訂新版 Google Cloudではじめる実践データエンジニアリング入門(技術評論社) [電子書籍]

    • ¥3,960792 ゴールドポイント(20%還元)
    • すぐ読めます
100000086602638446

改訂新版 Google Cloudではじめる実践データエンジニアリング入門(技術評論社) [電子書籍]

饗庭秀一郎(著者)下田倫大(著者)西村哲徳(著者)寳野雄太(著者)山田雄(著者)
価格:¥3,960(税込)
ゴールドポイント:792 ゴールドポイント(20%還元)(¥792相当)
フォーマット:
専用電子書籍リーダアプリ「Doly」が必要です。無料ダウンロード
出版社:技術評論社
公開日: 2025年01月08日
すぐ読めます。
お取り扱い: のお取り扱い商品です。
ご確認事項:電子書籍リーダーアプリ「Doly」専用コンテンツ
こちらの商品は電子書籍版です

改訂新版 Google Cloudではじめる実践データエンジニアリング入門(技術評論社) の 商品概要

  • 2021年2月に刊行した「Google Cloudではじめる実践データエンジニアリング入門」の改訂版です。改訂版の刊行までにデータ基盤に求められる要件は変化し,本書ではその間に進化を続けたGoogle Cloudの各サービスの情報をまとめています。
    ・Google Cloudの新サービスの反映:Dataform,Dataplex,BigLake,Datastream,Vertex AI,Geminiなど
    ・各種Google Cloudの新機能のアーキテクチャへの反映:BigQuery,Dataflow,Pub/Sub,Cloud Coposer,Lookerなど
    また非常に広い概念を含む「データ基盤」に求められる要件を明らかにしつつ,以下のような方々を主な対象として体系だったデータ基盤についての理解を整理できるように構成してあります。
    ・すでにソフトウェアコードはある程度かけるが,実践的にデータエンジニアリングへの入門をしたい方
    ・ SQL を利用した分析を行っているが,データ基盤がどういう形なのか興味がある方
    ・すでにGoogle Cloud をデータ基盤として利用しているが,自社の設計について体系的に理解したい方,より良くする方法を探している方
    データエンジニアリングの業務について一般的な知識を整理しつつ,Google Cloud 上でどのように構築するのかを,実践経験豊富な著者陣の現場のノウハウとともに説明します。
  • 目次

    第1章 データ基盤の概要
    1.1 データ基盤に取り組む意義
    1.2 データ基盤とは
    1.3 Google Cloud上で構築するデータ基盤
    1.4 まとめ

    第2章 データウェアハウスの概念とBigQueryの利用方法
    2.1 DWHとは
    2.2 BigQueryのコンセプト
    2.3 DWHとしてのBigQueryの基本操作
    2.4 BigQueryユーザー向けのクエリの最適化
    2.5 BigQueryの内部アーキテクチャを理解する
    2.6 まとめ
    Column データアナリストを楽にするBigQueryの便利機能
    Column BigQueryとGoogleにおける大規模データ処理の歴史

    第3章 データウェアハウスの構築
    3.1 データウェアハウスに求められるさまざまな要件
    3.2 BigQueryの課金モデル
    3.3 BigQueryエディション
    3.4 高可用性,Disaster Recovery 計画
    3.5 用途別の影響隔離
    3.6 サイジング
    3.7 目的環境別の影響隔離
    3.8 テーブルを設計する
    3.9 テーブル設計以外のクエリ最適化
    3.10 データの投入
    3.11 バックアップとリストア
    3.12 BigQueryにおけるトランザクションとDMLの最適化
    3.13 DMLの最適化
    3.14 外部接続の最適化 - Storage APIの利用とBI Engineの利用
    3.15 データマートジョブの設計最適化
    3.16 BigQueryのモニタリング
    3.17 環境の削除
    3.18 まとめ
    Column データを効率的,安全に共有する

    第4章 レイクハウスの構築
    4.1 レイクハウスの概要
    4.2 Google Cloudでのレイクハウスアーキテクチャ
    4.3 BigLake
    4.4 Dataplex
    4.5 環境の削除
    4.6 まとめ
    Column マルチクラウドでのクラウドデータ基盤の利用

    第5章 ETL/ELT処理 175
    5.1 ETL/ELTとは
    5.2 ETL/ELT処理を実施するサンプルシナリオ
    5.3 サンプルシナリオ実施用の環境の構築
    5.4 BigQueryでのELT
    5.5 BigQueryでのETL
    5.6 Dataformで開発,運用するELTパイプライン
    5.7 DataflowでのETL
    5.8 サンプルシナリオ実施用の環境の破棄
    5.9 その他のETL/ELT処理の実施方法
    5.10 ETLとELTの各手法の使い分け
    5.11 まとめ
    Column Apache BeamとDataflowの関係は?
    Column データの前処理を行うための機能

    第6章 ワークフロー管理とデータ統合 222
    6.1 Google Cloudのワークフロー管理とデータ統合のためのサービス
    6.2 Cloud Composerの特徴
    6.3 Cloud Composerでのワークフロー管理
    6.4 Cloud Data Fusionの特徴
    6.5 Cloud Data Fusionでのワークフロー管理
    6.6 Cloud Composer,Cloud Data Fusion,Dataformの比較と使い分けのポイント
    6.7 まとめ
    Column Google Cloudにおけるジョブオーケストレーションの選択肢

    第7章 データ分析基盤におけるセキュリティとコスト管理の設計
    7.1 Google Cloudのセキュリティサービス
    7.2 Google Cloudのリソース構成とエンタープライズ向けの管理機能
    7.3 IAMを利用したBigQueryのアクセス制御
    7.4 IAMとAccess Control List(ACL)を利用したCloud Storageのアクセス制御
    7.5 VPC Service Controls を利用したアクセス制御とデータ持ち出し防止
    7.6 監査
    7.7 Security Command Centerを利用したデータリスクの検知と自動修復
    7.8 組織のポリシーサービスの適用
    7.9 アクセス管理とコスト管理の設計
    7.10 まとめ
    Column データ暗号化とデータ損失防止

    第8章 BigQueryへのデータ集約
    8.1 BigQueryへデータ集約を行うメリット
    8.2 BigQueryへのデータ集約の方法
    8.3 BigQuery Data Transfer Service(BigQuery DTS)
    8.4 CDCを利用したデータレプリケーション(Datastream for BigQuery)
    8.5 BigQueryへのデータパイプライン構築
    8.6 サービス間連携によるBigQueryへのデータ連携
    8.7 まとめ
    Column Firebaseを用いたデータ分析の活用方法

    第9章 ビジネスインテリジェンス
    9.1 BIとBIツール
    9.2 コネクテッドシート
    9.3 Looker Studio/Looker Studio Pro
    9.4 Looker
    9.5 BIツールと親和性の高いBigQueryの機能
    9.6 Gemini in Looker
    9.7 まとめ
    Column リモート関数による拡張

    第10章 リアルタイム分析
    10.1 リアルタイム分析とユースケース
    10.2 リアルタイム分析基盤に求められるもの
    10.3 Google Cloudを利用したリアルタイム分析基盤のアーキテクチャ
    10.4 Pub/Sub
    10.5 Dataflow
    10.6 BigQueryのリアルタイム分析機能
    10.7 リアルタイムタクシーデータを用いたリアルタイム分析基盤の構築
    10.8 まとめ
    Column Dataflowのアーキテクチャと分散処理におけるコンピュート,ストレージ,メモリの分離

    第11章 発展的な分析 - 地理情報分析と機械学習,非構造データ分析
    11.1 Google Cloudによる発展的な分析
    11.2 BigQueryによる地理情報分析
    11.3 Google Cloud上での機械学習
    11.4 まとめ
    Column Pub/Subのアーキテクチャ

改訂新版 Google Cloudではじめる実践データエンジニアリング入門(技術評論社) の商品スペック

Cコード 3055
出版社名 技術評論社
紙の本のISBN-13 9784297146610
他の技術評論社の電子書籍を探す
ファイルサイズ 467.4MB
著者名 饗庭秀一郎
下田倫大
西村哲徳
寳野雄太
山田雄
著述名 著者

    技術評論社 改訂新版 Google Cloudではじめる実践データエンジニアリング入門(技術評論社) [電子書籍] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!