Apache Iceberg活用入門 オープンテーブルフォーマットによるデータレイク&データレイクハウス(インプレス) [電子書籍]
    • Apache Iceberg活用入門 オープンテーブルフォーマットによるデータレイク&データレイクハウス(インプレス) ...

    • ¥3,8501,155 ゴールドポイント(30%還元)
    • すぐ読めます
100000086603023819

Apache Iceberg活用入門 オープンテーブルフォーマットによるデータレイク&データレイクハウス(インプレス) [電子書籍]

Tomer Shiran(著者)Jason Hughes(著者)Alex Merced(著者)蛯原 裕弥(著者)佐野 千紘(著者)
価格:¥3,850(税込)
ゴールドポイント:1,155 ゴールドポイント(30%還元)(¥1,155相当)
フォーマット:
専用電子書籍リーダアプリ「Doly」が必要です。無料ダウンロード
出版社:インプレス
公開日: 2025年11月18日
すぐ読めます。
お取り扱い: のお取り扱い商品です。
ご確認事項:電子書籍リーダーアプリ「Doly」専用コンテンツ
こちらの商品は電子書籍版です

Apache Iceberg活用入門 オープンテーブルフォーマットによるデータレイク&データレイクハウス(インプレス) の 商品概要

  • 大規模クラウドのデータ課題を解決するオープンテーブルフォーマットの決定版
     現代のビッグデータ基盤は、前処理の複雑さやツールへの依存といった多くの課題を抱えています。こうした問題を解決するために登場したのが、オープンソースのテーブルフォーマットApache Icebergです。本書は、Icebergの基礎から実践的な応用までを網羅したガイドブックです。Icebergの仕組みや使い方を学ぶことで、インタラクティブな分析、バッチ処理、機械学習、ストリーミング処理を効率的に実現できます。

    ●本書の特徴
    ○データ活用の障壁をなくす:データの抽出・変換・書き出しといった複雑な前処理をシンプルにし、データ統合を容易にします。これにより、効率的な分析が可能になります。
    ○Icebergのすべてを体系的に習得:なぜIcebergが生まれたのかという背景から、独自のアーキテクチャ、テーブル操作の裏側で行われる処理まで、その仕組みを深く理解できます。
    ○主要ツールでの実践ノウハウ:Apache Spark、Dremio、AWS Glue、Apache Flinkなど、人気のデータ処理エンジンでの具体的な使い方をハンズオン形式で学べます。
    ○本番運用で役立つ知識:メタデータテーブルによる監視、Gitライクなブランチ機能によるデータ変更の分離、リスクを抑えた移行戦略など、本番環境での運用ノウハウを習得できます。

    ●本書の構成
    第1章 Apache Iceberg へようこそ
    第2章 Apache Iceberg のアーキテクチャ
    第3章 読み書きを行なうクエリのライフサイクル
    第4章 Icebergテーブルの最適化
    第5章 Icebergカタログ
    第6章 Apache Spark
    第7章 Dremio SQLクエリエンジン
    第8章 AWS Glue
    第9章 Apache Flink
    第10章 Apache Icebergの本番利用
    第11章 Apache Icebergとストリーミング処理
    第12章 ガバナンスおよびセキュリティ
    第13章 Apache Icebergへの移行
    第14章 Apache Iceberg のユースケース

    ●こんな方におすすめ
    ○データエンジニア、データアーキテクト
    ○データレイクハウスの構築・運用に関わる方
    ○ビッグデータ基盤のパフォーマンスやコストに課題を感じている方

     本書を通して、Icebergを自在に操り、複雑なデータ課題をシンプルに解決できるプロフェッショナルを目指してください。

    ※本書はO'Reilly Media『Apache Iceberg The Definitive Guide』の邦訳です。

  • 目次

    表紙
    本書情報および正誤表のWebページ
    日本語版の刊行にあたって── 翻訳・監修者による前書き
    推薦のことば
    目次
    序文
    フィードバックと質問
    表記上のルール
    コード例や追加資料/謝辞
    翻訳・監修者謝辞
    第1部 Apache Icebergの基礎
    第1章 Apache Icebergへようこそ
    1-1  どのようにここまでたどり着いたのか? 簡単な歴史の振り返り
    1-2 データウェアハウス
    1-3 データレイク
    1-4 データレイクとデータウェアハウスのどちらで分析するとよいか?
    1-5 データレイクハウス
    1-6 テーブルフォーマットとは何か?
    1-7 Hive:最初のテーブルフォーマット
    1-8 モダンなデータレイクのテーブルフォーマット
    1-9 Apache Icebergとは何か?
    1-10 まとめ
    第2章 Apache Icebergのアーキテクチャ
    2-1 データレイヤー
    2-2 メタデータレイヤー
    2-3 カタログ
    2-4 まとめ
    第3章 読み書きを行なうクエリのライフサイクル
    3-1 Apache Icebergにおける書き込みクエリ
    3-2 Apache Icebergにおける読み取りクエリ
    3-3 まとめ
    第4章 Icebergテーブルの最適化/4-1 コンパクション
    4-2 コンパクションの演習
    4-3 ソート
    4-4 Z オーダー
    4-5 パーティショニング
    4-6 コピーオンライトvsマージオンリード
    4-7 その他の考慮点
    4-8 まとめ
    第5章 Icebergカタログ/5-1 Icebergカタログの要件
    5-2 カタログの比較
    5-3 カタログの移行
    5-4 まとめ
    第2部 Apache Icebergハンズオン
    第6章 Apache Spark
    6-1 設定
    6-2 DDLの操作
    6-3 データの読み込み
    6-4 データの書き込み
    6-5 Icebergテーブルを管理するためのプロシージャ
    6-6 まとめ
    第7章 Dremio SQLクエリエンジン/7-1 設定
    7-2 DDLの操作
    7-3 データの読み込み
    7-4 データの書き込み
    7-5 Icebergテーブルを管理するためのプロシージャ
    7-6 まとめ
    監修・補足 Trino SQLクエリエンジン/A-1 設定
    A-2 DDLの操作
    A-3 データの読み込み
    A-4 データの書き込み
    A-5 Icebergテーブルを管理するためのプロシージャ
    監修・補足 Apache Hive SQLクエリエンジン/B-1 設定
    B-2 DDL の操作
    B-3 DML の操作
    B-4 データの読み込み
    B-5 Icebergテーブルを管理するためのプロシージャ
    第8章 AWS Glue
    8-1 設定
    8-2 Glueカタログを用いたテーブル作成
    8-3 まとめ
    第9章 Apache Flink
    9-1 設定
    9-2 DDL の操作
    9-3 データの読み込み
    9-4 データの書き込み
    9-5  FlinkのDataStreamおよびTable API を使用したApache Icebergテーブル操作
    9-6 まとめ
    第3部 Apache Iceberg実践
    第10章 Apache Icebergの本番利用
    10-1 Apache Icebergのメタデータテーブル
    10-2 ブランチを利用した変更の分離
    10-3 マルチテーブルトランザクション
    10-4 変更のロールバック
    10-5 まとめ
    第11章 Apache Icebergとストリーミング処理
    11-1 Apache Sparkを利用したストリーミング
    11-2 Apache Flinkを利用したストリーミング
    11-3 Kafka Connectを利用したストリーミング
    11-4 AWS を利用したストリーミング
    11-5 まとめ
    第12章 ガバナンスおよびセキュリティ
    12-1 データファイルの安全化
    12-2 セマンティックレイヤーにおける安全化と制御
    12-3 カタログレベルでのセキュリティとガバナンス
    12-4 安全性と制御に関する追加の考慮事項
    12-5 まとめ
    第13章 Apache Icebergへの移行
    13-1 移行の際の考慮事項
    13-2 HiveテーブルからIcebergテーブルへの移行
    13-3 Delta LakeからApache Icebergへの移行
    13-4 Apache HudiからApache Icebergへの移行
    13-5 ファイル単位でのApache Icebergへの移行
    13-6 データの再書き込みによる移行
    13-7 まとめ
    第14章 Apache Icebergのユースケース
    14-1  Apache IcebergにおけるWrite-Audit-Publish(WAP)を用いたデータ品質の確保
    14-2 データレイク上でのBIワークロードの実行
    14-3 Apache Icebergを用いたCDCの実行
    14-4 まとめ
    監修・補足 PyIcebergの利用方法
    監修・補足 Iceberg Rust
    監修・補足 LINE ヤフーの活用事例
    著者/翻訳・監修プロフィール
    索引
    奥付

Apache Iceberg活用入門 オープンテーブルフォーマットによるデータレイク&データレイクハウス(インプレス) の商品スペック

発行年月日 2025/11/12
書店分類コード K350
Cコード 3055
出版社名 インプレス
他のインプレスの電子書籍を探す
紙の本のISBN-13 9784295023159
ファイルサイズ 382.7MB
著者名 Tomer Shiran
Jason Hughes
Alex Merced
蛯原 裕弥
佐野 千紘
著述名 著者

    インプレス Apache Iceberg活用入門 オープンテーブルフォーマットによるデータレイク&データレイクハウス(インプレス) [電子書籍] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!