Apache Spark徹底入門 [単行本]
    • Apache Spark徹底入門 [単行本]

    • ¥4,400132 ゴールドポイント(3%還元)
    • 在庫あり2025年8月13日水曜日までヨドバシエクストリームサービス便(無料)がお届け
100000009003819807

Apache Spark徹底入門 [単行本]



ゴールドポイントカード・プラスのクレジット決済で「書籍」を購入すると合計12%ゴールドポイント還元!合計12%還元書籍の購入はゴールドポイントカード・プラスのクレジット決済がお得です。
通常3%ゴールドポイント還元のところ、後日付与されるクレジット決済ポイント(1%)と特典ポイント(6%)、さらにご利用明細WEBチェックにご登録いただくと2%追加して合計12%ゴールドポイント還元!詳しくはこちら

価格:¥4,400(税込)
ゴールドポイント:132 ゴールドポイント(3%還元)(¥132相当)
フォーマット:
お届け日:在庫あり今すぐのご注文で、2025年8月13日水曜日までヨドバシエクストリームサービス便(無料)がお届けします。届け先変更]詳しくはこちら
出版社:翔泳社
販売開始日: 2024/04/12
お取り扱い: のお取り扱い商品です。
ご確認事項:返品不可
店舗受け取りが可能です
マルチメディアAkibaマルチメディア梅田マルチメディア博多にて24時間営業時間外でもお受け取りいただけるようになりました

Apache Spark徹底入門 [単行本] の 商品概要

  • 要旨(「BOOK」データベースより)

    統合型アナリティクスエンジンの仕組みとビッグデータの大規模処理を徹底解説。基本操作からDelta LakeやMLlibを利用したパイプラインの構築まで紹介。
  • 目次(「BOOK」データベースより)

    1 Apache Spark入門
    2 Apache Sparkのダウンロードと入門
    3 Apache Sparkの構造化API
    4 Spark SQLとDataFrame:組み込みデータソースの紹介
    5 Spark SQLとDataFrame:外部データソースとのインタラクション
    6 Spark SQLとDataset:7 Sparkアプリケーションの最適化およびチューニング
    8 構造化Streaming
    9 Apache Sparkを用いた信頼性の高いデータレイクの構築
    10 MLlibによる機械学習
    11 Apache Sparkによる機械学習パイプラインの管理、デプロイおよびスケール
    12 エピローグ:Apache Spark 3.x
  • 出版社からのコメント

    本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Sparkの中級⼊⾨書です。
  • 内容紹介

    Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説

    本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、MLflow、Delta Lakeの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびDelta Lakeを使いこなすための解説を行います。

    本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Apache Sparkの導入から解説をはじめ、Spark SQLとデータフレーム、データセットを紹介していきます。そこから、Apache Sparkを利用した実践的な機械学習の方法を解説していきます。本書での学習を通じて、次のことが学習できます。

    ・Python、SQL、Scala、またはJavaの高レベルの構造化APIの学習
    ・Spark の操作とSQLエンジンの理解
    ・Spark 構成とSpark UIを使用したSpark操作の検査、調整、デバッグ
    ・JSON、Parquet、CSV、Avro、ORC、Hive、S3、またはKafkaといったデータソースへの接続
    ・構造化ストリーミングを使用してバッチ データとストリーミング データの分析を実行
    ・オープンソースのDelta LakeとSparkを使用して信頼性の高いデータ パイプラインを構築
    ・MLlibを使用する機械学習パイプラインの開発、MLflowを使用するモデルの管理、本番化
    ・[日本語版オリジナルコンテンツ]pandas DataFrame、SparkDataFrameに関する各種データフレームの使い分け
    ・[日本語版オリジナルコンテンツ]LLMやEnglish SDK for SparkなどAIを活用した新たなコーディングスタイル、LLMの利用方法の実践
    ※本書は『Learning Spark: Lightning-Fast Data Analytics 2nd Edition』の邦訳です。

  • 著者紹介(「BOOK著者紹介情報」より)(本データはこの書籍が刊行された当時に掲載されていたものです)

    Damji,Jules S.(DAMJI,JULES S./Damji,Jules S.)
    Databricks社のSenior Developer Advocateであり、MLflowのコントリビュータ。Sun Microsystems、Netscape、@Home、Loudcloud/Opsware、Verisign、ProQuest、Hortonworksなどの大手企業でソフトウェアエンジニアとして勤務し、大規模分散システムを構築。オレゴン州立大学、カリフォルニア州立大学、ジョンズ・ホプキンス大学でそれぞれコンピュータサイエンスの学士号と修士号、 Political Advocacyとコミュニケーションの修士号を取得

    Wenig,Brooke(WENIG,BROOKE/Wenig,Brooke)
    顧客のために大規模な機械学習パイプラインを開発するデータサイエンティストのチームを率いるほか、分散機械学習のベストプラクティスに関するコースを指導。以前は、Databricksのプリンシパル・データサイエンス・コンサルタント。UCLAで分散機械学習を中心にコンピュータサイエンスの修士号を取得

    Das,Tathagata(DAS,TATHAGATA/Das,Tathagata)
    Databricks社のスタッフソフトウェアエンジニアであり、Apache Sparkのコミッター、Apache Spark Project Management Committee(PMC)のメンバー。Apache Sparkのオリジナル開発者の一人で、Spark Streaming(DStreams)のリード開発者であり、現在はStructured StreamingとDelta Lakeのコア開発者の一人。カリフォルニア大学バークレー校でコンピューターサイエンスの修士号を取得

    Lee,Denny(LEE,DENNY/Lee,Denny)
    DatabricksのStaff Developer Advocateで、Apache Sparkを0.6から使用しています。インターネットスケールのインフラ、データプラットフォーム、オンプレミスおよびクラウド環境の予測分析システムの開発で豊富な経験を持つ、実践的な分散システムおよびデータサイエンスのエンジニアです。また、オレゴン健康科学大学で生物医学情報学の修士号を取得し、企業ヘルスケア顧客向けに強力なデータソリューションを設計・実装した経験を持つ

Apache Spark徹底入門 [単行本] の商品スペック

商品仕様
出版社名:翔泳社
著者名:Jules S Damji(著)/Brooke Wenig(著)/Tathagata Das(著)/Denny Lee(著)/長谷川 亮(訳)/弥生 隆明(訳)/北村 匡彦(訳)/竹下 俊一郎(訳)/小谷 尚太郎(訳)/北岡 早紀(訳)/市村 幸一即(訳)/永里 洋(訳)/野上 将嗣(訳)
発行年月日:2024/04/12
ISBN-10:4798182281
ISBN-13:9784798182285
判型:B5
発売社名:翔泳社
対象:専門
発行形態:単行本
内容:電子通信
言語:日本語
ページ数:464ページ
縦:23cm
他の翔泳社の書籍を探す

    翔泳社 Apache Spark徹底入門 [単行本] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!